既存の方法との比較

既存のライブラリの文字コード判別成功率はどのくらいかというのを調べると、2004年と古いがこんなのがあった。
http://pub.cozmixng.org/~the-rwiki/?cmd=view;name=%A4%BF%A4%E0%A4%E9%3A%3A%C6%FC%CB%DC%B8%EC%CA%B8%BB%FA%A5%B3%A1%BC%A5%C9%A4%CE%BC%AB%C6%B0%C8%BD%C4%EA

これは短い単語で判別しているようなので単純には比較できないが、これらの方法はおそらく長い文字列でも成功率は上がらないと思われるので、テキストが長ければpsi氏の方法が有利になるだろう(追記: そもそもこれらは皆そんなに成功率が高くない。リンク先に挙げられている中で、Guess.guessというのは統計的手法を使っているそうで、成績も>96%と割と高い)。