A slightly silly new utility: 'confuse'. You provide it with some
authorsimon <simon@cda61777-01e9-0310-a592-d414129be87e>
Wed, 18 Jul 2012 22:52:00 +0000 (22:52 +0000)
committersimon <simon@cda61777-01e9-0310-a592-d414129be87e>
Wed, 18 Jul 2012 22:52:00 +0000 (22:52 +0000)
Unicode values (typically two of them), and it finds cases in which
the provided characters are all encoded as the same thing in different
charsets and prints those charsets. So if you encounter, for example,
some piece of text which has U+0153 LATIN SMALL LIGATURE OE where you
might have expected U+00A3 POUND SIGN, simply run 'confuse 153 a3' and
it'll tell you which character sets the sender and receiver of the
text might have got confused between.

git-svn-id: svn://svn.tartarus.org/sgt/charset@9581 cda61777-01e9-0310-a592-d414129be87e


No differences found