пятница, 10 декабря 2010 г.

За "Как сломать Блокнот"

Это перевод Behind 'How to break Windows Notepad'. Автор: Майкл Каплан.

Ларри Остерман указал мне на статью, названную "Как сломать Блокнот Windows", которая проводит такой эксперимент:
Вот как это сделать:
  1. Откройте Блокнот (не Wordpad, не Word и не любой другой текстовый редактор)
  2. Впечатайте в точности это предложение (без кавычек): "this app can break" (перевод: "это приложение может сломаться").
  3. Сохраните файл.
  4. Закройте Блокнот.
  5. Откройте сохранённый файл двойным щелчком.
Вместо вашего предложения вы увидите набор квадратиков. По какой-то причине Блокнот не может понять что делать с этой последовательностью символов и ломается.

Но если у вас установлена поддержка языков с письмом иероглифами, то вместо серии квадратов (глифов NULL), вы увидите:
桴獩愠灰挠湡戠敲歡
И если вы посмотрите на кодовые точки, стоящие за этими символами, то вы увидите, что произошло:
6874 7369 6120 7070 6320 6E61 6220 6572 6B61
Ага, каждый байт исходного предложения являлся буквой. Но когда они сгруппированы вместе, то дают строку CJK иероглифов!

Я недавно говорил о механизмах определения кодировки, которые использует Блокнот, а этот пример становится лишь очередной иллюстрацией проблемы, который просто более забавен из-за своих шагов (в самом деле, единственным его улучшением было бы подбор текста так, чтобы он оскорблял Microsoft или название его конкурентов, которое Блокнот бы "зацензурил", показывая пример злодейской монополии!).

Ранее я уже указывал, почему мне не нравится функция IsTextUnicode (IsTextUnicode возвращает True - вот почему Блокнот неправильно показывает текст).

This post brought to you by (U+6874, a CJK ideograph)

Комментариев нет:

Отправить комментарий

Можно использовать некоторые HTML-теги, например:

<b>Жирный</b>
<i>Курсив</i>
<a href="http://www.example.com/">Ссылка</a>

Вам необязательно регистрироваться для комментирования - для этого просто выберите из списка "Анонимный" (для анонимного комментария) или "Имя/URL" (для указания вашего имени и ссылки на сайт). Все прочие варианты потребуют от вас входа в вашу учётку.

Пожалуйста, по возможности используйте "Имя/URL" вместо "Анонимный". URL можно просто не указывать.

Ваше сообщение может быть помечено как спам спам-фильтром - не волнуйтесь, оно появится после проверки администратором.

Примечание. Отправлять комментарии могут только участники этого блога.