вторник, 13 июля 2010 г.

Что означает "лингвистическое изменение регистра"?

Это перевод What does "linguistic casing" mean? Автор: Майкл Каплан.

Функция LCMapString - центральная функция в Win32 API для изменения регистра символов в строке. Все прочие функции в USER32 (типа CharUpper, CharLower, CharUpperBuff и CharLowerBuff) являются просто оболочками, которые вызывают LCMapString с флагами LCMAP_UPPERCASE или LCMAP_LOWERCASE. Все они делают простой маппинг вроде a -> A -> a, å -> Å -> å и так далее.

В большинстве случаев такие маппинги двусторонни - что есть хорошо. Все эти операции имеют лингвистический смысл.

Тогда что означает флаг LCMAP_LINGUISTIC_CASING? Что происходит, когда вы его указываете?

Ну, происходят две вещи:
  1. Вы получаете корректное поведение для "турецких" локалей типа турецкого или азери;
  2. Вы получаете кучу односторонних маппингов на всех локалях. К примеру, верхним регистром U+03f1 (Greek Rho Symbol) будет U+03a1 (Capital Greek Rho), а её нижним регистром будет U+03c1 (Small Greek Rho).
Ну, ни один из этих пунктов не кажется мне особо "лингвистическим". Но они соответствуют определениям простых регистровых маппингов в стандарте Unicode. Поскольку обе вещи описаны в Unicode, возможно нам стоило называть этот флаг как LCMAP_UNICODE_SIMPLE_CASING?

Это единственный простой регистровый маппинг Unicode, который мы реализовали. Ни один продукт Microsoft в настоящий момент не поддерживает полностью все маппинги Unicode (которые, вообще-то, могут менять длину строки).

Но мы присматриваем за этой возможностью, потому что нас уже просили несколько раз об этом. Возможно, она была бы выше в нашем списке TODO, если бы о ней просило больше людей...

Комментариев нет:

Отправить комментарий

Можно использовать некоторые HTML-теги, например:

<b>Жирный</b>
<i>Курсив</i>
<a href="http://www.example.com/">Ссылка</a>

Вам необязательно регистрироваться для комментирования - для этого просто выберите из списка "Анонимный" (для анонимного комментария) или "Имя/URL" (для указания вашего имени и ссылки на сайт). Все прочие варианты потребуют от вас входа в вашу учётку.

Пожалуйста, по возможности используйте "Имя/URL" вместо "Анонимный". URL можно просто не указывать.

Ваше сообщение может быть помечено как спам спам-фильтром - не волнуйтесь, оно появится после проверки администратором.

Примечание. Отправлять комментарии могут только участники этого блога.