пятница, 28 мая 2010 г.

Когда бэк-слэш - это не бэк-слэш?

Это перевод When is a backslash not a backslash? Автор: Майкл Каплан.

Символ сегодняшнего поста - это U+005c, REVERSE SOLIDUS, также известный как обратный слэш, бэк-слэш или просто '\'. Он служит в качестве разделителя пути в Windows, и кодируется в #$5C во всех кодовых страницах.

Поскольку файловые разделители очень важны, то заголовок этого поста может быть довольно пугающ - как он может быть не бэк-слэшем?

Ну, на японской кодовой странице 932, #$5C - это YEN SIGN, а на корейской 949, #$5C - это WON SIGN.

Что, впрочем, не означает, что #$5C не действует при этом как разделитель пути - он всё ещё работает, даже хотя выглядит не как '\'. И что не означает, что кодовые точки Unicode для Yen и Won (U+00a5 и U+20a9) действуют как разделитель пути - потому что ничего такого нет.

Конечно же, естественный круговой маппинг между U+005c и #$5C есть на всех кодовых страницах, и оба U+00a5 и U+20a9 имеют одностороннее 'наилучшее' проецирование на #$5C на соответствующих кодовых страницах. Это требование, технически, ушло с введением Unicode, когда символы стали кодироваться раздельно.

Однако, вопрос не столько в том, что в старых кодовых страницах было мало места, а в unicode его много, а в том, что клиенты мгновенно откажутся от разделителей, отличных от бэк-слэша.

На практике, после многих лет использования систем с кодовыми страницами в Японии и Корее, все они использовали соответствующие символы валют в качестве файловых разделителей. Считается, что клиенты к этому привыкли. И поэтому в смене вида символов на что-то иное нет большого смысла (когда настройки системы стоят в Японский или Корейский).

Чтобы поддержать это ожидание, японские и корейские шрифты отображают денежный символ вместо разделителя пути для U+005c, когда умалчиваемая локаль системы стоит в Японский или Корейский.

Но то ли это, что хотят клиенты - остаётся открытым вопросом. Andrew Tuck из PSS Microsoft заметил:
Когда один из моих клиентов из Кореи посетил наши места, я спросил его, не мешает ли им, что бэк-слэш не смотрится как бэк-слэш. Оказывается, это бесит его, и он считает, что с ним так или иначе согласны большинство его соотечественников. Однако, он был настроен весьма фаталистично: "но что мы можем сделать, чтобы изменить это? Так было всегда. Мы привыкли."
Не самая блестящая рекомендация, не так ли?

Как заметил Norman Diamond в своём комментарииэтом посте), в Японии есть много людей, которых этот вопрос вообще не заботит.

Конечно же, тут нет "правильного" ответа, и я могу представить, что вы найдёте много людей, которых расстроит такое изменение, равно как те, что недовольны текущим положением дел. Что, возможно, объясняет, почему статус кво такой, как сейчас - эти люди, кто хотел бы изменения, считают, что это никогда не произойдёт. И поэтому они просто привыкли...

This post brought to you by "\", "¥", и "" (U+005c, U+00a5 и U+20a9, a.k.a. REVERSE SOLIDUS, YEN SIGN и WON SIGN)

Комментариев нет:

Отправить комментарий

Можно использовать некоторые HTML-теги, например:

<b>Жирный</b>
<i>Курсив</i>
<a href="http://www.example.com/">Ссылка</a>

Вам необязательно регистрироваться для комментирования - для этого просто выберите из списка "Анонимный" (для анонимного комментария) или "Имя/URL" (для указания вашего имени и ссылки на сайт). Все прочие варианты потребуют от вас входа в вашу учётку (поддерживается OpenID).

Пожалуйста, по возможности используйте "Имя/URL" вместо "Анонимный". URL можно просто не указывать.

Ваше сообщение может быть помечено как спам спам-фильтром - не волнуйтесь, оно появится после проверки администратором.