Subject: Стандарты на транслитерацию ГОСТ 16876-71 и ГОСТ 7.79-2000
From: Sergei Romanenko (roman@integrum.ru)
Date: Wed Jun 02 2004 - 16:26:32 MSD
Уважаемые коллеги!
Как сказал еще Святослав Сергеевич Лавров в своей "Клятве":
"Клянусь не нарушать ни одну из пяти кодировок русских букв _предписанных_
ГОСТами!"
Слава Богу, до недавнего времени у нас существовал только один стандарт на
транслитерацию русских слов латинскими буквами: ГОСТ 16876-71.
http://global-net.ru/~bm/docs/translit.html
а - a к - k х - kh
б - b л - l ц - c
в - v м - m ч - ch
г - g н - n ш - sh
д - d о - o щ - shh
е - e п - p ъ - "
ё - jo р - r ы - y
ж - zh с - s ь - '
з - z т - t э - eh
и - i у - u ю - ju
й - jj ф - f я - ja
Одно из главных требований к транслитерации - обратимость. Например, если
"ц" закодировать как "ts", то обратимость будет нарушена, поскольку
"советский" превращается в "sovetskij", и обратно восстанавливается как
"совецкий". (Этим, кстати, "транслитерация" принципиально отличается от
"транскрипции".)
Требованию обратимости ГОСТ 16876-71 отвечает. С точки зрения программистов
его главный недостаток - использование небуквенных знаков (апостроф, двойная
кавычка). Это создает проблемы при использовании транслитерации в именах
файлов и в идентификаторах в текстах программ. Ну, еще "jj" для "й" - это
слишком длинно, поэтому практически все писали просто "j", что нарушало
обратимость в словах типа "йод" ("йод" -> "jod" -> "ёд").
Однако, стандартописатели на ГОСТ 16876-71 не успокоились, и
придумали еще один стандарт! Называется ГОСТ 7.79-2000.
http://gsnti-norms.ru/norms/common/doc.asp?2&/norms/stands/7_79.htm
а - a к - k х - kh
б - b л - l ц - cz,c
в - v м - m ч - ch
г - g н - n ш - sh
д - d о - o щ - shh
е - e п - p ъ - ``
ё - yo р - r ы - y'
ж - zh с - s ь - `
з - z т - t э - e`
и - i у - u ю - yu
й - j ф - f я - ya
Т.е. "j" перестали использовать для йотирования гласных, поэтому появилась
возможность "й" всегда кодирвоать как "j".
А прямой апостроф заменили на обратный (что хорошо с точки зрения
djvu-документов, поскольку прямой апостроф создает проблемы при их открытии,
а обратный - не создает). Непонятно, правда, почему "ы" решили закодировать
как "y'", а не как "y`"?
В общем, ГОСТ 7.79-2000 - вполне удовлетворительный. Единственная претензия
к нему в том, что это фактически новый стандарт, а не реформа предыдущего
стандарта. Т.е. имели один стандарт на транслитерацию, а теперь имеем два...
Например, одни операторы сотовой связи склоняются к новому стандарту, а
другие - к старому (см. странички "Билайн" и "МТС"):
http://www.mts-life.ru/services/index.jsp?pageId=38a9c2-f59b741acd--8000
В общем, исходя из того, что хоть какой-то стандарт все же лучше, чем
никакой, и принимая во внимание, что ныне действующим стандартом является
ГОСТ 7.79-2000, представляется разумным впредь использовать в именах
документов по Рефалу, выставленных в p2p, ГОСТ 7.79-2000 (с точностью до
замены "y'" на "y`").
С точки зрения поиска по ключевым словам в eDonkey прямой и обратный
апострофы эквивалентны (оба эквивалентны пробелу).
Сейчас составлю список ed2k-ссылок документов по Рефалу, в котором имена
файлов приведены к ГОСТ 7.79-2000 и вышлю в следующем послании...
Сергей Романенко
This archive was generated by hypermail 2b25 : Mon Oct 25 2004 - 21:25:00 MSD