Стандарты на транслитерацию ГОСТ 16876-71 и ГОСТ 7.79-2000


Subject: Стандарты на транслитерацию ГОСТ 16876-71 и ГОСТ 7.79-2000
From: Sergei Romanenko (roman@integrum.ru)
Date: Wed Jun 02 2004 - 16:26:32 MSD


Уважаемые коллеги!

Как сказал еще Святослав Сергеевич Лавров в своей "Клятве":
"Клянусь не нарушать ни одну из пяти кодировок русских букв _предписанных_
ГОСТами!"

Слава Богу, до недавнего времени у нас существовал только один стандарт на
транслитерацию русских слов латинскими буквами: ГОСТ 16876-71.

http://global-net.ru/~bm/docs/translit.html

  а - a к - k х - kh
  б - b л - l ц - c
  в - v м - m ч - ch
  г - g н - n ш - sh
  д - d о - o щ - shh
  е - e п - p ъ - "
  ё - jo р - r ы - y
 ж - zh с - s ь - '
  з - z т - t э - eh
  и - i у - u ю - ju
  й - jj ф - f я - ja

Одно из главных требований к транслитерации - обратимость. Например, если
"ц" закодировать как "ts", то обратимость будет нарушена, поскольку
"советский" превращается в "sovetskij", и обратно восстанавливается как
"совецкий". (Этим, кстати, "транслитерация" принципиально отличается от
"транскрипции".)

Требованию обратимости ГОСТ 16876-71 отвечает. С точки зрения программистов
его главный недостаток - использование небуквенных знаков (апостроф, двойная
кавычка). Это создает проблемы при использовании транслитерации в именах
файлов и в идентификаторах в текстах программ. Ну, еще "jj" для "й" - это
слишком длинно, поэтому практически все писали просто "j", что нарушало
обратимость в словах типа "йод" ("йод" -> "jod" -> "ёд").

Однако, стандартописатели на ГОСТ 16876-71 не успокоились, и
придумали еще один стандарт! Называется ГОСТ 7.79-2000.

http://gsnti-norms.ru/norms/common/doc.asp?2&/norms/stands/7_79.htm

  а - a к - k х - kh
  б - b л - l ц - cz,c
  в - v м - m ч - ch
  г - g н - n ш - sh
  д - d о - o щ - shh
  е - e п - p ъ - ``
  ё - yo р - r ы - y'
  ж - zh с - s ь - `
  з - z т - t э - e`
  и - i у - u ю - yu
  й - j ф - f я - ya

Т.е. "j" перестали использовать для йотирования гласных, поэтому появилась
возможность "й" всегда кодирвоать как "j".

А прямой апостроф заменили на обратный (что хорошо с точки зрения
djvu-документов, поскольку прямой апостроф создает проблемы при их открытии,
а обратный - не создает). Непонятно, правда, почему "ы" решили закодировать
как "y'", а не как "y`"?

В общем, ГОСТ 7.79-2000 - вполне удовлетворительный. Единственная претензия
к нему в том, что это фактически новый стандарт, а не реформа предыдущего
стандарта. Т.е. имели один стандарт на транслитерацию, а теперь имеем два...

Например, одни операторы сотовой связи склоняются к новому стандарту, а
другие - к старому (см. странички "Билайн" и "МТС"):

http://www.beeonline.ru/portal/help/faqs/list?page_id=2&group_id=281&group_name=Как%20отправить%20SMS?

http://www.mts-life.ru/services/index.jsp?pageId=38a9c2-f59b741acd--8000

В общем, исходя из того, что хоть какой-то стандарт все же лучше, чем
никакой, и принимая во внимание, что ныне действующим стандартом является
ГОСТ 7.79-2000, представляется разумным впредь использовать в именах
документов по Рефалу, выставленных в p2p, ГОСТ 7.79-2000 (с точностью до
замены "y'" на "y`").

С точки зрения поиска по ключевым словам в eDonkey прямой и обратный
апострофы эквивалентны (оба эквивалентны пробелу).

Сейчас составлю список ed2k-ссылок документов по Рефалу, в котором имена
файлов приведены к ГОСТ 7.79-2000 и вышлю в следующем послании...

Сергей Романенко



This archive was generated by hypermail 2b25 : Mon Oct 25 2004 - 21:25:00 MSD