Откомпилируйте програмку на C

  • Автор темы Автор темы JAW
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
Это то, откуда взялись исходные патерны hunspell :)
Вообще говоря всё это исходно из системы TeX словари исходные роются на:
ftp://ftp.ctan.org/tex-archive/language/hyphenation/
и в
ftp://ftp.ctan.org/tex-archive/language/
в папках по языкам и корне.

Кстати да... Санскрит там тоже какой-то есть :)
 
Однако можно сделать вывод в результате, что результат корректный, но вероятно патерны от OpenOffice ещё малость подправили, что вполне вероятно.
Андрей, нет. Я же работаю с одним и тем же набором. Здесь в чистом виде результат преобразования. Но я пока не могу понять причину. Какая особенность набора OpenOffice приводит к такому результату?
Надо будет посмотреть на остальных канонических наборах. Возможно, удастся разобраться с этим вопросом.
 
И там есть файлик:
ftp://ftp.ctan.org/tex-archive/language/hyphenation-utf8.zip
Это переносы уже в UTF8, чтобы не мучатся с перекодировкой. Там в недрах макро TeX'е, можно игнорировать и наборы патернов по языкам в разных видах.
 
Надо будет посмотреть на остальных канонических наборах.

Сегодня проверил работу substrings.pl и substrings.exe на наборе ruhyphct.tex.

Результат хуже, чем в при использовании набора ruhyphoo.tex.

В случае набора ruhyphoo.tex зафиксировано 2054 расхождения в расстановке переносов оригинальным набором tex и этим же набором, преобразованным в стандарт hunspell.
В случае набора ruhyphct.tex таких расхождений уже 3091.
При этом характер расхождений иной. Если при преобразовании набора ruhyphoo.tex наблюдается лишь непостановка переносов в определенных позициях, то в случае набора ruhyphct.tex встречаются не только пропуски, но и искажения переносов исходного набора.

Вот характерный случай:

TeX:
умыш-лен-ный
не-умыш-лен-ный

Hunspell:
умы-шлен-ный :(
не-умыш-лен-ный

Резюмирую: утилиты преобразования наборов TeX в формат Hunspell работают некорректно. Но это полбеды. Плохо то, что информация об этом исходит не от разработчиков... Была бы надежда, что над исправлением ошибок работают... Интересно, до нас эти утилиты кто-нибудь тестировал?
 
Не знаю, практикуется на форуме такое или нет, но, мне кажется имеет смысл тему переименовать, например в "Переносы по алгоритму Hunspell" (по аналогии с http://forum.rudtp.ru/threads/perenosy-po-algoritmu-tex.30854/) и переместить в более подобающее место.
 
Статус
Закрыто для дальнейших ответов.