The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Словари русского языка для ispell


<< Предыдущая ИНДЕКС Поиск в статьях src Установить закладку Перейти на закладку Следующая >>
From: (Alexander I. Lebedev) <ail-f@scon155.phys.msu.su>
Newsgroups: fido7.ru.unix
Subject: Словари русского языка для ispell


Привет!

Хочу представить вашему вниманию словари русского языка для ispell, которые
могут быть полезны всякому человеку, желающему грамотно писать по-русски.

- Александр

------------------------

		Словарь русского языка для ispell

			Версия - 0.99e5
	Автор: Александр Лебедев (swan@mch.chem.msu.su)

Предлагаемый орфографический словарь русского языка представляет интерес
прежде всего для пользователей UNIX, в котором набор средств для проверки
правописания весьма ограничен.  Однако словарь может быть полезен и для
пользователей, работающих в других операционных системах, в частности DOS,
OS/2 и Windows (в DOS-окне), поскольку словарь поддерживает пять различных
кодировок русских букв (см. ниже).  Встроенные в ispell функции позволяют
считать его весьма удобным средством для работы с текстами, подготовленными
в редакторе TeX, а также с файлами в формате HTML.  Кроме этого, словарь
может использоваться в локальных и глобальных поисковых системах, строящихся
на основе программ, подобных HTDig.

Исторически предлагаемый словарь возник из небольшого словаря русского
языка для ispell, составленного Нилом Далтоном (Neal Dalton) в 1992 г.
После тщательной проверки и исправления примерно 4000 ошибок в словаре
Нила Далтона (в этой части работы использовался орфографический словарь
русского языка, выпущенный Институтом русского языка АН СССР), в словарь
были добавлены отсутствовавшие в нем правила образования форм
существительных, прилагательных, причастий, наречий, изменены правила
формирования окончаний глаголов, так что affix-файл можно считать
переписанным заново.  Одновременно в словарь было добавлено большое число
слов.  Все слова в настоящем словаре проверены с помощью электронного
орфографического словаря "Корректор" (120 тысяч слов), а обнаруженные
расхождения выверены по орфографическому словарю, справочнику Зализняка
("Грамматический словарь русского языка: словоизменение", 100 тысяч слов)
и "Сводному словарю современной русской лексики" (170 тысяч слов).  Все
новые слова, добавляемые в словарь, проходят проверку с помощью
орфографических словарей (в специальных областях -- энциклопедий).
Слова, не найденные в этих изданиях, добавляются если они действительно
широко используются и лишь при условии, что в их написании нет никаких
сомнений.  В настоящей версии объем словаря составляет более 103.8 тысяч
базовых слов, а полное число образуемых словоформ увеличилось до 988.5 тысяч
(против 52 тысяч в словаре Нила Далтона).

Отличительной чертой данного словаря от всех известных автору других
орфографических словарей является то, что начиная с версии 0.99c0 в него
включена полноценная поддержка буквы ё (другие словари просто заменяют
букву ё на букву е).  Это может быть очень полезно для лиц, занимающихся
подготовкой литературы для детей младшего возраста, изданий для
иностранцев, орфографических справочников -- там, где правила требуют
использования буквы ё.

Словарь base.koi, а также четыре дополнительных словаря (computer.koi,
geography.koi, rare.koi, science.koi) и файл russian.aff.koi поставляются
в кодировке koi8-r.  Для преобразования текстов в другие поддерживаемые
кодировки -- cp866 (alt), iso-8859-5, cp1251 (win) и maccyrillic --
в комплект включен скрипт-перекодировщик trans, написанный Владимиром
Воловичем.

Внимание!  В словарь rare.koi выделены некоторые редкие слова, написание
которых мало отличается от широко распространенных слов (например, пара
слов шоссе--шассе) и включение которых в основной словарь может приводить
к пропуску ошибок.  По умолчанию эти слова не включаются в словарь.  Если
эти слова вам действительно могут понадобиться, уберите значок # в конце
строки dict = ... в Makefile.

Словарь постоянно совершенствуется, дополняется и корректируется.
Последнюю версию словаря можно найти на сервере:


	ftp://scon155.phys.msu.su/pub/russian/ispell/rus-ispell.tar.gz

Файлы-заготовки для пользователей DOS в кодировках cp866 и cp1251 можно
найти на сервере:

ftp://scon155.phys.msu.su/pub/russian/ispell/msdos/


Рекомендации по установке словарей см. в файле README.koi в пакете.

<< Предыдущая ИНДЕКС Поиск в статьях src Установить закладку Перейти на закладку Следующая >>

 Добавить комментарий
Имя:
E-Mail:
Заголовок:
Текст:




Спонсоры:
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2021 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру