Прикладные исследования по морфологии
Прикладная морфология, являясь составной частью компьютерной лингвистики, традиционно считается в ней наиболее исследованной областью, в задачу которой входит: — разработка морфологических процессоров — систем автоматического морфологического анализа и синтеза слов, а также систем лемматизации — сведения словоформ к словарным словам; — автоматизация морфологических исследований, предусматривающая проведение ряда лингвистических работ с помощью ЭВМ для решения основной задачи — разработки морфологических процессоров: использование СУБД для составления морфологических словарей, проведения типологических исследований, моделирования морфологических явлений и т. д.
Следует отметить, что в настоящее время используются самые разнообразные автоматизированные системы обработки речи и текста, применяющие морфологические процессоры: системы машинного перевода, коррекции и редактирования текста, анализа и синтеза речи, информационного поиска (в особенности полнотекстовые системы), автоматического реферирования, автоматические словари, экспертные системы и обучающие лингвистические автоматы. В указанных системах морфологические процессоры являются наиболее надежными и хорошо отработанными компонентами. В последних промышленных и коммерческих разработках хорошо зарекомендовали себя морфологические процессоры процедурного типа, работающие на базе словаря основ, — ср. сис темы автоматического морфологического анализа в СМП АСПЕРА [Королев, 91,95], MORSE [Пиотровский, 95], в автоматических корректорах WinОРФО [Ашманов, 95], автоматического морфологического синтеза в СМП СПРИНТ-2 [Тихомиров, 92], лемматизации русских слов [QUALICO-94].
Модификация морфологических процессоров в основном идет за счет Использования блока анализа слов, не содержащихся в словаре («новых слов»), Которые традиционно анализируются на основе принципа морфологической аналогии, предполагающего сильную корреляционную зависимость между грамматическими характеристиками слов и буквенным составом их концов. Этот принцип давно и успешно используется в морфологических процессорах, разработанных Г.
Г. Белоноговым.
В 80-е годы киевскими лингвистами (В. И. Перебейнос, Т.
А. Грязнухина, Дарчук и др.) принцип аналогии был положен в основу морфологических анализаторов русского языка, работающих без каких-либо словарей. Модификация этого подхода, также предполагающего исключение словарей для целей морфологического анализа или использование их в минимальной степени, в последнее время была предпринята Г. Г. Белоноговым для русского и некоторых других языков [Белоногов и др.
,95], а также другими специалистами по вычислительной морфологии [Шереметьева и др., 96]. Широкое распространение персональных ЭВМ создает благоприятные условия для автоматизации морфологических исследований — автоматического формирования русского морфологического словаря по исходным массивам слов и словосочетаний [Большаков,93], использования специализированных словарных баз данных для анализа морфологии русского языка, автоматического типологического анализа морфологии семитских языков [QUALICO-94], автоматического Формирования перечня структурных типов префиксов русских существительных [Герд, 93], использования автоматизированной системы составления и ведения Флективных классов русских существительных, прилагательных и глаголов, применяемых в морфологическом процессоре СМП АСПЕРА [Королев, 95], моделирования морфологического анализа русских слов, содержащих суффиксы [Гельбух, 92].
В заключение напомним о том, что за последние несколько десятилетий морфология переживала свои периоды взлетов и падений. В 60-е годы нашего столетия определенный застой в морфологических исследованиях был вызван бурным распространением структурного синтаксиса, а затем и семантики. Однако со временем развитие науки и требования жизни все расставили по своим местам, и в последние годы, как свидетельствует наш краткий обзор, теоретическая и прикладная морфология вновь являются важным полигоном для лингвистической теории и практики.
Прикладные исследования по морфологии