Cтраница 3
Поясним детали работы МА на примере словоформ решает и решится. В связи с тем, что в СГФ указанные словоформы не будут найдены, начнет работу второй блок МА. В таблице аффиксов окончанию - ет ( - ит) соответствует МИ: глаг. Данные окончания содержат отсылку на вкладывающиеся в них пустые окончания - 0 - для существительных с типом основы 1, 3 ( сущ. [31]
МУ), Mj - число словоформ, удовлетворяющих текущему столбцу t - ro слова о МУ, При этом экстремальный вектор может быть не единственным, и задача состоит в поиске такого первого вектора, для которого могут быть установлены все СИО и который может быть проинтерпретирован этапом СЕА. [32]
Раздел WORDS содержит все известные системе словоформы. Существуют два вида словарных статей WORDS. Для неизменяемых слов словарная статья содержит специальный маркер неизменяемости и набор семантических атрибутов. Словоформы изменяемых слов представлены в WORDS статьями, содержащими основу, соответствующую словоформе, и альтернативные наборы грамматических характеристик, присущих данной словоформе. При этом в MORPH должна существовать словарная статья, соответствующая основе. [33]
Составленный словарь ( перечень буквенных кодов словоформ) выдается на печать. При необходимости он предварительно упорядочивается по алфавиту. Для этого используются известные методы сортировки информации [16], которые могут применяться также и для составления словарей, если после окончания процесса сортировки в результирующем массиве устранить дублирование одинаковых словоформ. [34]
В результате вложения всех возможных аффиксов словоформе сопоставляется одна или несколько гипотетических основ ( ГО) и для каждой основы - одна или несколько МИ. Гипотетические основы ищутся в словаре основ во время работы третьего блока МА. В случае нахождения ГО в словаре основ и совпадения части речи ГО с частью речи словарной основы ( СО) ( а для существительных при совпадении типов основ, одушевленности, рода и числа) данная ГО и ее МИ ( одна или несколько) признаются правильными. В противном случае ГО признается ошибочной и отбрасывается. При нахождении в словаре ГО вместе с морфологической зоной считываются и ее синтактико-семаитп-ческие зоны, чтобы не повторять поиск по словарю для синтаксического и семантического анализов. [35]
В результате вложения всех возможных аффиксов словоформе сопоставляется одна или несколько гипотетических основ ( ГО) и для каждой основы - одна или несколько МИ. Гипотетические основы ищутся в словаре основ во время работы третьего блока МА - В случае нахождения ГО в словаре основ и совпадения части речи ГО с частью речи словарной основы ( СО) ( а для существительных при совпадении типов, одушевленности, рода и числа) данная ГО и ее МИ ( одна или несколько) признаются правильными. В противном случае ГО признается ошибочной и отбрасывается. При нахождении в словаре ГО вместе с морфологической зоной считываются и ее синтактико-семантические зоны, чтобы не повторять поиск по словарю для синтаксического и семантического анализов. [36]
Например, как отмечено ранее, словоформе территории будет приписано пять МИ ( род. Однако если перед данной словоформой стоит предлог на ( требующий винительного и дательного падежей), то три из этих МИ будут устранены. Оставшаяся омонимия ( нападал на территории пяти государств и ня территории района) будет разрешена с помощью синтаксиса и се мантикп. [37]
Частотный словарь основ составляется по частотному словарю словоформ. При этом для каждой словоформы на табуляграмме отмечается граница между основой и окончанием. Далее основы слов перфорируются вместе с частотами соответствующих словоформ и сортируются по алфавиту. Затем суммируются частоты по группам перфокарт с одинаковыми основами и перф9рируются итоги суммирования а одну из перфокарт в каждой группе. Итоговые перфокарты выделяются из общего массива и с них частотный словарь основ печатается на рулонную бумагу. [38]
Завершается работа СИА проведением синтаксических отношений между словоформами оборотов и придаточного предложения. Затем обрабатываются обороты более глубоких уровней. Установление отношений внутри оборотов и придаточного предложения выполняется таким же образом, как и для основного уровня. [39]
Завершается работа СИА проведением синтаксических отношений между словоформами оборотов и придаточного предложения. Сначала обрабатываются обороты первого уровня, т.е. обороты, связанные отношениями со словоформами основного уровня. Затем обрабатываются обороты более глубоких уровней. Установление отношений внутри оборотов и придаточного предложения выполняется таким же образом, как и для основного уровня. [40]
Под морфологическим анализом ( МА) понимается обработка словоформ вне связи с контекстом. КМИ состоит в общем случае из совокупности МИ-строк ( пар: основа - морфологическая информация ( МИ)), являющихся морфологическими омонимами. Алгоритм МА в решающей степени зависит от принятого в системе способа хранения информации. Существуют два основных метода реализации МА: декларативный и процедурный. По сути дела, в декларативном МА нет собственно морфологического анализа, а хранится его результат. Задача декларативного МА состоит только в поиске словоформы в словаре и переписывании из словаря комплекса МИ, соответствующего данной словоформе. [41]
Грамматический анализ заключается в распознавании и выделении групп словоформ, составляющих в совокупности все предложение, в нахождении основного отношения, высказанного в запросе, а также групп слов, описывающих объекты, которые входят в это отношение. Содержащиеся в грамматическом анализаторе знания заданы в операционной форме. [42]
Машинный словарь разбит на следующие части: словарь словоформ, словарь словосочетаний, массив информационных полей. [43]
Таким образом, словарь основ слов и словарь словоформ могут быть использованы в качестве средства для определения грамматических признаков новых слов. При этом отпадает необходимость в специальных списках конечных буквосочетаний слов. [44]
Под морфологическим анализом ( МА) понимается обработка словоформ вне связи с контекстом. КМИ состоит в общем случае из совокупности МИ-строк ( пар: основа - морфологическая информация ( МИ)), являющихся морфологическими омонимами. Существуют два основных метода реализации МА: декларативный и процедурный. В декларативном методе реализации МА ( декларативный МА) в словаре системы хранятся все возможные словоформы каждого слова с приписанной им морфологической информацией. По сути дела, в декларативном МА нет собственно морфологического анализа, а хранится его результат, поэтому декларативный МА работает быстрее, чем процедурный. [45]