Cтраница 2
В скобках приведены словоформы в том виде, в котором они хранятся в словаре лексики. [16]
Далее, каждая словоформа естественного ( русского) языка состоит из основы и окончания, которое может быть пустым. Для того, чтобы алгоритм автоматического индексирования был удовлетворительным, он должен решать задачу выделения основ слов, так как во входном словаре приведены основы слов. Поэтому перед началом работы алгоритма в4 ЭЦВМ вводится словарь всех возможных окончаний естественного языка. ЭЦВМ, так как алгоритм не предусматривает проведение полного морфологического анализа. В принципе это можно сделать автоматически3, что связано, однако, со значительным усложнением алгоритма и в настоящее время признано нецелесообразным. [17]
Из словаря выбираются словоформы, у которых длина конечных буквосочетаний, совпавших с конечным буквосочетанием нового слова, является максимальной. [18]
Замене ( подлежат ключевые словоформы текста и элементы словосочетания. Все прочие словоформы опускаются. Внутри зоны словоформы располагаются по порядку убывания частотности. [19]
Этап определения порядка словоформ синтезируемой фразы завершается расстановкой приведенных групп. Взаимное расположение этих групп определяется в русском языке большим количеством различных по силе факторов, сложно взаимодействующих между собой. Можно выделить четыре группы правил расстапов-ки ПГ -: 1) расстановка глагола, его актантов и частей сложного сказуемого; 2) расстановка обстоятельств; 3) оформление логического выделения ( учет темы и ремы синтезируемого предложения); 4) правила, корректирующие окончательный порядок слов в предложении путем поиска неприемлемых ситуаций. Не вдаваясь в детали, можно грубо определить такой порядок приведенных групп: ПГ обет. [20]
Приписывание синтактико-семантических кодов словоформам производится в соответствии с грамматикой, которая определяется проблемной областью и прагматикой задачи. В некоторых случаях она отличается от традиционной русской грамматики. [21]
Процедуры автоматического составления словарей словоформ и словарей основ слов имеют много общих черт. [22]
Стандартная индивидуальная МУС для конкретной словоформы получается из ЯМУС путем ее трансформации, зависящей как от морфологической информации словоформы А, так и от вида ЯМУ. Поясним использование таблицы на примере. Пусть у словарной статьи с частью речи глагол для основы слова сообщало записана ЯМУС следующего вида: ПР ( сущ. Знаком изображается факт обязательности установления СИО для данного столбца. [23]
Новая словоформа сравнивается со словоформами из словаря, и фиксируются все случаи совпадения концов словоформ. [24]
Исходным материалом для составления словаря словоформ должна быть некоторая совокупность текстов определенной тематики. Слова текста перфорируются одно за другим в порядке их следования в текстах. При этом каждая словоформа исходного текста наносится на отдельную перфокарту. Образовавшийся массив перфокарт табулируется и при необходимости расшифровывается. Если цель составления словарей - только получение списков различных словоформ, то подсчет количества карт не делается. [25]
Противопоставляется синтаксису, изучающему функционирование словоформ в рамках более крупных грамматич. Раздел лингвистики, изучающий словоизменение и словообразование. [26]
Как видно, по аффиксам словоформам может быть приписано множество МИ-строк. Информация в морфологической зоне словаря в основном и предназначена для устранения указанной омонимпи. [27]
Как видно, по аффиксам словоформам может быть приписано множество МИ-строк. Информация, содержащаяся в морфологической зоне словаря, в основном и предназначена для устранения указанной омонимии. В морфологической зоне основы целесообразно хранить часть речи, грамматическое значение основы и словоизменительный тип. [28]
Каждая словоформа текста сравнивается со словоформой словаря индексирования и в случае тождества, заменяется информационной ячейкой. [29]
У данной лексемы имеется только одна словоформа, принадлежащая к той или иной категории: так, русские существительные тушь и борщ имеют только словоформу единственного числа и не имеют формы множественного числа, а существительные чернила и щи имеют, наоборот, только словоформу множественного числа и не имеют единственного, так что о выборе форм числа не может быть и речи. [30]