Cтраница 2
Однако заметим, что в языке сплетника долгие гласные укорачиваются и короткие удлиняются так, чтобы ритмическая основа слова сохранилась. [16]
Морфологический анализ с использованием словаря основ базируется на флективном анализе, цель которого - правильное выделение основы слова. Основная трудность при использовании данного подхода связана с явлением омонимии основ слов. Для ее устранения проверяется совместимость выделенной основы слова и его окончания. [17]
Кроме того, исходные данные для морфологического синтеза слов отличаются от результатов морфологического анализа тем, что здесь номер основы слова сопровождается однозначной морфологической информацией. Поэтому синтез форм слов значительно проще их анализа. [18]
Обратите внимание, что в большинстве слов 1 и 2 - й колонок при образовании существительного от прилагательного суффикс - ity прибавляется непосредственно к основе слова, не отбрасывая суффикс. [19]
Иной раз, даже когда в англо-русском словаре нет нужного английского слова, переводчик имеет возможность самостоятельно уяснить и передать его значение описательно, если в словаре есть основа искомого слова. Так, например, слово out-doorsman отсутствует не только в словаре Мюллера, но и в английских и американских толковых словарях. Однако оно встречается в газетах, и в частности в статье о южноафриканских заповедниках в следующем контексте. [20]
Для слов группы pluralia tantum характерна лексика-лизация суффикса множественного числа - s, который входит в структуру слова этой группы как ее неотъемлемая часть, постепенно теряет значение множественности и сливается с основой слова. Например, слова barracks, headquarters, works завод, относящиеся к pluralia tantum, все чаще употребляются с глаголом в единственном числе, что свидетельствует об утрате ими значения множественности. [21]
В основе приближенных методов морфологического анализа лежит гипотеза, согласно которой по конечным буквам и буквосочетаниям можно практически однозначно определить грамматический класс слова. Основа слова выделяется следующим образом - от конца слова последовательно отсоединяется по 1 - й букве и полученные буквосочетания сравниваются со списком окончаний, соответствующих данному грамматическому классу. Как только появится совпадение, делается вывод о том, что оставшаяся часть слова - его основа. Для анализа обычно хватает биграмм, триграммы и четырехграммы используются редко. [22]
Каждое из оставшихся после исключения словосочетаний слов в предложении может быть либо несущественным, либо неопределенным, либо ключевым, что выясняется в результате сравнения со входным словарем СИАП. Если какая-нибудь, основа слова из входного словаря входит в рассматриваемую основу, то остаток ( включая пустой) сравнивается со списком окончаний слов естественного языка. В случае успеха принимается, что анализируемое слово есть во входном словаре, в противном случае оно рассматривается, как новое ( неопределенное) слово. Во входном словаре основы слов размечаются по первым двум буквам и упорядочиваются по числу букв, в каждой основе. [23]
Для осуществления такой возможности была реализована пополняемая библиотека data. Данная библиотека содержит основу слова и его представление в БЗ. [24]
Изменения форм слов могут носить различный характер. Они могут быть связаны как с изменением основы слова, так и с изменением его окончания. Изменение буквенного состава основ имеет место, например, в следующих парах форм слов: сижу - сидишь, шел - шли, тренировка - тренировок, нес - несли, кто - кого, время - времени, судно-суда, человек-люди. В русском языке оно используется как самостоятельно, так и в сочетании с изменением основ слов. [25]
Сочетание кода типа распределения и кода грамматической информации однозначно определяет необходимость введения в синтезируемое слово канонической или вариантной формы основы. Код типа распределения указывается в словаре для каждой канонической формы основы слова типа III, наряду с индексом канонической формы и индексом варианта подстановки. [26]
В словах типа rivulet речушка суффикс - let слился с основой слова и уже не воспринимается как уменьшительный. [27]
Если переключателем Выделять / не выделять основы слов при поиске задано выделение основы слова, оно осуществляется путем отбрасывания одно - и двухбуквенных окончаний, состоящих из гласных букв. Данный метод выделения основ слов прост, но при этом обеспечивается достаточно высокий процент выдачи документов, релевантных запросу. Скобки и знаки логических операций выделяются как отдельные элементы синтезируемого логического выражения SQL-запроса. [28]
Российской Федерации и имеет там свои структурные подразделения - организации, отделения или филиалы и представительства. В названии может содержаться наименование России, Российской Федерации и образованные на их основе слова и словосочетания. [29]
У основ слов типа II имеет место явление чередования гласных. При этом в различных формах слов заменяется или пропадает буква, предшествующая последней букве основы слова. [30]