Cтраница 1
Словарь словосочетаний, наиболее употребительных в английской научной литературе является первой попыткой создать пособие для практической работы по одному из разделов лексики языка. [1]
Словарь словосочетаний содержит информации об отнесении словосочетаний к определенному классу эквивалентности, коды словоформ, составляющих словосочетания, коды индикаторов словосочетаний. [2]
Приводимые в словаре словосочетания и примеры распределены по соответствующим значениям. После всех значений данного слова за знаком С ( ромб) даются устойчивые фразеологические сочетания, идиомы, пословицы и поговорки. [3]
Машинный словарь разбит на следующие части: словарь словоформ, словарь словосочетаний, массив информационных полей. [4]
Если ни одно из слов, стоящих вправо от-исследуемого, не входит в соответствующий фрагмент словаря словосочетаний, то проверяются все слова, стоящие влево от исследуемого ( они находятся во вспомогательном списке), если вспомогательный список не пуст. Если же результат такого поиска отрицателен, то исследуемое слово само заносится во вспомогательный список для последующей обработки, а программа выбирает очередное слово, с которым проделывается вся описанная выше процедура. Проверка словосочетаний продолжается до первой запятой или до конца предложения. Остаток предложения без исключенных словосочетаний и запятых, если они были, выстраивается в фрагментарное предложение для последующего анализа и обработки. [5]
Все слова анализируемого предложения до первой запятой ( или до конца предложения) сравниваются с заданным словарем словосочетаний. Пары слов, входящие в словосочетания, из дальнейшей обработки исключаются, а дескрипторы ( числа), поставленные им в соответствие, заносятся в Д - иабор. Словосочетания в К-набор не включаются. Однако, когда предусмотрена работа алгоритма без рассмотрения словосочетаний, тогда все слова, входящие в них, могут быть отображены и в Д -, и в К-наборах. Заметим, что анализ словосочетаний есть некоторое приближение к собственно семантическому анализу текстов, выполняемому автоматически. [6]
Для осуществления индексирования, заключающегося в извлечении из текста необходимой информации, каждое из слов текста сравнивается со словарями системы, состоящими из словарей ключевых, неопределенных и несущественных ( в рамках тематики СИАП) слов, а также словаря словосочетаний. [7]
Под словосочетанием понимается присутствующая в словаре последовательность из двух слов, стоящих в предложении в произвольном порядке, не разделенных между собой знаком препинания. Естественно, что одно и то же слово может входить в несколько сочетаний с разными словами; Такое слово будет называться основным элементом, а все подобные слова в словаре словосочетаний помещаются в подсписок более низкого уровня. Алгоритм автоматического выявления словосочетаний описывается следующим образом. [8]
Информация о каждом слове индексируемого текста проверяется в блоке 3 на признак индикатора словосочетания. Если этот признак отсутствует, рассматривается следующая информация. Если она содержит этот признак, то по адресу, указанному там, обращаются к списку словосочетаний для данного индикатора, содержащемуся в словаре словосочетаний. Словосочетание опознается путем наложения кодов словоформ текста на коды словоформ из словаря словосочетаний. [9]
Для анализа текста в системах АИ используются различные автоматические словари, которые можно разделить на два типа. Первый тип представлен словарями, используемыми для распознавания словоформ и их нормализации. Словарь словосочетаний содержит устойчивые последовательности слов. Считается, что в развитом языке насчитываются десятки миллионов понятий, а слов - около миллиона. Поэтому большая часть понятий выражена комбинациями слов. [10]
Для анализа текста в системах АИ используются различные автоматические словари, которые можно разделить на два типа. Первый тип представлен словарями, используемыми для распознавания словоформ и их нормализации. Словарь словосочетаний содержит устойчивые последовательности слов. Считается, что в развитом языке насчитываются десятки миллионов понятий, а слов - около миллиона. Поэтому большая часть понятий выражена комбинациями слов. [11]
Информация о каждом слове индексируемого текста проверяется в блоке 3 на признак индикатора словосочетания. Если этот признак отсутствует, рассматривается следующая информация. Если она содержит этот признак, то по адресу, указанному там, обращаются к списку словосочетаний для данного индикатора, содержащемуся в словаре словосочетаний. Словосочетание опознается путем наложения кодов словоформ текста на коды словоформ из словаря словосочетаний. [12]