Cтраница 1
Система полнотекстового индексирования позволяет создавать компактный индекс и быстро осуществлять поиск с учетом логических операторов. [1]
Система индексирования документов и фактов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации наиболее полного и точного поиска. [2]
Система полнотекстового индексирования позволяет создавать компактный индекс и быстро осуществлять поиск с учетом логических операторов. [3]
Система индексирования документов и фактов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации наиболее полного и точного поиска. [4]
Система индексирования документов, в которой дескрипторы связываются или комбинируются для указания любых отношений, необходимых для организации более точного поиска информации. [5]
Первый путь обеспечивает полную обратимость системы индексирования, поисковые запросы в этом случае могут формулироваться как, на русском, так и на английском языках. Однако вследствие неоднозначного членения действительности двумя языковыми системами установление соответствия между независимо разрабатываемыми русскими и английскими классами эквивалентности затрудняется. Поэтому было решено разработать сначала русскую часть словаря индексирования, а затем использовать ее при разработке английской части. [6]
Показано, что для отечественной практики гораздо более эффективной являлась бы система индексирования с использованием поиска по классификационным таблицам с предметным входом на основе предметных рубрик алфавитно-предметного указателя к каталогу. Рассказывается о проведенных в России исследованиях с использованием категориального анализа для редактирования алфавитно-предметного указателя к каталогу. [7]
Это новый метод, который считается более подходящим для ручного поиска и может в некоторой степени заменить сложные системы машинного поиска. В системе индексирования по этому методу для каждого признака, по которым должны производиться классификация или поиск, используется одна карточка ( или зона магнитной ленты); затем на одну карточку в определенной последовательности или по определенной схеме заносится перечень всех документов ( или номеров документов), к которым применим данный признак. [8]
Рассмотренный в § 13.5 опыт применения в ИПС дескрипторных систем индексирования реакций наряду с хорошо разработанными для автоматизированных документальных ИПС способами дескрипторного поиска дает основание полагать, что такие системы смогут быть использованы и в автоматизированной системе интегрального типа, в первую очередь в качестве фильтров для быстрого предварительного поиска. Для автоматизированных ИПС среднего масштаба такие системы индексирования могут служить и в качестве основного информационно-поискового языка. [9]
В том случае, когда число документов, выдаваемых в ответ на запрос, для обеих систем одинаково, алгоритмы автоматического анализа текста, работающие в системе SMART, приводят к потере полноты и точности, меняющейся от 20 до 50 %, по сравнению с результатами системы MEDLARS, где применяется обычное индексирование документов. При этом наблюдаемые различия в значениях полноты и точности статистически достоверны, так что ясно, что система индексирования MEDLARS дает лучшие результаты. [10]
Поэтому рассмотрению особенностей таких языков в данной главе уделяется основное внимание. Выше уже отмечалось, что в настоящее время в качестве ИПЯ используются главным образом библиотечно-библиографические классификации, системы алфавитно-предметного индексирования и языки дескрипторного типа. Основные правила алфавитно-предметного индексирования, а также важнейшие библиотечно-библиографические классификации были подробно рассмотрены в предыдущей главе. [11]
Другой немаловажный аспект, зачастую сводящий на нет эффективность поиска документов, набранных в кириллице, по ключевым словам состоит в том, что морфология русского языка ( прежде всего многообразие падежных форм) не дает правильного числа совпадений с терминами в документе, если грамматическая форма термина в поисковом запросе и в документе отличаются. В этом смысле несомненный интерес представляет разработка поисковых систем, учитывающих морфологию русского языка, таких, как программные продукты на основе ядра Япеех компании Comp Tek International. Япдех включает модули морфологического анализа и синтеза, индексации и поиска, а также набор вспомогательных модулей, таких, как анализатор документов, языки разметки, конверторы форматов и др. Алгоритмы морфологического анализа и синтеза, основанные на базовом словаре, умеют нормализовать слова, т.е. находить их начальную форму, а также строить гипотезы для слов, не содержащихся в базовом словаре. Система индексирования позволяет создавать компактный индекс и быстро осуществлять поиск с применением логических операторов. [12]