Cтраница 1
Степень релевантности оценивается на языке дескрипторов. Дескриптор - смысловая единица языка, которая может выражаться ключевым словом, группой слов или цифр, сочетанием их. [1]
Таким образом, степень релевантности проблеме Р документов, не содержащих ссылок на данную проблему, равняется 0: считается, что, в отличие от остальных, такие документы отношения к проблеме Р не имеют. [2]
Результаты поиска упорядочиваются по степени релевантности. Критерий релевантности рассчитывается на основе: числа встретившихся в документе терминов запроса, их положения и числа слов между ними. В каждом документе выделяются ( подсвечиваются) найденные слова. Возможно задавать форму выдачи: полное описание, краткое описание, адрес. [3]
Запрос одновременно осуществляется несколькими поисковыми системами, результат поиска объединяется в общий, упорядоченный по степени релевантности список. Поскольку каждая система обрабатывает только часть узлов сети, это позволяет значительно расширить базу поиска. [4]
Действительно, весьма правдоподным представляется допущение о том, что поведение качества документа dq как функции двух аргументов - объема dq и степени релевантности dq проблеме Р, имеет следующую особенность: при фиксированном значении V ( dq) с увеличением степени релевантности dq проблеме Р качество документа возрастает; напротив, при Rel ( dg) const с ростом объема документа dq его качество снижается. [5]
Действительно, весьма правдоподным представляется допущение о том, что поведение качества документа dq как функции двух аргументов - объема dq и степени релевантности dq проблеме Р, имеет следующую особенность: при фиксированном значении V ( dq) с увеличением степени релевантности dq проблеме Р качество документа возрастает; напротив, при Rel ( dg) const с ростом объема документа dq его качество снижается. [6]
Разработаны множественно-статистические алгоритмы вычисления меры близости экспертов. Предлагаются способы ее увеличения путем взаимно согласованного ( дискуссионного) принятия решения о степени релевантности ( пертинентности) найденной информации поставленному вопросу. [7]
Выбранное представление фокуса внимания должно обеспечивать следующие основные функции: 1) дифференцирование знаний по степени релевантности; 2) фокусирование как явных, так и неявных сущностей текста; 3) динамическое изменение фокуса ( сдвиг фокуса) при изменении темы дискурса. [8]
Основой нейросетевых методов рубрицирования текстов является использование нейронной сети ( НС) в качестве обучаемого классификатора. Считается, что в наличии имеется подборка примеров текстов, каждый из которых помечен как релевантный или нерелевантный определенной рубрике. Задача НС, обученной на этих примерах, состоит в определении степени релевантности любого нового текста данной рубрике. [9]
Операторы вводятся в запрос с клавиатуры или путем использования одноименных кнопок. При логическом поиске система не производит автоматического расширения слов запроса. Пользователь получает документы, содержащие все слова запроса с учетом условий, налагаемых операторами. Найденные документы не ранжируются по степени релевантности. В списке они располагаются в хронологическом порядке, определяемом датой ввода документа в БД. [10]
Поиск в интернете тематических сайтов представляет непростую проблему. Она включает 3600 сайтов, структурированных сотрудниками института по разработанным ими принципам. Российские ученые лишены доступа к этой базе данных, поэтому поиск и представление ученым в удобной форме научных сайтов продолжает оставаться актуальной проблемой. При поиске тематических сайтов по нанонауке и нанотехнологии необходимо учитывать общие методы эффективного поиска информации в Интернете, основанные на знании принципов построения самих сайтов и особенностей работы поисковых серверов. Поиск ведется либо по свободным терминам с учетом шумовых сайтов и степени релевантности, либо по контролируемым терминам, например, нанотехнология или nanotechnology. В работе [2] предложены основные принципы структурирования тематических сайтов по информации, содержащейся в названии сайта и по содержанию сайта. [11]