Cтраница 3
Процесс перевода запросов с одних языков на другие может представлять самостоятельный научно-практический интерес в плане его применимости в ряде других иформационных технологий, не имеющих прямого отношения к документальному поиску. Так, описанный выше механизм динамического взаимодействия различных языков может быть применен при установлении диагнозов, лечебных или вредных свойств различных естественных и / или искусственных продуктов, а также в ряде других систем аналитического назначения при необходимости извлечения из большого объема данных качественно новой, до этого не существовавшей ( несформулированной) информации. [31]
С 1976 по 1980 г. указанное программное обеспечение развивалось в следующих основных направлениях: совершенствование технологии обработки информации, ускорение процессов автоматического поиска документов, а также улучшение качества и повышение технологичности выдачи найденных документов; совершенствование программного обеспечения ведения информационно-поискового тезауруса как в одно, так и в двухязычном вариантах в связи с развитием международного сотрудничества в области НТИ; создание автоматизированной подсистемы периодического контроля качества документального поиска; автоматизация индексирования документов, поступающих на вход ИПС Нефть-2; обеспечение информационной совместимости с другими автоматизированными ИПС; использование новой перфорационной техники, подготавливающей данные на магнитной ленте. [32]
На практике применяется документальный и фактографический поиск информации. Документальным поиском называется поиск документов, соответствующих полученному запросу, с последующей выдачей самих документов или их копий. [33]
В настоящее время существует тенденция расширения функций поисковых систем и каталогов, преобразование их в информационные порталы. Такие системы помимо традиционного документального поиска предоставляют и другие информационные услуги. [34]
Фактографический поиск представляет собой поиск факторов, непосредственно отвечающих на запрос. Например, на запрос Отечественные микроЭВМ результатом документального поиска будут книги, статьи и другие материалы, содержащие сведения об отечественных микроЭВМ, а результатом фактографического поиска - перечень микроЭВМ с их техническими характеристиками. [35]
Работа АСДП эквивалентна случайной выборке. Естественно, что такая АСДП не может быть пригодна для документального поиска. [36]
В подсистеме автоматического индексирования проводится графо-матический анализ, морфологический анализ, опознание единиц тезауруса в текстах документов. Слова и словосочетания получают условные морфологические признаки, а отраслевая лексика, существенная для документального поиска, опознана и расклассифицирована соответственно структуре ИПТ. [37]
Успешно ведутся работы с этой страной в соответствии с долгосрочной программой в рамках раздела Автоматизация управления в области стандартизации метрологии, которые, по мнению сотрудничающих сторон, являются одним из важнейших направлений совершенствования национальных систем стандартизации и международного сотрудничества. Они направлены на согласование форм машино-ориенти-рованного представления стандартов, разработку вопросов перевода тезауруса и отбора дескрипторов для индексации стандартов, а также программы документального поиска применительно к стандартизации. [38]
Ответы на запросы тех пользователей, которые не имеют доступа к выходным терминалам, передаются коммутационным процессором для печати на телетайпе в центре обработки запросов. Если пользователь по телефону сообщает, что ему требуются копии всех документов, рефераты которых найдены в ходе библиографического поиска, запрос направляется средствам документального поиска. Пользователя, который не указал, нужны ли ему копии документов, запрашивают об этом по телефону. В случае когда эти копии не нужны, ответ готовится к отправке по почте. Если пользователь по телефону сообщит о том, что ему требуются копии документов, хранящихся в ИПС, его запрос передается средствам документального поиска. [39]
Таким образом, когда говорят о степени близости двух векторов размерности z, подразумевается, что речь идет о близости двух иод-множеств некоторого множества из z элементов. Этим обстоятельством мы будем пользоваться для оценки ( там, где это возможно) правомерности, корректности тех или иных интуитивных соображений, лежащих в основе построения различных моделей документального поиска. В простейшем случае, когда осуществляется оценка близости двух бинарных z - мерных векторов, речь идет о степени близости двух обычных подмножеств, определенных на множестве из z элементов. [40]
Хранение информации осуществляется на материальном носителе. В зависимости от объекта ( документ, факт, сведения о документе) различают следующие виды поиска: документальный, фактографический и библиографический. Целью документального поиска является нахождение в хранилище документов, соответствующих запросу, и выдача этих документов или их копий. [41]
Последние, будучи несемантическими компонентами сети, призваны объединить звенья сети - документальные системы, которые имеют отчетливую семантическую природу. В рассматриваемом смысле представляется заманчивым разработать энтропийную модель документального поиска, с тем, чтобы математический анализ сети в целом ( включая ее звенья семантической природы) осуществить в рамках единой статистической теории информации. [42]
Новое программное обеспечение рассчитано на эксплуатацию в среде ОС ЕС ЭВМ единой серии, имеющих стандартную конфигурацию, начиная с ЭВМ ЕС-1030. В отличие от программного обеспечения, использовавшегося при эксплуатации системы Нефть-2, новая версия системы включает ППП, разработанные в других организациях. К ним относятся ППП СДЗ / JSJS / ЕС, разработанный в ЮНЕСКО, адаптированный применительно к ЭВМ ЕС в Международном центре НТИ и обеспечивающий ввод документов, которые подготовлены во ВНИИОЭНГе, и создание баз данных в формате JSJS, а также документальный поиск в диалоговом и пакетном режимах. [43]
Пусть, например, речь идет об оценке степени близости двух обычных подмножеств, определенных на множестве терминов и представляющих пользовательский запрос и очередной документ. Представляется вполне естественным, чтобы документы, которым при фиксированных значениях а и z соответствуют большие значения b и с, признались бы менее релевантными пользовательскому запросу, чем документы, которым соответствуют меньшие значения b и с. Скалярное же произведение двух векторов, равное в данном случае величине а, не учитывает этого обстоятельства поэтому его применение нельзя признать правомочным, корректным. В то же время, практически во всех существующих матричных моделях документального поиска фигурирует операция умножения матриц, сводящаяся, как известно, к вычислению скалярных произведений соответствующих векторов. Это обстоятельство ставит под сомнение правомочность, корректность использования всех моделей, где используется операция умножения матриц. Наши исследования показали, что этого можно достичь путем введения в рассмотрение операции / - произведения матриц. [44]
Поскольку документальный поиск сводится к установлению семантического расстояния между различными идеями, понятиями путем сопоставления их языковых формулировок, то с самого начала в центре внимания оказались гносеологические вопросы взаимоотношения языка и мышления. Ряд специалистов категорически опровергал возможность формального математического описания отдельных процедур, в совокупности реализующих предварительную обработку, хранение и поиск документальной информации. Со временем эти страсти улеглись и большинство специалистов пришло к заключению, что разработка формальных математических средств для описания и решения если не проблемы в целом, то хотя бы отдельных ее задач не только возможна, но и необходима. В частности, была доказана эффективность применения для решения различных задач документального поиска теории вероятностей и математической статистики, теории нечетких подмножеств, корреляционного анализа, теории матриц и, что представляется наиболее важным, теории информации. [45]