Cтраница 3
Данные, представляющие собой адреса хранения документов, наименования и спецификации документов, рефераты, а также тексты документов. В отличие от фактографических данных являются неструктурированными; хранятся и обрабатываются в документальных информационно-поисковых системах. [31]
Банк данных системы АИДОС соде ржит три основных файла: файл сведений, тезаурус и инверсный файл. В файле сведений накапливаются документальные и фактографические данные, поступающие в систему; тезаурус содержит основные лексические единицы ИПЯ с указанием ссылки на определенные записи инверсного файла; в последнем находятся списки номеров сведений, содержащих в качестве элемента индексирования соответствующую лексическую единицу тезауруса. [32]
В целях упрощения сбора фактографических данных и их подготовки к вводу в ППП АИДОС существует возможность сбора информации в виде таблиц. Этот процесс осуществляется также на основе профиля группы фактов. При этом нотации признаков становятся указателями столбцов. [33]
Удаляются сведения, имеющие номера от 3512 до 3525, независимо, являются они документами или фактами. Вместе с ними удаляются все фактографические данные, связанные с удаляемыми документами. [34]
В связи с тем что в одном сведении могут содержаться данные, собранные как с помощью профиля группы фактов, так и в дескрипторной форме, имеет смысл использовать эти два вида сбора совместно. В этом случае дескрипторное описание фактографических данных является дополнением к данным, представленным в виде профиля группы фактов. [35]
Четвертый банк содержит библиографические сведения по ретроспективной и текущей литературе в соответствии с номенклатурой системы. Информация его связана с массивами фактографических данных, находящихся в первом и втором банках, а также с методиками третьего банка. [36]
Интеграция обеих проблематик, с одной стороны, определяется необходимостью решения проблем эффективной машинной организации фондов данных информационно-поисковых систем, которое не может быть достигнуто без использования концепций систем баз данных. С другой стороны, применение развитых ИПЯ для описания фактографических данных требует наличия ряда методов и средств обработки текстов ИПЯ, весьма схожих с соответствующими методами и средствами документальных ИПС. [37]
Сведения, подготовленные программой NW KVERT, загружаются в фонд с помощью прикладной программы NW LADEN. В процессе загрузки строятся файл сведений и инверсный файл, тезаурус пополняется квазидескрипторами, производится увязка фактографических данных, выводятся на печать списки конкордансов или сведений, квазидескрипторов, протокол выполнения программы и статистика состояния основных файлов системы. [38]
Системы классификации образуют основу для сбора содержательных данных. Для сбора фактов рекомендуется использовать профиль группы фактов, что дает возможность в большой степени исключить имеющий место при индексировании фактографических данных субъективный момент изложения содержания и обеспечить точные высказывания. [39]
До сих пор литература, посвященная кремнеорганическим производным фосфора, была крайне бедна обзорными публикациями. Известные монографии по кремнеорганической химии 17 ( Р), 179, 287, 530 ( S) ] содержат лишь единичные или разрозненные фактографические данные о мономерных фосфорорганических производных кремния, фиксируя внимание читателя лишь на отдельных веществах этого типа и некоторых наиболее типичных методах их синтеза. Многие классы кремнефосфорорганических соединений в последние годы были рассмотрены в литературных обзорах к диссертациям [ 46, 55, 57, 93, 94, 136, 148, 204, 206, 214, 230 ( Р) ], недоступных, однако, широкому кругу читателей. [40]
До последнего времени основной функцией информационной службы считалась передача информации от ее производителя к потребителю, причем полагалось, что в недрах службы информация не производится, а только преобразуется в форму, удобную для потребителя. Теперь все ощутимее становится потребность получения некоторой обобщенной проанализированной службой информации, получения новой информации, являющейся результатом анализа хранимых в системах данных, преобразования внутри службы информационных массивов в удобные для анализа банки фактографических данных и информации об информации. Это вынуждает производить такой анализ НТИ, который позволил бы получить данные, необходимые для принятия управляющих решений, направленных на регулирование процессов научно-технического развития и, что становится все более актуальным, на регулирование процессов эволюционного развития общества. [41]
Частота обращений к ИПС однозначно определяет выбор в качестве технических средств реализации ЭВМ с большим объемом внешних запоминающих устройств. Стандарты или технические условия из архива поступают непосредственно абоненту или в устройство ввода информации ( запроса) в ЭВМ III контура. Эта ЭВМ выдает фактографические данные в устройство вывода фактографических данных III контура, а также производит сравнение запрашиваемых данных с уже имеющимися в других стандартах и технических условиях. [42]
Частота обращений к ИПС однозначно определяет выбор в качестве технических средств реализации ЭВМ с большим объемом внешних запоминающих устройств. Стандарты или технические условия из архива поступают непосредственно абоненту или в устройство ввода информации ( запроса) в ЭВМ III контура. Эта ЭВМ выдает фактографические данные в устройство вывода фактографических данных III контура, а также производит сравнение запрашиваемых данных с уже имеющимися в других стандартах и технических условиях. [43]
Наименование профиля групп фактов или наименования признаков должны иметь размер не более 50 символов. Желательно, чтобы наименования были содержательными, точными и краткими, насколько это возможно. Максимальная длина высказывания признака необходима при редактировании табличных форм фактографических данных. При выборе наименований пользователь не связан терминами, имеющимися в тезаурусе. При проектировании группы фактов следует обратить внимание на то, что признаки с номерами от 01 до 16 могут содержать до 14 высказываний, каждое из которых воспринимается системой как дескриптор и заносится в тезаурус. Максимальная длина каждого такого значения ограничена, как и дескриптора, 100 символами. [44]
Это означает, например, что при автоматическом языковом переводе в двух-трех фразах средней длины может появиться одна ошибка за счет устройства ввода информации. Так как при переводе рассматривается контекст фразы, то такая ошибка не может привести к искажению смысла. То же относится и к вводу информации при автоматическом реферировании, информационном поиске библиографических и фактографических данных, и к обработке некоторых видов статистических данных, когда для увеличения надежности чтения и коррекции возможных ошибок может быть использован вводимый контекст. [45]