Инвертированный файл - Большая Энциклопедия Нефти и Газа, статья, страница 3
Идиот - это член большого и могущественного племени, влияние которого на человечество во все времена было подавляющим и руководящим. Законы Мерфи (еще...)

Инвертированный файл

Cтраница 3


С какими проблемами ведения файлов приходится иметь дело в системах инвертированных файлов.  [31]

Будем считать, что в нашем примере для основного файла организованы инвертированные файлы: FD3 по атрибуту СКЛАД и FD4 по атрибуту ДАТА - ПОСТАВКИ.  [32]

Чтобы выполнить многоаспектный поиск по п ключам, необходимо построить п инвертированных файлов.  [33]

Исторически сложилось так, что применение существующих систем полностью инвертированных и частично инвертированных файлов для обработки данных сложной структуры весьма затруднительно. Очевидно, что увеличение сложности структур данных, представленных на рис. 31.2 или 31.4, добавлением сетевых структур должно привести к необходимости создания новых методов организации данных с более ясной и простой концептуальной моделью.  [34]

Приводимый ниже пример иллюстрирует, как необходимая информация может быть выбрана из инвертированного файла.  [35]

Система поиска масс-спектров, описанная Геллером [4, 85-87], является диалоговой поисковой системой, основанной на инвертированном файле интенсивностей пиков.  [36]

Еще в начале разработки системы ( конец 1970 - х гг.) специалисты CAS пришли к выводу, что применение инвертированных файлов не является наилучшим решением при работе с описаниями химических структур. В качестве основной причины выдвигалось неприемлемое время реакции в диалоге при поиске по часто встречающимся фрагментам. Вероятно, не менее весомыми были другие соображения: поскольку в CAS Online логично было максимально использовать средства регистрационной системы, те и другие должны были быть ориентированы на частое ( в пределе - постоянное) пополнение базы данных, при котором время реакции системы не должно существенно увеличиваться. Разработанное CAS решение опирается на современные идеи параллельной и конвейерной обработки данных.  [37]

Такое предположение справедливо, если требуется хранить информацию о графоподобных структурах ( см. § 5.5) тн РГПИ инфппмяпия представляется инвертированными файлами.  [38]

Если не заданы коды ПРЕ и ПРО, то просмотр осуществляется по файлу DATA, если задан только код ПРО, просмотр выполняется с привлечением инвертированного файла. При просмотре учитывается свойство общей части ключа индексно-последователыюго файла, работа с которым рассматривалась в гл.  [39]

Таким образом, из всех возможных способов описания химических структур использование названий соединений и их фрагментов с учетом контекста лучше всего соответствует стандартной схеме поиска, основанной на инвертированных файлах. При этом возникают проблемы, связанные с упорядочением номенклатуры; если она не была обеспечена при создании базы данных, пользователь должен включать в запрос все возможные варианты фрагментов, их сочетаний и расположения в пределах названия. Поскольку даже поиск по канонизированной номенклатуре не гарантирует 100 % - ного успеха для всех видов структурных признаков, естественно было стремление создать методы поиска, которые были бы свободны от таких недостатков.  [40]

В предыдущей главе были рассмотрены универсальные методы и средства диалогового поиска информации, которые, образно говоря, автоматизировали работу с реферативными журналами за счет построения гигантских указателей - инвертированных файлов. Поскольку к моменту появления таких средств были созданы и технология электронной подготовки информационных изданий, позволившая экономично вводить информацию в системы подобного рода, и технология телекоммуникаций, обеспечившая им широкий круг пользователей, системы с инвертированными файлами быстро получили широкое распространение. Однако довольно скоро выяснилось, что при поиске химической информации универсальные схемы работают далеко не так хорошо, как хотелось бы.  [41]

В данной главе, а также еще в двух главах ( 34 и 35) рассмотрены специальные виды файлов, к организации которых предъявляются особенно высокие требования, а именно инвертированные файлы, изменчивые файлы и файлы в системах реального времени.  [42]

Характерно, что во всех упомянутых выше службах для по-лска химической информации, используют те же базовые средства, которые предоставляют для других тематических областей; основываются они на рассмотренных выше инвертированных файлах. Общее для подобных систем решение состоит в разделении базы данных на две части - документальную и структурную. При этом документальная часть содержит библиографию и ту часть структурных данных, которая связана с тем или яным конкретным документом ( сведения о свойствах, включая реакции), а структурная ( ее называют также химическим словарем) - только то, что непосредственно характеризует химическую структуру. Основным признаком, который используется для структурного поиска, всегда является систематическое название соединения по номенклатуре CAS и фрагменты этого названия. Связь документальной и структурной части базы дан -: ных осуществляется через регистрационные номера соединений. Что касается поиска по фрагментам названий соединений, то для него используются стандартные команды, причем так, как если бы они оперировали с обычными словами. Если требуется ограничить область поиска полными словами или, наоборот, только фрагментами, это делается так, как если бы указывалось имя поля. Это обстоятельство является принципиальным; оно связано со средствами обеспечения высокой скорости, реакции системы, а именно с организацией многоуровневых индексов.  [43]

СУБД обеспечивает большие возможности по управлению данными, так как ей присущи: язык описания данных, позволяющий определять широкое многообразие структур данных и связей между ними; возможность поиска, использующая метод частично инвертированного файла, с помощью которого могут быстро разрешаться запросы к базе данных; средства группового обслуживания, с помощью которых одна копия СУБД Спектр может быть использована для поддержания одновременной работы в интерактивном и пакетном режимах; современные средства защиты данных и средства безопасности данных; широкие возможности управления данными, позволяющие выбирать или модифицировать данные наиболее эффективным способом; полный набор программ-утилит базы данных, позволяющих создавать, поддерживать и контролировать базу данных с минимальными усилиями.  [44]

Полностью инвертированный файл - это такой файл, который хранит идентификаторы объектов, связанные с конкретным значением каждого атрибута. Частично инвертированный файл является более простым и хранит идентификаторы объектов, связанные со значениями некоторых ( но не всех) атрибутов.  [45]



Страницы:      1    2    3    4