Cтраница 1
Массив структурных формул включает информацию приблизительно 100 000 соединений, записанных по системе Висвессера. Кроме кода Вис-вессера структурная запись соединения содержит также его эмпирическую формулу и номер соединения. Биологическая информация включает, в частности, данные о гербицидной активности соединений. [1]
Поиск в массиве структурных формул возможен как по полной формуле, так и по отдельным ее фрагментам. Эту часть работы с банком обеспечивает программа CONNSER. Она производит поиск, сравнивая атом за атомом, связь за связью формулы искомой структуры или молекулярного фрагмента со структурными формулами, хранящимися в массиве банка. Установив совпадение какой-либо структурной формулы из общего массива со структурной формулой искомого фрагмента, программа прочитывает имя соответствующего соединения. После этого по имени соединения извлекается и распечатывается соответствующий документ из библиографического массива. [2]
Соответствующая внутримашинная организация массива структурных формул может значительно уменьшить время поиска структур по фрагментам. [3]
Запросы на поиск в массиве структурных формул состоят из параметров, определяющих свойства атомов и химических связей. Начало запроса, как и ранее, начинается - с символа Q, а в конце ставится END. Необходимые комментарии могут быть сделаны в начальной строке после Q и в любом другом месте запроса, если в начале строки поставлен символ С. [4]
Ряд других особенностей автоматизированных ИПС, например внутри-машинная организация массива структурных формул, позволяющая избежать сплошного перебора, имеет те или иные аналогии в рамках традиционного химического подхода, в частности, развивает принятые в различных: справочниках способы систематизации сведений. [5]
Выше уже говорилось, что данный алгоритм автоматического индексирования предназначен для системы внутримашинной организации массива структурных формул. [6]
На основе информации блока автоматической индексации 6 блок внутри-машинной организации осуществляет ту или иную организацию массива структурных формул, позволяющую избежать при поиске сплошного перебора массива структурных формул. Блок 7 при поступлении запроса вырабатывает адрес подмассива, где может содержаться информация, отвечающая запросу ( например, адрес зоны магнитной ленты, где хранится информация об узком классе соединений), т.е. осуществляет предварительную селекцию соединений. [7]
Важнейшей составной частью автоматической информационной системы СА является регистрационная система химических соединений, в которую входят массив структурных формул, массив названий и массив библиографических ссылок на СА. Связь между массивами осуществляется при помощи регистрационных номеров соединений. [8]
На основе информации блока автоматической индексации 6 блок внутри-машинной организации осуществляет ту или иную организацию массива структурных формул, позволяющую избежать при поиске сплошного перебора массива структурных формул. Блок 7 при поступлении запроса вырабатывает адрес подмассива, где может содержаться информация, отвечающая запросу ( например, адрес зоны магнитной ленты, где хранится информация об узком классе соединений), т.е. осуществляет предварительную селекцию соединений. [9]
Большинство находящихся в настоящее время в эксплуатации АИС органической химии используют, как правило, ручные и полуавтоматические системы кодирования структурной информации. Блок кодирования ИПС служит не только для кодирования очередных структур, пополняющих массив структурных формул, хранящийся в памяти ЭВМ. Другая его функция - это кодирование запросов, для чего блок кодирования должен понимать не только язык индивидуальных структурных формул, но также специальный язык структурно-химических запросов. Кодирование запросов заключается в представлении структурно-химического запроса химика-исследователя в виде линейной записи, удобной для машинной расшифровки. Такие языки запросов в настоящее время разработаны еще недостаточно. По мнению авторов, эти языки должны основываться на теоретических представлениях органической химии и быть средствами формализации основных представлений ( допускающих формализацию) о родственности органических соединений. [10]
ЭВМ должна соответствовать одна и только одна запись, и каждой записи - одна структурная формула. Это необходимо, например, для очень распространенной задачи инденти-фикации структурной формулы при ответах на запросы типа: выдать информацию о данном соединении. Однозначное соответствие структурной формулы и ее внутримашинной записи позволяет прибегнуть при идентификации к очень простому алгоритму проверки на совпадение. Вариант задачи идентификации имеет место при пополнении массива структурных формул, введенных в ЭВМ. При введении каждой новой структурной формулы необходимо убедиться в том, что она не была введена в ЭВМ ранее. [11]