Разработка - тезаурус - Большая Энциклопедия Нефти и Газа, статья, страница 1
Чудеса современной технологии включают в себя изобретение пивной банки, которая, будучи выброшенной, пролежит в земле вечно, и дорогого автомобиля, который при надлежащей эксплуатации заржавеет через два-три года. Законы Мерфи (еще...)

Разработка - тезаурус

Cтраница 1


Разработка тезаурусов сопряжена с рядом методологических и лингвистических проблем. Сама по себе задача создания многоязычного тезауруса не является уникальной. Наиболее близки по тематике к разрабатываемому тезаурусу ЕИСМОРИ [32] два тезауруса. Второй - тезаурус Международной организации труда ( МОТ) [34], использующий в качестве рабочих языков английский, французский и испанский. Однако история возникновения и назначение последнего отличаются от нашего случая. Тезаурус МОТ изначально создавался для обслуживания политематической, но организационно единой базы данных с учетом параметров, задаваемых макротезаурусом Организации экономического сотрудничества и развития ( ОЭСР), на основе единой идеологии построения в соответствии с унифицированными правилами и требованиями.  [1]

При разработке тезауруса пользователь должен соблюдать следующие требования.  [2]

Структура подлежащего разработке тезауруса зависит от специфики его применения, от потребности пользователя. Структура тезауруса влияет на результаты поиска, на эффективность работы всей системы. Пользователь может использовать в качестве тезауруса уже простой перечень понятий. Но если системе предъявляются большие требования относительно точности и полноты поиска накопленной информации, то естественно предпочесть соответствующую более сложную структуру тезауруса.  [3]

На начальном этапе разработки многоязычного тезауруса под эгидой инициатора проекта ЕИСМОРИ - Фонда науки и политики ФРГ ( Stiftung Wissenschaft und Politik) при совместных усилиях сотрудников научных организаций-участников Проекта с германской стороны на базе Объединенной специализированной службы информации ( Fachinformationsverbund Internationale Beziehungen und Laenderkunde) была подготовлена и издана в 1992 г. экспериментальная версия. Она содержит около 8 400 дескрипторов, заимствованных из тезауруса Фонда науки и политики ( раздел Международные отношения) и Тезауруса по экономическому и социальному развитию с необходимыми дополнениями. Эта версия послужила основой для анализа и выявления семантического содержания дескрипторов, которые должны составить лексическую основу Тезауруса по международным отношениям и региональным исследованиям ( страноведению), а также позволила осуществить предметно-логическую группировку этих дескрипторов в тематические поля.  [4]

При этом учитывается опыт разработки тезаурусов и методика индексирования, имеющие место при создании аналогичных отраслевых систем. Должен быть проведен анализ нормативно-технической документации, подсчитаны и сверены данные по отобранным документам в таблицы. Табличный материал служит основой для определения объема пассивного ЗУ и позволяет рассчитывать объем I и III контуров ИПС.  [5]

Наличие по возможности полного тезауруса оказывает большое влияние на эффективность системы. Разработка тезауруса должна проводиться согласно требованиям, изложенным, в документации по ППП АИДОС и - в ГОСТ 18383 - 73 Тезаурус информационно-поисковый.  [6]

При составлении тезауруса нужно также учитывать вероятное число лиц, которые будут пользоваться данным тезаурусом, средний уровень научной квалификации этих лиц, а также характер их практической деятельности. Разработка тезауруса для небольшой группы предметизаторов, которые должны будут заиндексировать большое собрание научно-технических отчетов, требует иного подхода, чем разработка тезауруса, которым в течение ряда лет будут пользоваться несколько сот предметизаторов для индексирования текущей литературы. Очевидно, что если тезаурус предназначен для специалистов, то в нем будет содержаться меньше пояснительных помет к различным терминам, чем в тезаурусе для неспециалистов. При создании тезау руса целесообразно использовать все пособия, которые могли применяться ранее для индексирования документов по соответствующей тематике.  [7]

Упрощенно решение проблемы создания многоязычного тезауруса может быть реализовано двояко: путем перевода одноязычного тезауруса на языки-компоненты или совмещения страновых тезаурусов. В случае разработки тезауруса проекта ЕИСМОРИ на первый план выходит проблема совместимости разноязычных политематических терминосистем, отражающих национальную культурно-историческую специфику каждой из стран - участниц проекта. Уже сама по себе разработка политематического национального тезауруса является в определенном смысле задачей по интеграции нескольких в той или другой степени специализированных, отраслевых тезаурусов.  [8]

В качестве информационно-поискового языка в разрабатываемой системе используются тезаурус, профиль группы фактов, систематика. Структура подлежащего разработке тезауруса зависит от потребностей пользователя.  [9]

В связи с - этим при разработке тезауруса, в частности при отборе терминов, всегда стоит вопрос, в какой степени следует использовать многословные термины.  [10]

Представленная технология автоматического рубрицирования текстов позволяет классифицировать различные типы текстовой информации, быстро настраиваться на различные рубрикаторы и типы документов. Но и имеет существенные ограничения в своем использовании, так как трудоемкость разработки тезауруса достаточно высока и требует больших временных затрат ( от нескольких месяцев до нескольких лет), кроме того, формирование тезауруса производится в соответствии с той или иной предметной областью, что делает невозможным использование одного тезауруса при классификации текстов из различных предметных областей.  [11]

При составлении тезауруса нужно также учитывать вероятное число лиц, которые будут пользоваться данным тезаурусом, средний уровень научной квалификации этих лиц, а также характер их практической деятельности. Разработка тезауруса для небольшой группы предметизаторов, которые должны будут заиндексировать большое собрание научно-технических отчетов, требует иного подхода, чем разработка тезауруса, которым в течение ряда лет будут пользоваться несколько сот предметизаторов для индексирования текущей литературы. Очевидно, что если тезаурус предназначен для специалистов, то в нем будет содержаться меньше пояснительных помет к различным терминам, чем в тезаурусе для неспециалистов. При создании тезау руса целесообразно использовать все пособия, которые могли применяться ранее для индексирования документов по соответствующей тематике.  [12]

Упрощенно решение проблемы создания многоязычного тезауруса может быть реализовано двояко: путем перевода одноязычного тезауруса на языки-компоненты или совмещения страновых тезаурусов. В случае разработки тезауруса проекта ЕИСМОРИ на первый план выходит проблема совместимости разноязычных политематических терминосистем, отражающих национальную культурно-историческую специфику каждой из стран - участниц проекта. Уже сама по себе разработка политематического национального тезауруса является в определенном смысле задачей по интеграции нескольких в той или другой степени специализированных, отраслевых тезаурусов.  [13]

Объединенный совет инженеров США в 1962 г. начал осуществление обширной программы, которая имеет своей конечной целью снабжение всех наиболее важных статей, помещаемых в технических журналах США, индексами из ключевых слов и краткими рефератами. В осуществлении этой программы уже принимают участие Американский институт инженеров-химиков, Американское металлургическое общество, Американское общество гражданских инженеров и Американское общество инженеров-электротехников. В настоящее время в США завершена разработка Тезауруса технической терминологии, который будет использоваться для координатного индексирования публикаций, помещаемых во всех основных технических журналах США.  [14]



Страницы:      1