Cтраница 3
![]() |
Треугольники Фреге, отра - [ IMAGE ] Четырехугольник. [31] |
Треугольник сущность 2, понятие 2, имя 1 в сочетании с базовым иллюстрирует случаи омонимии и полисемии. Сущностям 1 и 2 и понятиям 1 и 2 ставится в соответствие одно и то же имя, что свидетельствует о его многозначности. В случае полисемии понятия 1 и 2 характеризуются общим происхождением ( одна статья в толковом словаре), например сферы - небесная и интересов. При омонимии понятия 1 и 2 имеют различное происхождение. Например, в бытовом значении слово ключ характеризует предмет, связанный с безопасностью помещений, а в программировании под ключом понимают программный код, используемый для поиска данных. Смысл таких слов можно распознать только по контексту. [32]
При рассмотрении любого предмета или явления с позиций частных наук или с различных позиций одной и той же науки обычно получают несколько отличающиеся сведения. Поэтому часто одно и то же слово приобретает контекстные значения. Это свойство многозначности слов, полисемии затрудняет коммуникации даже среди специалистов, работающих в близких областях знания. Взаимопонимание часто отсутствует, поскольку специалисты употребляют одни и те же слова, но подразумевают их различные значения. [33]
Рассматриваются принципы построения лингвистического процессора, использующего лингвистические знания ( в виде семантических сетей) для глубинного анализа предложений русского языка с их отображением на предметные знания - семантические сети. Такие значения позволяют разрешать неоднозначности, связанные с полисемией глаголов, и восстанавливать информацию, данную по умолчанию. [34]
![]() |
Условное изо - [ IMAGE ], Условное изображение количе-бражение синонимии ственной неоднозначности. [35] |
Многозначность слова, его способность обозначать не одно, а несколько понятий, является необходимой предпосылкой экономии языковых средств. Многозначность слова естественного языка вызывается двумя видами неопределенностей: полисемией и омонимией. [36]
Система дает много вариантов разбора. Во-первых, при одном и том же окончании могут быть различные падежи, например ОКНА: родительный падеж единственного числа или именительный / винительный падеж множественного числа. Во-вторых, возможны случаи омонимии ( ДРУГОМ - это может быть ДРУГ или же ДРУГОЙ) или полисемии, см. выше. Тогда строятся и рассматриваются параллельные варианты. В этом случае также строятся параллельные варианты. [37]
Контроль за использованием ключевых слов может иметь различные степени. При нулевом или очень слабом контроле предметизатор выбирает ключевые слова для координатного индексирования документа непосредственно из текста этого документа без учета того, какие ключевые слова использовались раньше; он не учитывает ( или почти не учитывает) синонимии ключевых слов и иногда даже не приводит словоформы к нормальному виду. При полном контроле индексирование производится по нормализованному списку ( словарю) ключевых слов, в котором полностью устранена синонимия, полисемия и омонимия ключевых слов и эти слова связаны друг с другом родовидовыми и ассоциативными связями. Практический опыт показывает, что чем выше степень лексикографической обработки словарного состава ИПЯ, тем большего контроля требует такой ИПЯ при его практическом использовании. [38]
ИПС Унитерм, когда на печать выдаются только те документы, признаки которых полностью совпали с признаками запроса. Такое задание в принципе позволяет получить большую точность поиска, однако реализовать его довольно трудно. Дело в том, что носителем любого содержания ( смысла) является план выражения ( язык), который неполностью тождествен плану содержания из-за существующих в естественном языке неоднозначностей: полисемии, амонимии, синонимии, количественной неоднозначности. По этой причине формальное совпадение плана выражения запроса с планом выражения документа еще не означает полного совпадения их содержаний. Выходом из создавшегося положения является формализация языка. И если естественный язык, также как и мышление человека, неразрывно с ним связанное, не поддаются формализации, то специально созданный для поисковых целей язык формализовать возможно. Так появились дескрипторные словари ( тезаурусы), представляющие собой фонды фиксированных грамматических единиц поискового языка и связей между ними, с помощью которых составляются поисковые образы документов и запросы на поиск. Это мероприятие повысило точность поиска, и поэтому большинство поисковых языков, вновь разрабатываемых ИПС, являются дескрипторными. Однако практика показала, что формализация поискового языка не может исключить логических неоднозначностей, возникающих в процессе свертывания первичных описаний разными людьми. В результате, от одного и того же первичного описания получается множество вариантов поисковых образов документов с различным количеством признаков, неодинаковой степенью свертывания и уровнем обобщения. [39]
Для современного английского языка характерно существование большого количества синонимов, имеющих незначительные т илистические различия. Если появление ссинонимов является результатом стремления нагляднее охарактеризовать предмет через его название, вновь появившийся синоним имеет ассоциативное значение. Сравните, например, следующие пары синонимов, в которых первое слово или словосочетание является заимствованным и семантически немотивировано с точки зрения родного языка, а второе имеет прозрачную семантическую структуру: полисемия и многозначность; моцион и прогулка; орфография и правописание; оригинал и подлинник; stenography и short hand; oculist и eye specialist; radio и wireless; stamina и staying power; pseudonym и pen name; telegram и wire. Появление синонимов может явиться результатом проникновения в язык иностранных слов. [40]
Словесный способ описания алгоритма отражает содержание выполняемых действий средствами естественного языка. К достоинствам этого способа описания следует отнести его общедоступность, а также возможность описывать алгоритм с любой степенью детализации. К главным недостаткам этого способа следует отнести достаточно громоздкое описание ( и, как следствие, относительно низкую наглядность), отсутствие строгой формализации в сил у не однозначности восприятия естественного языка, вытекающего из свойств синонимии, омонимии, полисемии. [41]
Под тезаурусом в данном случае понимается словарь-справочник, в котором перечислены все лексические единицы ИПЯ ( дескрипторы), а также синонимичные им ключевые слова и словосочетания естественного языка. Кроме того, в тезаурусе должны быть выражены базисные ( родовидовые и ассоциативные) отношения между дескрипторами. Введение таких базисных отношений не только значительно облегчает процедуру правильного выражения содержания документов или информационных запросов в терминах ИПЯ, но и позволяет производить их избыточное индексирование. Синонимия, омонимия и полисемия дескрипторов в ИПЯ устраняется лексикографически, то есть при помощи системы соответствующих помет. [42]
Формализация как метод имеет ряд достоинств. Во-первых, формализация обеспечивает полноту обозрения определенной области проблем, обобщенность подхода к их решению. Во-вторых, она базируется на использовании специальной символики, введение которой обеспечивает краткость и четкость фиксации знания. В-третьих, формализация связана с приписыванием отдельным символам или их системам определенных значений, что позволяет избежать многозначности терминов ( или полисемии), которая свойственна обычным языкам. Поэтому при оперировании с формализованными системами рассуждения отличаются четкостью и строгостью, а выводы - доказательностью. В-четвертых, формализация позволяет формировать знаковые модели объектов и изучение реальных вещей и процессов заменять изучением этих моделей. Этим достигается упрощение объекта непосредственного исследования, что в значительной мере облегчает решение познавательных задач. [43]
Полисемия является и защитным свойством памяти человека. В резидентной модели предполагается, что слова и некоторые другие знаки являются в памяти человека именами файлов, содержащих их различные значения. Часть этих имен постоянно ( резидентно) содержится в памяти. В малособытийной жизни объем резидентной памяти оказывается достаточным для присвоения имени любому предмету и событию. Поэтому для языков реликтовых этносов не характерна полисемия. Объем резидентной памяти недостаточен для ориентации в современном потоке информации. Следствием является появление полисемии как адаптивного свойства человека, благодаря которому он приспосабливает усвоенный им запас слов к новым условиям при радикальном изменении вида своей деятельности. В памяти под одним именем содержатся различные значения слов. Предполагается, что они упорядочены согласно частоте их употребления данным человеком. В этом случае смена вида деятельности приводит к перестановкам в файле и смене резидентного значения слова. [44]
Устранение полисемии отобранных для тезауруса ключевых слов производится при помощи тех же лексикографических средств, какие применяются для снятия омонимии этих слов. В тезаурусе каждое многозначное ключевое слово обязательно снабжается пояснительной пометой. Эта помета разъясняет, в каком именно значении данное ключевое слово используется в искусственном ИПЯ. Если многозначное ключевое слово включается в тезаурус не в одном, а в нескольких своих значениях, то для каждого такого значения ключевого слова в ИПЯ строится новое слово, которое в написании не совпадает с исходным словом. Для этого к исходному ключевому слову приписывается специфичный индекс. Другой возможный метод устранения полисемии - замена семантических вариантов многозначного ключевого слова в ИПЯ однозначными словосочетаниями, как это делается при снятии омонимии. [45]