Объем - словарь - Большая Энциклопедия Нефти и Газа, статья, страница 3
Единственный способ удержать бегущую лошадь - сделать на нее ставку. Законы Мерфи (еще...)

Объем - словарь

Cтраница 3


При составлении словаря способом переполнения исходный текст также просматривается только один раз. Словарь формируется в виде непрерывного массива, который по мере появления новых элементов увеличивается в объеме и постепенно заполняет все отведенное для него поле оперативной памяти. В дальнейшем часть элементов словаря постоянно вытесняется за границы этого поля и переписывается на магнитную ленту, так что объем словаря сохраняется постоянным. По окончании просмотра текста содержимое оперативной памяти выдается на печать в качестве первого участка словаря, а на магнитной ленте оказывается массив элементов словаря, не вошедших в этот участок.  [31]

Более того, авторы этой книги пользовались спеллером, выдававшим еще и списки синонимов и предупреждавших, что одно и то же слово повторяется в тексте достаточно часто. Если при проверке правописания слово не найдено в словаре, но пользователь уверен в том, что данное слово написано правильно, то он может ввести его в словарь. Практика показывает, что для человека, работающего в своей конкретной области, после нескольких сеансов работы со спеллером уже не возникает недоразумений, связанных с тем, что объем словаря слишком мал: система усваивает лексикон пользователя и быстро оказывается подстроенной под него. Программы проверки правописания являются незаменимыми для поиска опечаток. Практика показывает, что на 10 страницах текста обычно находится от двух до пяти опечаток, которые трудно обнаружить классическим методом просмотра.  [32]

Проведен анализ текстов 4200 книг ( 1 3 млн. стр. Нефть и газ общим объемом около 192 млн. слов. Зависимость количества анализируемого текста и количества слов с учетом повторяемости позволяет предположить, что для автоматического составления полного словаря необходимое прогнозируемое количество электронных книг - около 10 тыс.; объем словаря будет составлять 450 тыс. слов и словоформ.  [33]

Развитие вычислительной техники, се широкое внедрение в различных областях народного хозяйства ставит перед исследователями проблему реализации речевого диалога, позволяющего человеку общаться с вычислительной системой в наиболее привычной для него форме. Для реализации речевого диалога необходимо создать системы надежного распознавания и качественного синтеза речевых образов. В последнее десятилетие широким фронтом ведутся исследования по созданию таких систем. В настоящее время в СССР [1, 2] и за рубежом ( в основном в США, Японии, ФРГ и Франции) созданы системы распознавания речевых образов слов. Объем словаря в этих системах колеблется от 200 до 1000 слов.  [34]

В этом параграфе будет описано состояние и перспективы развития системы ПОЭТ. Выбор именно этой системы не является случайным. Автору не известно другой действующей в настоящее время системы, которую можно было бы отнести к промышленным СЕЯ. Указанное обстоятельство совершенно не означает, что в ПОЭТ решены все проблемы общения. Первая очередь системы ПОЭТ разработана и находится в эксплуатации с ноября 1977 года. Трудоемкость разработки математического обеспечения системы составляет 50 человеко-лет, а информационного обеспечения 15 - т - 20 человеко-лет. Уместно отметить, что трудозатраты на МО не зависят от объема словаря системы, а трудозатраты на ПО находятся в прямой зависимости от объема словаря и количества хранимых в системе фактов. ПОЭТ); 4) база данных имеет фиксированный формат, ограничивающий тематику общения; 5) система не может при непонимании ею запроса направить пользователя в процессе перифраза.  [35]

В этом параграфе будет описано состояние и перспективы развития системы ПОЭТ. Выбор именно этой системы не является случайным. Автору не известно другой действующей в настоящее время системы, которую можно было бы отнести к промышленным СЕЯ. Указанное обстоятельство совершенно не означает, что в ПОЭТ решены все проблемы общения. Первая очередь системы ПОЭТ разработана и находится в эксплуатации с ноября 1977 года. Трудоемкость разработки математического обеспечения системы составляет 50 человеко-лет, а информационного обеспечения 15 - т - 20 человеко-лет. Уместно отметить, что трудозатраты на МО не зависят от объема словаря системы, а трудозатраты на ПО находятся в прямой зависимости от объема словаря и количества хранимых в системе фактов. ПОЭТ); 4) база данных имеет фиксированный формат, ограничивающий тематику общения; 5) система не может при непонимании ею запроса направить пользователя в процессе перифраза.  [36]



Страницы:      1    2    3