Cтраница 1
Говорящие машины - устройства, позволяющие получать звуки речи при подаче на вход обычно достаточно простых условных сигналов. Простейшие устройства основаны на принципе воспроизведения звукозаписи необходимых слов, причем соответствующая воспроизводящая система запускается определенным электрическим сигналом. Например, набором определенного номера с помощью телефонного аппарата можно услышать, каково время, соответствующее моменту вызова. Голос, произносящий число часов, предварительно записан на одном сигналоно-сителе, а число минут - на другом. Автоматическое последовательное воспроизведение сокращает число необходимых записей. В более сложных устройствах получаемое звуковое сообщение может быть скомбинировано из большего числа слов. Словарный запас этих машин значительно увеличен. [1]
Говорящие машины - устройства, позволяющие получать звуки речи при подаче на вход достаточно простых условных сигналов. [2]
Еще один тип говорящей машины используется в составе телефонной системы. В этом случае говорящую машину выгодно применять потому, что она требует меньше входной информации в единицу времени ( в бит / сек), чем это необходимо при прямой передаче речи по телефону. В результате появляется возможность экономии при создании каналов связи - можно использовать более дешевые телефонные кабели и другое оборудование. Системы передачи речи такого типа известны как системы анализ - синтез или как вокодер ( сокращение от кодировка голоса) и были описаны еще в 1939 году Хомером Дадли, сотрудником фирмы Белл. Наиболее существенным качеством этой системы является простота получения управляющих сигналов по входной речи абонента, причем скорость их получения должна совпадать со скоростью речи при нормальном разговоре. [3]
Из всех типов говорящих машин наибольшее впечатление производит говорящая ЭВМ. [4]
Существует один тип говорящей машины, который фактически удовлетворяет двум указанным выше условиям и, тем не менее, весьма прост. Этот тип машины содержит небольшой словарь - из слов, первоначально произнесенных человеком, которые записаны на магнитном барабане. Управляющая информация воздействует на переключатели и с их помощью определяет-какое слово из словаря должно быть воспроизведено. Если словарь такой машины состоит, например, из 64 ( 2е) слов, то потребуется всего лишь 6 бит информации для того, чтобы определить, какое слово должно быть воспроизведено в данный момент; если скорость речи составляет три слова в секунду, то скорость передачи управляющей информации составит 18 бит в секунду. Очевидно, это удовлетворяет второму требованию, предъявляемому к говорящей машине. Первое условие - должны воспроизводиться только звуки речи - удовлетворяется соответствующим выбором записей в словаре. [5]
Известно много попыток создать говорящие машины. Идея, лежащая в основе подобных попыток, сводится к отысканию пути консервирования звука: сначала записать некие знаки, подобные нотам, а затем по этим знакам воспроизвести сами звуки. Именно по этому пути пошло человечество для сохранения музыкальных произведений. [6]
Действительно сложные проблемы возникают не при создании говорящей машины, а при совершенствовании разговора между машиной и человеком. Хотя для решения этой проблемы, несомненно, потребуется много лет, такое направление исследований существует уже сегодня. Одна из трудностей состоит в том, чтобы создать устройство, которое надежно и без ошибок воспринимало бы нормальную человеческую речь. Не так давно, в апреле 1968 г., профессор университетского колледжа в Лондоне Д. Б. Фрай сказал, что, по его мнению, это может оказаться недостижимым. [7]
Такой механизм, конечно, далек от подлинной говорящей машины - не просто магнитофона, соединенного с телефоном или громкоговорителем, а самостоятельно воспроизводящей звуки речи, подобно голосовому аппарату человека. Чтобы добиться успеха, предстоит создать более правильную модель горла и языка. [8]
Как это ни странно, но в наше время техническая мысль опять вернулась к говорящим машинам, конечно, на совершенно ином уровне техники и для других целей. Недавно грузинские кибернетики создали устройство, которое под управлением электронной вычислительной машины монотонным голосом произносит целые фразы. Когда я впервые слушал речь этого устройства ( она воспроизводилась в одной из передач Всесоюзного радио), то был поражен совершенством искусственной речи. [9]
Как это ни странно, но в наше время техническая мысль опять вернулась к говорящим машинам, конечно, на совершенно ином уровне техники и для других целей. Не так давно грузинские кибернетики создали устройство, которое под управлением электронной вычислительной машины монотонным голосом произносит целые фразы. Когда я впервые слушал речь этого устройства ( она воспроизводилась в одной из передач Всесоюзного радио), то был поражен совершенством искусственной речи. Устройство, которое они спроектировали и построили - очень нужное. [10]
При конструировании резонансной системы можно использовать много различных технических решений, и их выбор зависит от назначения говорящей машины. Если машина строится главным образом для целей исследования речи и функционирования речево / о аппарата человека, то требуется близкое соответствие между узлами модели и частями человеческой голосовой системы. В этом случае, обычно, голосовой тракт имитируется с помощью большого числа связанных между собой коротких секций - трубок, у каждой из которых тщательно подбирается поперечное сечение. Каждая секция может быть достаточно точно имитирована электрически с помощью катушки индуктивности и емкости соответствующей величины. Такая модель голосового тракта представляет собой неоднородную электрическую линию передачи. Недостаток ее состоит в том, что для хорошей имитации необходимо более 30 отдельных секций линии, причем параметры каждой секции должны изменяться во времени независимо, чтобы соответствовать размерам сечения голосового тракта в соответствующих точках в процессе речи. [11]
Автомат находит ответ в своем постоянно обновляемом справочнике цен, а затем отвечает по телефону с помощью говорящей машины описанного типа. [12]
Разнообразные методы ограничения и комп-андирования речевых сигналов, основанные на изучении свойств этих сигналов и их слухового восприятия, имеют большое практическое значение для увеличения пропускной способности систем телефонной связи, повышения их помехоустойчивости и специального кодирования речевых сигналов при создании механизмов, реагирующих на голос оператора, и говорящих машин. [13]
Несмотря на примитивность первого такого аппарата и его несовершенство, он давал возможность довольно разборчиво воспроизводить передаваемую речь, хотя в ней и недоставало присущей живой речи естественности и более тонких оттенков и признаков. Современные говорящие машины, делящие передаваемую речь на 100 и большее число усредненных полосок, позволяют значительно точнее и натуральнее воспроизводить речь, управляемую сигналами, которые за счет сокращения повторяющихся элементов звучания спрессованы в 5 и даже в Ю раз. [14]
Еще один тип говорящей машины используется в составе телефонной системы. В этом случае говорящую машину выгодно применять потому, что она требует меньше входной информации в единицу времени ( в бит / сек), чем это необходимо при прямой передаче речи по телефону. В результате появляется возможность экономии при создании каналов связи - можно использовать более дешевые телефонные кабели и другое оборудование. Системы передачи речи такого типа известны как системы анализ - синтез или как вокодер ( сокращение от кодировка голоса) и были описаны еще в 1939 году Хомером Дадли, сотрудником фирмы Белл. Наиболее существенным качеством этой системы является простота получения управляющих сигналов по входной речи абонента, причем скорость их получения должна совпадать со скоростью речи при нормальном разговоре. [15]