Они всё понимают

Они всё понимают

В № 1 (446) газеты «За рубежом» за 1969 год была опубликована статья «Машина читает Гомера». В ней рассказывалось, как компьютер анализировал тексты античных поэм и какие выводы из этого получились.


Машина должна была помочь с разгадкой, кто же на самом деле создавал эти произведения: «В течение последних пятидесяти лет специалисты по древним греческим текстам утверждали, что «Гомер» в действительности – общее имя по крайней мере шести различных авторов».

 

Благодаря компьютерному анализу появилась возможность опровергнуть бытующее мнение: «На недавнем конгрессе Международной федерации по обработке научной информации, состоявшемся в Эдинбурге, доктор Мортон заявил, что анализ 250 тысяч слов Гомера, проведённый с помощью электронно-вычислительной машины, убеждает в идентичности стихотворца».

 

Доктор Мортон и профессор электронной техники при Эдинбургском университете Сидней Михалсон сравнили 300 слов из 15-й главы «Одиссеи» с другими отрывками этой же поэмы и «Илиады»: «Данные, полученные электронно-вычислительной машиной после анализа длины и структуры предложений, указывают на идентичность текста Гомера во всём произведении. Статистически было бы невозможно получить одни и те же результаты, если бы текст принадлежал разным авторам».

 

В статье отмечалось, что хоть Гомер и использовал в своих произведениях исторический и мифологический материал, он никогда не воспроизводил его дословно, а редактировал и обрабатывал, формируя свой собственный стиль. Для того чтобы доказать, что идентичность стиля не является результатом использования стихотворной формы текста, ученые подвергли анализу отрывки из произведений Эзиода и Арата. Размеры их строф и другие лингвистические характеристики оказались разными.

 

Проверить данные анализа можно было с помощью каталога с указанием строф и стилевых совпадений в произведениях Гомера: «Этот метод позволяет определить нетождественность текстов и стиля даже в отрывках, не превышающих по размеру 10 строк. Полный каталог четверти миллиона слов Гомера был составлен электронно-вычислительной машиной «Атлас» всего за 30 секунд. Для выполнения такой работы учёному-специалисту понадобилось бы больше года».

 

«Эволюция» навыков работы компьютеров с текстами продолжилась и дальше. Компьютерная лингвистика, зародившаяся в 1950-х годах, сегодня решает целый ряд прикладных задач. Одна из них – перевод текстов. Если сначала автоматические приложения в лучшем случае могли осилить лишь несколько слов, то сейчас получить вполне связный перевод нужного отрывка уже не является такой большой проблемой, как минимум, если речь идёт об английском и других распространённых языках. Технология перевода получила своё развитие в коллаборации с синтезом речи. Так, компания «Яндекс» пару лет назад запустила закадровый перевод видео. Посмотреть с русской озвучкой теперь можно любой англоязычный ролик.

 

До этого Google представила технологию синхронного перевода устной речи Translatotron. Программа слушает человеческую речь и переводит её на другой язык, минуя этап транскрибирования и машинного перевода и сохраняя при этом интонацию говорящего. В будущем подобный сервис станет еще одним шагом на пути к снятию языкового барьера.

 

Перевод, распознавание и синтез речи – это еще не все направления, по которым работает компьютерная лингвистика. Другая ее задача – автореферирование, то есть создание краткой аннотации, или реферата, документа. Сейчас эта технология используется в том числе и в интернете. В браузерах начала появляться функция краткого пересказа страницы, это должно сэкономить время пользователя: предоставить ему выжимку текста, например для ответа на конкретный вопрос или решения какой-то проблемы. Подобную опцию имеют также новостные агрегаторы, которые собирают информацию из разных источников, предлагая пользователю на выбор сразу несколько ресурсов, где можно прочитать полный текст.

 

Компьютерная лингвистика также облегчает жизнь людей с инвалидностью. Технологии помогают неговорящим преобразовывать текст в речь, а незрячие пользуются устройствами, которые читают вслух текстовую информацию.

 

Работа компьютера с устной и письменной речью – одно из самых перспективных направлений развития технологий. Появление генеративных нейросетей и других разработок на их основе только подтверждает, что взаимодействие человека с машиной становится всё теснее.


Сергей Меляхов

В иллюстрации использовано фото с сайта https://unsplash.com/ и изображение из архива редакции

24.11.2023
Важное

Политические разногласия могут застопорить проект строительства общенационального музея в Теруэле.

14.09.2024 13:00:00

Южная Корея построит собственный Голливуд, чтобы привлечь поклонников K-Pop-музыки и дорам.

14.09.2024 09:00:00

Внедрение ИИ на Филиппинах приведет к сокращению около 300 тысяч рабочих мест в течение пяти лет.

13.09.2024 17:00:00
Другие Фото

На фото: американский инженер Роберт Робинсон на заводе в Сталинграде.
СССР, начало 1930-х годов.
Фотограф: С. Вейнеерг
Источник: архив газеты «Вечерняя Москва»

Заголовок: «Откуда появляются льды».
Номер и дата выпуска: № 3 (604)  14 - 20 апреля 1972 г.  
Источник: газета «За рубежом».

Автор: Мишель Фабр.
Источник: газета «За рубежом».
Номер и дата выпуска: 14 (615), 31 марта - 6 апреля, 1972 г.

Источник: газета «За рубежом».

Номер и дата выпуска: 8 (401), 16 — 22 февраля 1968 г.