Они всё понимают

Они всё понимают

В № 1 (446) газеты «За рубежом» за 1969 год была опубликована статья «Машина читает Гомера». В ней рассказывалось, как компьютер анализировал тексты античных поэм и какие выводы из этого получились.


Машина должна была помочь с разгадкой, кто же на самом деле создавал эти произведения: «В течение последних пятидесяти лет специалисты по древним греческим текстам утверждали, что «Гомер» в действительности – общее имя по крайней мере шести различных авторов».

 

Благодаря компьютерному анализу появилась возможность опровергнуть бытующее мнение: «На недавнем конгрессе Международной федерации по обработке научной информации, состоявшемся в Эдинбурге, доктор Мортон заявил, что анализ 250 тысяч слов Гомера, проведённый с помощью электронно-вычислительной машины, убеждает в идентичности стихотворца».

 

Доктор Мортон и профессор электронной техники при Эдинбургском университете Сидней Михалсон сравнили 300 слов из 15-й главы «Одиссеи» с другими отрывками этой же поэмы и «Илиады»: «Данные, полученные электронно-вычислительной машиной после анализа длины и структуры предложений, указывают на идентичность текста Гомера во всём произведении. Статистически было бы невозможно получить одни и те же результаты, если бы текст принадлежал разным авторам».

 

В статье отмечалось, что хоть Гомер и использовал в своих произведениях исторический и мифологический материал, он никогда не воспроизводил его дословно, а редактировал и обрабатывал, формируя свой собственный стиль. Для того чтобы доказать, что идентичность стиля не является результатом использования стихотворной формы текста, ученые подвергли анализу отрывки из произведений Эзиода и Арата. Размеры их строф и другие лингвистические характеристики оказались разными.

 

Проверить данные анализа можно было с помощью каталога с указанием строф и стилевых совпадений в произведениях Гомера: «Этот метод позволяет определить нетождественность текстов и стиля даже в отрывках, не превышающих по размеру 10 строк. Полный каталог четверти миллиона слов Гомера был составлен электронно-вычислительной машиной «Атлас» всего за 30 секунд. Для выполнения такой работы учёному-специалисту понадобилось бы больше года».

 

«Эволюция» навыков работы компьютеров с текстами продолжилась и дальше. Компьютерная лингвистика, зародившаяся в 1950-х годах, сегодня решает целый ряд прикладных задач. Одна из них – перевод текстов. Если сначала автоматические приложения в лучшем случае могли осилить лишь несколько слов, то сейчас получить вполне связный перевод нужного отрывка уже не является такой большой проблемой, как минимум, если речь идёт об английском и других распространённых языках. Технология перевода получила своё развитие в коллаборации с синтезом речи. Так, компания «Яндекс» пару лет назад запустила закадровый перевод видео. Посмотреть с русской озвучкой теперь можно любой англоязычный ролик.

 

До этого Google представила технологию синхронного перевода устной речи Translatotron. Программа слушает человеческую речь и переводит её на другой язык, минуя этап транскрибирования и машинного перевода и сохраняя при этом интонацию говорящего. В будущем подобный сервис станет еще одним шагом на пути к снятию языкового барьера.

 

Перевод, распознавание и синтез речи – это еще не все направления, по которым работает компьютерная лингвистика. Другая ее задача – автореферирование, то есть создание краткой аннотации, или реферата, документа. Сейчас эта технология используется в том числе и в интернете. В браузерах начала появляться функция краткого пересказа страницы, это должно сэкономить время пользователя: предоставить ему выжимку текста, например для ответа на конкретный вопрос или решения какой-то проблемы. Подобную опцию имеют также новостные агрегаторы, которые собирают информацию из разных источников, предлагая пользователю на выбор сразу несколько ресурсов, где можно прочитать полный текст.

 

Компьютерная лингвистика также облегчает жизнь людей с инвалидностью. Технологии помогают неговорящим преобразовывать текст в речь, а незрячие пользуются устройствами, которые читают вслух текстовую информацию.

 

Работа компьютера с устной и письменной речью – одно из самых перспективных направлений развития технологий. Появление генеративных нейросетей и других разработок на их основе только подтверждает, что взаимодействие человека с машиной становится всё теснее.


Сергей Меляхов

В иллюстрации использовано фото с сайта https://unsplash.com/ и изображение из архива редакции

24.11.2023
Важное

Заголовок: «Компьютер и мозг».

Номер и дата выпуска: 38 (639), 1972 год.

Источник: газета «За рубежом».

23.02.2024 13:00:00

Продолжение книги экс-Генерального секретаря ШОС, доктора политологии Рашида Алимова.

23.02.2024 09:00:00

На фото: Земля с расстояния 6 миллиардов километров (белая точка в луче справа).
Космическое пространство, 6 июня 1990 год.
Фотограф: «Вояджер-1»
Источник: visibleearth.nasa.gov

22.02.2024 16:00:00

Африканский средний класс сталкивается с вызовами и проблемами, связанными с колониальным наследием и влиянием западного мировоззрения.

22.02.2024 13:00:00
Другие Фото

На фото: Императрица Китая Вань Жун курит в компании своего супруга, императора Китая Айсиньгёро Пу И.
Китай, 1930 год.
Фотограф: неизвестен
Источник: getarchive.net

На фото: Мать с ребенком.
Япония, Токио, конец 19 века.
Фотограф: Матуши Накаджима
Источник: flickr.com

На фото: Народный комиссар обороны СССР К. Е. Ворошилов на Красной площади.
СССР, Москва, 1928 год.
Фотограф: Дмитрий Дебабов
Источник: Wikimedia Commons

На фото: Золотая пластинка с пояснениями для внеземной цивилизации.
США, 1977 год.
Фотограф: Не указан
Источник: Wikimedia Commons