Почему искусственный интеллект пока не может заменить переводчика?

Со времени написания этого текста прошло не так много времени, однако мир информационных технологий меняется с такой скоростью, что мы порой не успеваем следить за всеми изменениями. Я решил не обновлять текст полностью, но внес небольшие поправки и дополнения, чтобы вы могли оценить перемены произошедшие за столь короткий срок.

Время от времени я захожу в Сообщество Google Переводчика, делаю, как мне кажется, доброе дело – помогаю людям и машинам переводить случайные фразы, преследуя при этом, конечно, своекорыстные цели: там часто попадаются прелюбопытные идеи для английского и немецкого словарных тренажеров.

И вот не так давно я, как участник сообщества, получил от Google письмо с довольно громким заявлением. Всемирный поисковик анонсировал внедрение самых современных технологий в Гугл переводчике. Вот фрагмент этого письма:

Недавно в сервисе "Google Переводчик" произошли изменения более важные, чем за предыдущие десять лет. И Вы тоже внесли свой вклад!

Google Переводчик начал использовать нейронные сети для 41 языка, включая русский. Нейронные сети – это самообучающиеся системы. Они основаны на сложных алгоритмах, которые имитируют процесс изучения языка человеком и позволяют значительно повысить качество перевода. Улучшения наиболее заметны при переводе фраз и больших текстов. Попробуйте!

Долгожданная революция в мире машинного перевода уже свершилась?

Несомненно, прогресс грандиозный, пожалуй, это даже можно назвать революцией, качество переводов реально улучшилось, но о полном торжестве искусственного разума над человеческим пока говорить преждевременно.

В основе самообучающихся систем – нейронные сети, именно их сейчас гордо именуют искусственным интеллектом. Технология ворвалась в сферу IT из биологии и развилась во многом благодаря детальному изучению работы человеческого мозга (хотя и он еще до конца не изучен).

Говоря об искусственном интеллекте, нередко подразумевают general intelligence, то есть интеллект, соответствующий подобный человеческому. На самом деле технологии еще довольно далеки от этого, поэтому пока в англоязычных источниках его называют general artificial intelligence (универсальный искусственный интеллект).

После такого вступления будет, пожалуй, уместно оглянуться назад и вспомнить как развивалась технология машинного перевода. А чтобы это не было скучным, мы не только сделаем экскурс в историю, но попутно проверим современные (на момент написания статьи) достижения компьютерного перевода: в левой колонке оригинал текста, а в правой результат перевода (Google Translate) сначала на английский, а затем обратно на русский.

Оригинал После перевода на английский и обратно

Первая публичная демонстрация машинного перевода была проведена еще в середине пятидесятых годов двадцатого века и тогда казалось, что еще чуть-чуть и профессия переводчика уйдет в небытие навсегда. Но этого почему-то не произошло.

После неутешительных (из-за слабой производительности компьютеров) результатов наступил период пессимизма и, как следствие, снижение финансирования отрасли. Технология получила вторую жизнь в конце двадцатого века, когда информационный бум захлестнул весь мир, а компьютер стал обычным дополнением домашнего хозяйства, но революции не случилось.

В 21-м веке существенно увеличились вычислительные мощности, технологии продвинулись вперед и мы уже воспринимаем компьютерный перевод, как нечто само собой разумеющееся. Машины помогают нам в работе и на отдыхе, но пока все еще не дотягивают до уровня переводов выполненных представителем Homo Sapiens.

Первая публичная демонстрация машинного перевода была проведена в середине 50-х годов ХХ века, и тогда казалось, что даже немного и профессия переводчика навсегда останется в забвении. Но этого почему-то не произошло.

После разочарования (из-за плохой работы компьютера), результаты пришли в период пессимизма и, как следствие, сокращение финансирования отрасли. Технология получила вторую жизнь в конце двадцатого века, когда информационный бум охватил весь мир, и компьютер стал регулярным дополнением к домашнему хозяйству, но революции не произошло.

В 21-м веке вычислительная мощность значительно возросла, технологии продвинулись вперед, и мы уже воспринимаем компьютерный перевод как само собой разумеющееся. Автомобили(?!) помогают нам в работе и в отпуске, но пока они все еще не достигают уровня трансфертов представителя Homo Sapiens.

В целом, если сравнивать с переводами десятилетней давности, очень даже неплохо, но нужно учитывать, что это перевод на английский и обратно, другие языки пока отстают.

Напомню, что перевод был выполнен несколько лет назад, а вы попробуйте сделать то же самое в 2024-м году и убедитесь, что искусственный интеллект стал гораздо умнее (слово умнее пишу уже без кавычек).

Однако вернемся к нашим нейронам. В классических вычислительных машинах для обработки и анализа информации использовался определенный шаблон или, если хотите, модель, которую жестко задавал программист. Так было испокон компьютерных веков. Но вот появились нейронные сети, и все изменилось до неузнаваемости. Теперь программист задает только алгоритм обучения, а дальше компьютер сам создает модели и шаблоны, на основании которых определяет, с чем он имеет дело и как к этому относиться.

Как работает нейронная сеть?

В самом упрощенном виде это выглядит так: нейронная сеть получает на входе определенные параметры (текстовые данные, звуки, изображения или числа), обрабатывает их и выдает на выходе результат. Вроде бы все как в обычной вычислительной машине, однако, в отличие от привычного нам компьютера, результат будет зависеть не от готового жесткого алгоритма, а от знаний, полученных системой в процессе обработки данных, совмещенных с обучением.

Таким образом нейронная сеть – это математическая модель, имитирующая работу человеческого мозга. Она состоит из множества элементов, называемых нейронами, которые обрабатывают и передают информацию в виде числовых сигналов. Нейроны соединены между собой с помощью связей, с определенным весом. Вес связи показывает, насколько важны данные от определенного нейрона и, в зависимости от этого, назначает степень его влияния на другие нейроны. Обучаясь на основе полученных данных нейронная сеть, корректирует веса связей в соответствии с желаемым результатом.

Это значит, что машина с каждым следующим циклом становится все «умнее» (не уверен, уместны ли здесь кавычки, но пока оставим). Полученные данные записываются в память и могут быть использованы для решения новых, более сложных задач. Впоследствии эти записи можно воспроизвести и получить совершенно неожиданные результаты. Это еще одна поражающая воображение способность технологии, позволяющая использовать ее во многих областях науки, искусства и повседневной жизни. Например, нейросеть, пройдя обучение, может рисовать картины, которым позавидуют некоторые художники или писать довольно приличную музыку. Уже сегодня мы видим в интернете множество примеров демонстрирующих такие чудесные возможности нейросетей.

Машина учится сама

Теперь компьютер сам учится распознавать образы, звуки, текст, способен отличить кошку от собаки, «рассмотреть» и узнать на картинке лицо или фигуру человека. Все это уже находит самое активное применение в системах распознавания и поиска изображений распознавания речи, при наблюдении за безопасностью в общественных местах, в системах криминалистического анализа. Машина может выслушать вас и дать вразумительный ответ на любой (ну почти любой) вопрос, легко обыгрывает в шахматы именитых гроссмейстеров. Реальная гордость разработчиков самообучающихся систем – автомобильный автопилот. Надо признать, что все это действительно значительные достижения, использующие чрезвычайно сложные вычислительные процессы. Но, кажется, мы немного увлеклись и отклонились от темы.

Так что же все-таки с переводами?

Перевод – это работа, которую с момента появления первого компьютера, люди упорно пытаются передать машине (хотя бы частично), так как этот вид деятельности, требует от человека больших затрат времени и напряженной работы мозга. Деньги здесь также играют не последнюю роль – работа хорошего переводчика стоит недешево.

Но как же сами машины относятся к переводам на другой язык? Хм..., машины относятся?! Впрочем, речь сейчас не об этом. Ну, казалось бы, что может быть проще, при современном развитии вычислительных мощностей: загружаем в базу данных весь словарь, перечисляем все сочетания слов, сравниваем введенный текст с базой и, вуаля – получаем готовый перевод, – человек-переводчик не нужен! Так почему же современные сверхмощные компьютеры, объединенные в сети, под командованием лучших программистов и переводчиков с огромными базами данных, полученных в том числе и при машинном обучении, до сих пор не могут полноценно справиться с этой задачей. И неужели различить лицо на картинке с миллионами разноцветных пикселей проще, чем перебрать словосочетания в базе данных?

Обратимся к математике

Допустим, что словарный запас среднестатистического носителя языка составляет около двадцати тысяч слов. Предположим, что не все слова могут сочетаться друг с другом, неся при этом разумный смысл, поэтому количество осмысленных словосочетаний, которые можно построить с помощью этих слов подсчитать довольно сложно.

Давайте немного упростим задачу – разделим это число на 10 (просто для примера) и получим 2000 слов. Это грубый, подчеркиваю, очень грубый расчет. Однако даже такие приблизительные вычисления показывают, что если из этих двух тысяч составлять средние предложения по пять слов, то можно получить 265335665000400 (двести шестьдесят пять триллионов триста тридцать пять миллиардов шестьсот шестьдесят пять миллионов четыреста) словосочетаний! Впечатляет, не правда ли?

Если увеличить количество слов в предложении, то увеличится и количество комбинаций, если уменьшить, то число уменьшится, но смысл предложения может при этом измениться самым неожиданным образом, а значит, и перевод станет другим. В любом случае число вариантов возрастает многократно. И все же самообучающаяся машина могла бы справиться с этой задачей. Но давайте прибавим к этому, выраженное в письменном виде отношение автора к написанному: его эмоции, иронию, неожиданный сарказм, скрытый смысл, юмор, любовь, ненависть и прочие оттенки тонких человеческих чувств, в таком случае количество вариантов устремится к бесконечности. Человеческий разум – это целая вселенная, а язык – ее продолжение. Немного упрощая, можно сказать, что при переводе машина подбирает нужные слова и словосочетания, а человек постигает смысл.

Вот почему даже самые современные компьютерные системы перевода, пока не в состоянии полностью понять человека и заменить живого переводчика, особенно если речь идет о переводах художественной литературы, не говоря уже о стихах. Но нейронные системы не стоят на месте. Они продолжают учиться и делают это довольно успешно, самостоятельно и очень быстро! Ведь, находя ответ на любой наш запрос, машина пополняет свою копилку знаний. Технология стремительно развивается, и, вероятно, не за горами время, когда системы машинного перевода смогут реально заменить людей без каких-либо оговорок, по крайней мере при переводе технических или научных текстов.

Сравним еще раз человека и машину

Признаем, что искусственный интеллект имеет определенные преимущества при переводе, например, скорость и масштабируемость. Он способен обрабатывать большие тексты в кратчайшие сроки и предлагать варианты перевода. Однако ИИ пока не способен полностью уловить все нюансы и специфику переводимых текстов, особенно в сложных областях знаний и человеческих отношений.

Живой переводчик, в свою очередь, обладает лингвистическими и культурными знаниями, способностью адаптироваться к различным контекстам и настроениям, улавливать и воспроизводить нюансы оригинального текста. Человек также способен применять свой творческий подход и принимать во внимание особые требования клиента.

Возможно, в будущем развитие ИИ приведет к улучшению автоматического перевода, позволяя решать наиболее сложные задачи в переводе. Однако человеческое вмешательство и экспертиза будут все равно оставаться востребованными для обеспечения высокого качества и точности перевода. Взаимодействие искусственного интеллекта и человека может принести наилучшие результаты.

В заключение хотелось бы упомянуть и о системах голосового перевода в реальном времени, которые непосредственно связаны с письменным переводом (к нему добавлено распознавание речи). Они уже работают и показывают вполне удовлетворительные результаты во многих онлайн переводчиках и мессенджерах. К их работе, конечно, пока можно придираться, но стандартные разговорные фразы они переводят отлично. А что еще нужно для простого человеческого общения?

Совсем недавно многое из того, что описано в этой статье, казалось чудом. Сегодня благодаря нейронным самообучающимся системам мы видим, как мир меняется на наших глазах. Компьютерный интеллект переплетается с человеческим и создает доселе невиданные возможности. Хорошо это или плохо? Сейчас идет много споров о полезности и опасности искусственного интеллекта. Сторонники и противники развития искусственного интеллекта приводят множество аргументов «за» и «против» и, надо сказать, у тех и других есть серьезные обоснованные доводы.

Конечно, прогресс остановить невозможно, да и не нужно, но давайте все-таки постараемся направлять наши усилия на то, чтобы эти захватывающие технологии несли человечеству процветание, изобилие и безопасность, а не разрушение и хаос!

Константин Михайлов

Оглавление · Слушать

Популярные темы: