Почему искусственный интеллект пока не может заменить переводчика?

Время от времени я захожу в Сообщество Google Переводчика, делаю, как мне кажется, доброе дело – помогаю людям и машинам переводить случайные фразы, преследуя при этом, конечно, своекорыстные цели: там часто попадаются прелюбопытные идеи и фразы для английского и немецкого словарных тренажёров.

И вот не так давно я, как участник сообщества, получил от Google письмо с довольно громким заявлением. Всемирный поисковик анонсировал внедрение самых современных технологий в Гугл переводчике. Вот фрагмент этого письма:

Недавно в сервисе "Google Переводчик" произошли изменения более важные, чем за предыдущие десять лет. И Вы тоже внесли свой вклад!

Google Переводчик начал использовать нейронные сети для 41 языка, включая русский. Нейронные сети – это самообучающиеся системы. Они основаны на сложных алгоритмах, которые имитируют процесс изучения языка человеком и позволяют значительно повысить качество перевода. Улучшения наиболее заметны при переводе фраз и больших текстов. Попробуйте!

Долгожданная революция в мире машинного перевода уже свершилась?

Несомненно, прогресс грандиозный, пожалуй, это даже можно назвать революцией, качество переводов реально улучшилось, но о полном торжестве искусственного разума над человеческим пока говорить преждевременно.

В основе самообучающихся систем – нейронные сети, именно их сейчас гордо именуют искусственным интеллектом. Технология ворвалась в сферу IT из биологии и развилась во многом благодаря детальному изучению работы человеческого мозга (хотя и он ещё до конца не изучен).

Говоря об искусственном интеллекте, нередко подразумевают general intelligence, то есть интеллект, соответствующий подобный человеческому. На самом деле технологии ещё довольно далеки от этого, поэтому пока в англоязычных источниках его называют general artificial intelligence (универсальный искусственный интеллект).

После такого вступления будет, пожалуй, уместно оглянуться назад и вспомнить как развивалась технология машинного перевода. А чтобы это не было скучным, мы не только сделаем экскурс в историю, но попутно проверим современные (на момент написания статьи) достижения компьютерного перевода: в левой колонке оригинал текста, а в правой результат перевода (Google Translate) сначала на английский, а затем обратно на русский.

Оригинал После перевода на английский и обратно

Первая публичная демонстрация машинного перевода была проведена ещё в середине пятидесятых годов двадцатого века и тогда казалось, что ещё чуть-чуть и профессия переводчика уйдёт в небытие навсегда. Но этого почему-то не произошло.

После неутешительных (из-за слабой производительности компьютеров) результатов наступил период пессимизма и, как следствие, снижение финансирования отрасли. Технология получила вторую жизнь в конце двадцатого века, когда информационный бум захлестнул весь мир, а компьютер стал обычным дополнением домашнего хозяйства, но революции не случилось.

В 21-м веке существенно увеличились вычислительные мощности, технологии продвинулись вперёд и мы уже воспринимаем компьютерный перевод, как нечто само собой разумеющееся. Машины помогают нам в работе и на отдыхе, но пока всё ещё не дотягивают до уровня переводов выполненных представителем Homo Sapiens.

Первая публичная демонстрация машинного перевода была проведена в середине 50-х годов ХХ века, и тогда казалось, что даже немного и профессия переводчика навсегда останется в забвении. Но этого почему-то не произошло.

После разочарования (из-за плохой работы компьютера), результаты пришли в период пессимизма и, как следствие, сокращение финансирования отрасли. Технология получила вторую жизнь в конце двадцатого века, когда информационный бум охватил весь мир, и компьютер стал регулярным дополнением к домашнему хозяйству, но революции не произошло.

В 21-м веке вычислительная мощность значительно возросла, технологии продвинулись вперёд, и мы уже воспринимаем компьютерный перевод как само собой разумеющееся. Автомобили(?!) помогают нам в работе и в отпуске, но пока они все ещё не достигают уровня трансфертов представителя Homo Sapiens.

В целом, если сравнивать с переводами десятилетней давности, очень даже неплохо, но нужно учитывать, что перевод был сделан на английский и обратно, другие языки пока отстают. Однако вернёмся к нашим нейронам.

В классических вычислительных машинах для обработки и анализа информации использовался определённый шаблон или, если хотите, модель, которую жёстко задавал программист. Так было испокон компьютерных веков. Но вот появились нейронные сети, и всё изменилось до неузнаваемости. Теперь программист задаёт только алгоритм обучения, а дальше компьютер сам создаёт модели и шаблоны, на основании которых определяет, с чем он имеет дело и как к этому относиться.

Как работает нейронная сеть?

В самом упрощённом виде это выглядит так: нейронная сеть получает на входе определённые параметры (текстовые данные, звуки, изображения или числа), обрабатывает их и выдаёт на выходе результат. Вроде бы все как в обычной вычислительной машине, однако, в отличие от привычного нам компьютера, результат будет зависеть не от готового жёсткого алгоритма, а от знаний, полученных системой в процессе обработки данных, совмещённых с обучением.

Таким образом нейронная сеть – это математическая модель, имитирующая работу человеческого мозга. Она состоит из множества элементов, называемых нейронами, которые обрабатывают и передают информацию в виде числовых сигналов. Нейроны соединены между собой с помощью связей, с определённым весом. Вес связи показывает, насколько важны данные от определённого нейрона и, в зависимости от этого, назначает степень его влияния на другие нейроны. Обучаясь на основе полученных данных нейронная сеть, корректирует веса связей в соответствии с желаемым результатом.

Это значит, что машина с каждым следующим циклом становится всё «умнее» (не уверен, уместны ли здесь кавычки, но пока оставим). Полученные данные записываются в память и могут быть использованы для решения новых, более сложных задач. Впоследствии эти записи можно воспроизвести и получить совершенно неожиданные результаты. Это ещё одна поражающая воображение способность технологии, позволяющая использовать её во многих областях науки, искусства и повседневной жизни. Например, нейросеть, пройдя обучение, может рисовать картины, которым позавидуют некоторые художники или писать довольно приличную музыку. Уже сегодня мы видим в интернете множество примеров демонстрирующих такие чудесные возможности нейросетей.

Машина учится сама

Теперь компьютер сам учится распознавать образы, звуки, текст, способен отличить кошку от собаки, «рассмотреть» и узнать на картинке лицо или фигуру человека. Всё это уже находит самое активное применение в системах распознавания и поиска изображений распознавания речи, при наблюдении за безопасностью в общественных местах, в системах криминалистического анализа. Машина может выслушать вас и дать вразумительный ответ на любой (ну почти любой) вопрос, легко обыгрывает в шахматы именитых гроссмейстеров. Реальная гордость разработчиков самообучающихся систем – автомобильный автопилот. Надо признать, что всё это действительно значительные достижения, использующие чрезвычайно сложные вычислительные процессы. Но, кажется, мы немного увлеклись и отклонились от темы.

Так что же всё-таки с переводами?

Перевод – это работа, которую с момента появления первого компьютера, люди упорно пытаются передать машине (хотя бы частично), так как этот вид деятельности, требует от человека больших затрат времени и напряжённой работы мозга. Деньги здесь также играют не последнюю роль – работа хорошего переводчика стоит недёшево.

Но как же сами машины относятся к переводам на другой язык? Хм..., машины относятся?! Впрочем, речь сейчас не об этом. Ну, казалось бы, что может быть проще, при современном развитии вычислительных мощностей: загружаем в базу данных весь словарь, перечисляем все сочетания слов, сравниваем введённый текст с базой и, вуаля – получаем готовый перевод, – человек-переводчик не нужен! Так почему же современные сверхмощные компьютеры, объединённые в сети, под командованием лучших программистов и переводчиков с огромными базами данных, полученных в том числе и при машинном обучении, до сих пор не могут полноценно справиться с этой задачей. И неужели различить лицо на картинке с миллионами разноцветных пикселей проще, чем перебрать словосочетания в базе данных?

Обратимся к математике

Допустим, что словарный запас среднестатистического носителя языка составляет около двадцати тысяч слов. Предположим, что не все слова могут сочетаться друг с другом, неся при этом разумный смысл, поэтому количество осмысленных словосочетаний, которые можно построить с помощью этих слов подсчитать довольно сложно.

Давайте немного упростим задачу – разделим это число на 10 (просто для примера) и получим 2000 слов. Это грубый, подчёркиваю, очень грубый расчёт. Однако даже такие приблизительные вычисления показывают, что если из этих двух тысяч составлять средние предложения по пять слов, то можно получить 265335665000400 (двести шестьдесят пять триллионов триста тридцать пять миллиардов шестьсот шестьдесят пять миллионов четыреста) словосочетаний! Впечатляет, не правда ли?

Если увеличить количество слов в предложении, то увеличится и количество комбинаций, если уменьшить, то число уменьшится, но смысл предложения может при этом измениться самым неожиданным образом, а значит, и перевод станет другим. В любом случае число возрастает многократно. Но с этой математикой машина могла бы справиться. Но если мы добавим к этому, выраженное в письменном виде отношение автора к написанному, его эмоции, иронию, неожиданный сарказм, юмор, любовь, ненависть и прочие оттенки тонких человеческих чувств, то количество вариантов устремится к бесконечности. Человеческий разум – это целая вселенная, а язык – её продолжение. Можно сказать, что при переводе человек постигает смысл, а машина подбирает нужные слова и словосочетания.

Вот почему даже самые современные компьютерные системы перевода, пока не в состоянии полностью понять человека и заменить живого переводчика, особенно, если мы говорим о переводах художественной литературы, не говоря уже о стихах. Но нейронные системы не стоят на месте. Они продолжают учиться и делают это довольно успешно, самостоятельно и очень быстро! Ведь, находя ответ на любой наш вопрос, машина пополняет свою копилку знаний. Технология стремительно развивается, и, вероятно, не за горами время, когда системы машинного перевода смогут реально заменить людей без каких-либо оговорок, по крайней мере при переводе технических или научных текстов.

Сравним ещё раз человека и машину

Признаем, что искусственный интеллект имеет определённые преимущества при переводе, например, скорость и масштабируемость. Он способен обрабатывать большие тексты в кратчайшие сроки и предлагать варианты перевода. Однако ИИ пока не способен полностью уловить все нюансы и специфику переводимых текстов, особенно в сложных областях знаний и человеческих отношений.

Живой переводчик, в свою очередь, обладает лингвистическими и культурными знаниями, способностью адаптироваться к различным контекстам и настроениям, улавливать и воспроизводить нюансы оригинального текста. Человек также способен применять свой творческий подход и принимать во внимание особые требования клиента.

Возможно, в будущем развитие ИИ приведет к улучшению автоматического перевода, позволяя решать наиболее сложные задачи в переводе. Однако человеческое вмешательство и экспертиза будут все равно оставаться востребованными для обеспечения высокого качества и точности перевода. Взаимодействие искусственного интеллекта и человека может принести наилучшие результаты.

В заключение хотелось бы упомянуть и о системах голосового перевода в реальном времени, которые непосредственно связаны с письменным переводом (к нему добавлено распознавание речи). Они уже работают и показывают вполне удовлетворительные результаты во многих онлайн переводчиках и мессенджерах. К их работе, конечно, пока можно придираться, но стандартные разговорные фразы они переводят отлично. А что ещё нужно для простого человеческого общения?

Совсем недавно многое из того, что описано в этой статье, казалось чудом. Сегодня благодаря нейронным самообучающимся системам мы видим, как мир меняется на наших глазах. Компьютерный интеллект переплетается с человеческим и создаёт доселе невиданные возможности. Хорошо это или плохо? Сейчас идёт много споров о полезности и опасности искусственного интеллекта. Сторонники и противники развития искусственного интеллекта приводят множество аргументов «за» и «против» и, надо сказать, у тех и других есть серьёзные, обоснованные доводы.

Конечно, мы не можем остановить прогресс, но давайте всё же направлять наши усилия на то, чтобы эти захватывающие технологии несли человечеству процветание, изобилие и безопасность, а не разрушение и хаос!

Константин Михайлов

Оглавление · Слушать

Популярные темы: