09:03 18 Ноября 2017
Прямой эфир
Человеческий мозг

Яндекс разработал искусственный интеллект для перевода текстов

© Фото: Fotolia/taa22
В мире
Получить короткую ссылку
5010

Новая система "Яндекса" переводит с английского на русский язык. Но вскоре компания начнет добавлять другие языковые пары и в течение нескольких месяцев реализует поддержку большинства самых популярных языков, рассказали в пресс-службе компании.

СУХУМ, 14 сен — Sputnik. Специалисты "Яндекса" создали новую систему онлайн-перевода, которая одновременно использует и старые статистические алгоритмы, и искусственный интеллект, сообщает РИА Новости со ссылкой на пресс-службу компании.

В последние несколько лет ведущие IT-компании начали активно развивать и использовать различные формы искусственного интеллекта для поиска информации в сети, обработки фотографий и их каталогизации и множества других целей, где неклассические алгоритмы обработки данных не работают.

Ярким примером этого подхода стала система искусственного интеллекта AlphaGo, открыто обыгравшая чемпионов мира и Европы по го и анонимно победившая сотни топ-игроков в онлайн-системах этой древнекитайской игры.

Большая часть таких разработок основывается на так называемых глубинных — или сверточных нейросетях. Они представляют собой каскады или многослойные структуры из нескольких десятков или сотен более простых нейросетей. Каждая из них обрабатывает не исходные данные, а продукты анализа, полученные сетью, расположенной выше, что позволяет упрощать очень сложные проблемы и решать их при помощи сравнительно скромных вычислительных ресурсов.

Нечто похожее происходит и при использовании искусственного разума для перевода с одного языка на другой. Когда нейросеть "читает" переводимый текст, то она не пытается перевести его по фразам или отдельным словам, а ищет ответ целиком, используя данные, накопленные при анализе текстов, переведенных человеком.

У подобного подхода, как отмечают специалисты "Яндекса", есть как плюсы, так и минусы: в таком виде текст становится более читаемым и похожим на то, как его перевел бы человек, но, с другой стороны, машина периодически начинает "фантазировать", если ей встречаются редкие слова и фразы.

Эту проблему "Яндекс" решил, объединив искусственный разум со старой системой перевода, хорошо справлявшейся с редкими словами, но сталкивавшейся с большими проблемами при их объединении в предложения. Когда пользователь вводит текст, его одновременно переводит и нейросеть, и статистический алгоритм, после чего система машинного обучения CatBoost, недавно созданная "Яндексом", сопоставляет результаты и собирает из них более читаемый и грамотный вариант.

Сейчас старая версия "Яндекс.Переводчика" поддерживает 94 языка, в том числе ряд редких и вымышленных, например синдарин — язык эльфов из книг Дж. Р. Р. Толкина.




Главные темы

Орбита Sputnik

  • Художник-визажист Марк Кульер

    Британский гример, обладатель премии "Оскар" Марк Кульер приглашен для съемок очередного фильма киноэпопеи "Путь лидера" о Нурсултане Назарбаеве.

  • Архивное фото президента Казахстана Нурсултана Назарбаева и премьер-министра Кыргызстана Сооронбая Жээнбекова

    Глава Казахстана Нурсултан Назарбаев поздравил с днем рождения избранного президента КР Сооронбая Жээнбекова.

  • Научный сотрудник Института США и Канады РАН Геворг Мирзаян

    Колумнист Sputnik Геворг Мирзаян о ключевых приоритетах официального Минска, резолюции ООН по Крыму и миротворцах в Донбассе.

  • Командующий НВС Латвии генерал-майор Леонид Калниньш

    Действия России свидетельствуют о стремлении повысить свою обороноспособность, а не о желании укреплять экономические связи, считает командующий НВС Латвии.

  • Слева направо: Арсен Аваков, Эка Згуладзе, президент Петр Порошенко и  Михаил Саакашвили  в Одессе, архивное фото

    Отчего у Литвы есть повод задумать о дружбе с такими "демократическими" странами, как Украина, Грузия и Молдавия?

  • Президент Игорь Додон

    Референдум по отставке мэра Кишинева – это шанс, чтобы положить конец хаосу в столице, считает президент Молдовы Игорь Додон.