Онлайн-перевод "Яндекса" будет дурить по-гугловски

Компания "Яндекс" запустила в режиме бета-тестирования онлайн-сервис "Яндекс.Перевод" собственной разработки. Система работает по тому же принципу, что и Переводчик Google, т.е. основана на статистическом анализе переводов, сделанных человеком.

Подробнее о том, как работает статистический перевод, можно прочитать здесь. Вкратце: анализируется куча текстов и их переводов и составляются модели для каждого из языков и модели для каждой языковой пары, в которых учитываются слова и словосочетания и частота их использования/перевода. При переводе конкретного текста т.н. декодер выбирает вариант "с наилучшим сочетанием вероятности (с точки зрения модели перевода) и частоты употребления (с точки зрения модели языка)".

Иными словами, такая система перевода совершенно не знает правил ни одного из языков, а просто занимается перебором огромного количества данных из таблиц.

"Статистический машинный перевод, конечно, нельзя сравнивать с литературным, сделанным профессиональным переводчиком, — признаёт руководитель сервиса "Яндекс.Перевод" Алексей Байтин. — Но часто бывает, что пользователю нужно просто понять основной смысл текста — например, он хочет почитать отзывы о зарубежных отелях или новости в иностранных СМИ. Онлайн-переводчик легко поможет это сделать. К тому же на перевод он потратит всего несколько секунд".

В этих словах есть своя правда, но у статистического подхода имеются и слабые места. Опыт Google показывает, что статистика нередко подкидывает забавные, а, бывает, и обидные для кого-то сюрпризы.

Например, летом 2009 года в ходе предвыборной борьбы на Украине гугловский сервис перевода путал двух Викторов — тогдашних кандидатов в президенты — Януковича и Ющенко. Или вот пример ещё более настораживающий: некоторое время назад англо-арабский гуглопереводчик упорно не желал признавать евреев и американцев террористами (добавляя в перевод частицу "не"), зато при этом совершенно корректно отрабатывал аналогичную фразу с арабами.

Можно предположить, что у "Яндекс.Перевода" будут возникать схожие проблемы, хотя проявляться они будут по-своему. Быстрая проверка показала, что оба продукта переводят одни и те же тексты по-разному (или, точнее, по-разному ошибаются), хотя некоторые конструкции, даже ошибочные, у них и совпадают (и тот, и другой используют для своих статистических моделей тексты из Интернета, так что совпадения неизбежны).

На данный момент онлайн-переводчик "Яндекса" обучен только 4 направлениям перевода: английский в русский, русский в английский, украинский в русский и русский в украинский (в багаже знаний Переводчика Google несколько десятков языков). Чисто визуально "Яндекс.Перевод" работает медленнее, чем конкурирующий продукт Google, но всё равно достаточно быстро, чтобы им можно было пользоваться.



Источник: www.webplanet.ru




Если вы хотите разместить свою статью или новость - присылайте ее по адресу .