11:28 

И ещё о машинном переводе

Sinica
petergirl дала ссылку на интересную статью "Русского репортёра" о машинном переводе "Машина в поисках смысла". Читала раскрыв рот )))

"Спустя всего шесть лет после Джорджтаунского эксперимента машинный перевод был торжественно похоронен. Убила его простенькая фраза: «John was looking for his toy box. Finally he found it. The box was in the pen». Ее правильный русский перевод звучит так: «Джон искал свою коробку с игрушками. Наконец он ее нашел. Коробка была в манеже».

Автор фразы, американский философ Иегошуа Бар-Хиллел, заявил, что для слова «pen» («ручка», но оно же и «детский манеж») ни один электронный переводчик никогда не сможет подобрать точный аналог на другом языке. Выбор между «ручкой» и «манежем» можно сделать только имея определенную картину мира, которой у машины нет. По мнению Бар-Хиллела, этот факт закрывал тему электронного перевода навечно. Кстати, до сих пор ни один онлайн-переводчик перевести эту фразу не в состоянии. Мы проверяли".

- Статья 2010 года. Сейчас то же самое:
Яндекс-переводчик: Джон искал свою игрушечную коробку. Наконец-то он нашел его. Коробка была в ручке.

Гугл: Джон искал свою игрушечную коробку. Наконец он нашел это. Коробка была в ручке.

Промт: Джон искал свою игрушечную коробку. Наконец он нашел его. Коробка была в ручке.

У яндекса, заметьте, есть оттеночное "то" после "наконец". Всё-таки он более русский ))) что неудивительно ))

"В свое время в интернете была популярна шутка про перевод с помощью онлайн-версии «Промта» предложения о кошке, родившей трех котят. Фраза «Our cat gave birth to three kittens — two whites and one black» превратилась в «Наш кот родил трех котят — двух белых и одного афроамериканца». Чтобы избавиться от политкорректного котенка, создатели рекомендовали вручную дополнить словарную статью Black, пометив это слово как «неодушевленное»."

Сейчас переводит как "черного" ))
причём яндекс с гуглом по-русски - "Наша кошка родила трех котят - двух белых и одного черного", а Промт теряет падежи: "Наша кошка родила трех котят — два белых и один черный".

В статье объясняется принцип современного машинного перевода - статистический:

"Принцип прост: зачем переводить заново то, что уже когда-то было переведено?

— Есть хорошо развитые языки — скажем, английский и русский, — для которых существует огромное количество параллельных переводов — романов, технической документации и прочего. Дальше чисто математическими методами система находит в этом море текстов тот, который статистически ближе переводимому фрагменту, — объясняет лингвист Леонид Иомдин.

Допустим, у вас в базе данных есть «Война и мир», инструкция по использованию стиральной машины и их переводы на английский язык. Нужно разобраться с фразой: «После минутного молчания она начала снимать свою шубу из искусственного меха». Перевод первой части фразы можно найти у Толстого, второй — в инструкции. Если что-то не так, разработчики или даже сами пользователи могут предложить лучший вариант перевода. Поэтому кажется, что система с каждым днем становится все более умной.

— За счет того, что статистические системы выдают вполне приемлемое качество, появляется иллюзия, что проблема вот-вот будет решена, — печально говорит Клышинский. — Но статистика — это не перевод вообще".

Так что можно выдохнуть и воспрянуть духом )))

@темы: русский язык, перевод, английский

URL
Комментарии
2018-06-13 в 11:58 

Кшиарвенн.
Better to reign in Hell, than serve in Heav'n
Однако это справедливо только по отношению к художественному переводу - специализированные статьи с помощью Традос, например, переводятся хорошо, да и машинным переводом берутся.

2018-06-13 в 12:15 

Sinica
Кшиарвенн., не пробовала - не знаю. Но думаю, и там возможны разночтения.

URL
2018-06-13 в 12:25 

Кшиарвенн.
Better to reign in Hell, than serve in Heav'n
Sinica, конечно, для этого и существуют редакторы))

2018-06-13 в 19:06 

Песня_Ветра_
Может, позволить себе влюбиться, раз уж нечем себя убить?!
В статье объясняется принцип современного машинного перевода - статистический:

:upset:
но если переводить любимое про "пошел косой косой косить косой косой" (пошел пьяный кривоглазый инструментом кривым косить" - и убрать одно из этих чудных слов - перевод сломается?

или перестановка слов. в очередном фанфике?

но в целом. работа современных машинных переводчиков - очень радует.местами даже по-русски

2018-06-13 в 20:13 

Sinica
Песня_Ветра_, все "косой" яндекс переводит как "oblique" - наклонный. Поскольку не может их различить.

URL
2018-06-14 в 13:22 

Песня_Ветра_
Может, позволить себе влюбиться, раз уж нечем себя убить?!
Sinica, :lol::lol::lol:

вот он! тестовый текст для перевода!)

2018-06-14 в 15:08 

Sinica
Песня_Ветра_, да ))) когда машинный переводчик научится это различать, мы проснёмся в новом мире ))

URL
2018-06-14 в 16:16 

Песня_Ветра_
Может, позволить себе влюбиться, раз уж нечем себя убить?!
Sinica, он не научится))
это даже нормальному обычному человеку не сразу понятно)) надо вчитываться)
можем быть спокойны:friend:

2018-06-14 в 16:42 

Sinica
URL
     

Про кино

главная