porównanie

Porównanie MT dostępnych przez API (i wtyczki)

Bardzo przystępne porównanie MT dostępnych przez API (w tym wtyczki do CAT-ów), stan na 19 marca 2021, opublikowała firma ModelFront. Czytelne zestawienie dostępnych języków, możliwości dostosowania MT do własnej dziedziny, cen i ochrony danych. W kolumnie “Context” wieje pustką 🙂

Z publikacji dowiemy się też o aktualnie dostępnych darmowych silnikach NMT “do samodzielnego złożenia”, a oprócz tego – jakie języki zostały niedawno dodane. DeepL na przykład włączył dosłownie przed momentem język czeski (i parę innych języków Europy Środkowej, tak że polski przestał być uprzywilejowany), a Microsoft obsługuje m.in. język tigrinia.

eTranslation: 2 miejsce w WMT20 dla polskiego; arabski i speech-to-text

Unijny system eTranslation zajął drugie miejsce w konkurencji silników MT dla pary angielski -> polski, stanowiącej część Fifth Conference of Machine Translation (WMT20). Wynik jest bardzo dobry, biorąc pod uwagę, że w konkurencji brały udział m.in. silniki z Tilde czy praskiego Uniwersytetu Karola (ale nie znajdziemy tam niektórych systemów komercyjnych, jak DeepL czy Google).

Ocena, na podstawie której porównywano systemy, jest oceną ludzką, a do treningu oraz tłumaczenia użyte zostały teksty prasowe. Więcej informacji o wynikach eTranslation w tym rankingu znajdziemy na stronach Connecting Europe Facility oraz w materiałach konferencyjnych.

A najświeższe wieści o eTranslation to dodanie arabskiego do listy języków obsługiwanych oraz dodanie funkcji Speech-to-Text.

Jak porównywać MT z tłumaczami

Na fali publikacji o MT tworzącym tłumaczenia nie do odróżnienia od ludzkich, tudzież drugiej fali prac podważających te twierdzenia, powstał bardzo przyzwoity zestaw dobrych praktyk przy porównywaniu MT z człowiekiem. Warto zwracać uwagę m.in. na te aspekty:

  • kto tłumaczył (amatorzy czy zawodowcy)
  • kto porównuje (amatorzy czy zawodowcy) – i dla jakich odbiorców tekst ma być przeznaczony
  • czy w porównaniu uwzględniony jest kontekst (np. cały dokument)
  • jaki był tekst źródłowy (z MT, z tłumaczenia czy pierwotnie napisany w danym języku).

Podczas prezentacji na EAMT 2020 profesor Antonio Toral zauważył przewrotnie, że większość odbiorców MT nie jest profesjonalnymi tłumaczami, więc czy ocena przez profesjonalistów jest w pełni adekwatna do ich potrzeb…? Mój ulubiony cytat z konferencyjnej dyskusji to “Just because something is better, doesn’t mean it’s correct” 🙂

CUBBITT: maszyna jak tłumacz?

Akademicki system CUBBITT wypadł w ocenie ludzkiej nie gorzej niż tłumacze profesjonalni, co ciekawe – popełnia mniej błędów merytorycznych. To wciąż tylko tłumaczenie artykułów prasowych, a w szczegółach siedzi niejeden diabeł – warto jednak zauważyć, że ocenę i porównanie wykonano na skalę całych tekstów, a nie pojedynczych zdań.