konferencje

eTranslation: 2 miejsce w WMT20 dla polskiego; arabski i speech-to-text

Unijny system eTranslation zajął drugie miejsce w konkurencji silników MT dla pary angielski -> polski, stanowiącej część Fifth Conference of Machine Translation (WMT20). Wynik jest bardzo dobry, biorąc pod uwagę, że w konkurencji brały udział m.in. silniki z Tilde czy praskiego Uniwersytetu Karola (ale nie znajdziemy tam niektórych systemów komercyjnych, jak DeepL czy Google).

Ocena, na podstawie której porównywano systemy, jest oceną ludzką, a do treningu oraz tłumaczenia użyte zostały teksty prasowe. Więcej informacji o wynikach eTranslation w tym rankingu znajdziemy na stronach Connecting Europe Facility oraz w materiałach konferencyjnych.

A najświeższe wieści o eTranslation to dodanie arabskiego do listy języków obsługiwanych oraz dodanie funkcji Speech-to-Text.

MT ze zmienną terminologią

Dopasowanie terminologii w MT do dziedziny, klienta lub projektu pozostaje funkcją bardzo pożądaną na rynku. Oferuje ją część dostawców MT. Tymczasem firma SAP ma taki proces wdrożony na potrzeby swego (ogromnego) działu lokalizacji oprogramowania – w tym przypadku terminologię dopasowuje się do projektu. Niewątpliwym atutem SAP-a jest tu posiadanie i własnych zasobów terminologicznych, i własnego systemu NMT 🙂 Opracowanie na ten temat zostało nagrodzone jako najlepsza publikacja na konferencji EAMT 2020 i jest dostępne wraz z resztą materiałów konferencyjnych.