Przejdź do treści

Nowości o MT

Dyskusja o stawkach za postedycję

W ramach serii webinarów firmy Memsource na temat MT odbyła się niedawno bardzo ciekawa dyskusja pt. “Pricing Models for MT Post-Editing“. Znajdziemy tu większość gorących tematów, związanych ze stawkami za MTPE AD 2021, np.:

  • czy lepsze są stawki za słowo, godzinowe czy za usługę (i dlaczego słowo na razie wygrywa),
  • jak skłonić klienta do przysłania tekstu źródłowego o sensownej jakości (nowe zastosowanie SLA),
  • kiedy możemy liczyć na przewidywanie jakości MT (jeszcze nie),
  • czy rozróżnianie wielu poziomów MTPE ma sens (już nie),
  • czy powstanie standard rynkowy wyceny MTPE (to zależy).

Poprawianie MT przez korpus tematyczny (1)

Dostępny jest krótki raport opisujący użycie przez Systran korpusu tematycznego dostarczonego przez TAUS, aby uzyskać lepsze MT na tematy COVID-owe. Dla 12 par językowych odnotowano średnią poprawę jakości o 18% wg miary automatycznej BLEU. W raporcie brak informacji, jak nowe MT tematyczne wypadło w ocenie tłumaczy-postedytorów lub odbiorców bezpośrednich.

Porozmawiajamy o tłumaczeniach maszynowych

Na przełomie lutego i marca 2021 miałam zaszczyt wystąpić w trzeciej edycji podcastu “Porozmawiajmy o tłumaczeniach“, jaki prowadzi Wojciech Wołoszyk (prawnik-lingwista, prezes IURIDICO). W ciągu nieco ponad godziny poruszyliśmy takie kwestie, jak:

  • rola tłumacza względem NMT,
  • sposób powstawania współczesnych tłumaczeń maszynowych,
  • ryzyka związane z użyciem tej technologii (jakościowe, prawne i psychologiczne),
  • obliczanie stawek za postedycję,
  • wybór właściwego narzędzia MT do danego zadania,
  • specyfika unijnego silnika eTranslation.

Zapytaj mentorkę

19 lutego 2021 miałam przyjemność wziąć udział w jednej z sesji mentoringu dla tłumaczy, jakie prowadzi Virginia Katsimpiri. Rozmawiałyśmy na następujące tematy:

  • jak zaczęłam pracę w tłumaczeniach i lokalizacji,
  • dlaczego tłumaczenia maszynowe i postedycja to istotna sprawa dla tłumaczy w roku 2021,
  • jak te usługi wyglądają od strony technicznej (w narzędziu CAT),
  • jak ocenić, czy cena za MT PE jest dobra (za pomocą kartki, ołówka i zegara!),
  • czego można używać oprócz Google Translate 🙂

Nagranie jest dostępne na YouTube.

eTranslation: 2 miejsce w WMT20 dla polskiego; arabski i speech-to-text

Unijny system eTranslation zajął drugie miejsce w konkurencji silników MT dla pary angielski -> polski, stanowiącej część Fifth Conference of Machine Translation (WMT20). Wynik jest bardzo dobry, biorąc pod uwagę, że w konkurencji brały udział m.in. silniki z Tilde czy praskiego Uniwersytetu Karola (ale nie znajdziemy tam niektórych systemów komercyjnych, jak DeepL czy Google).

Ocena, na podstawie której porównywano systemy, jest oceną ludzką, a do treningu oraz tłumaczenia użyte zostały teksty prasowe. Więcej informacji o wynikach eTranslation w tym rankingu znajdziemy na stronach Connecting Europe Facility oraz w materiałach konferencyjnych.

A najświeższe wieści o eTranslation to dodanie arabskiego do listy języków obsługiwanych oraz dodanie funkcji Speech-to-Text.

Skutek uboczny adaptacji MT

Na webinarium “Deep Adaptive in MT – closing the gap with human parity” Manuel Herranz i Mercedes Garcia, reprezentujący firmę Pangeanic, opowiadali o tłumaczeniach maszynowych adaptowanych do zastosowania. Interesującym aspektem było pokazanie nieoczywistego skutku ubocznego takiej adaptacji: MT staje się lepsze – tak w ocenie automatycznej, jak i w ocenie przez tłumaczy – w dziedzinie, do której jest adaptowane, ale nieco pogarsza się jego jakość w dziedzinie ogólnej.

Maszyna upraszcza

Kolejna (po słynnym już post-editese Antonia Torala) bardzo świeża praca naukowa o tym, jak NMT upraszcza język – zwiększa udział terminów i konstrukcji gramatycznych, które dominują w korpusie, a marginalizuje terminy i konstrukcje rzadkie. Jeśli np. w danych treningowych większość przekazu jest adresowana do odbiorcy w rodzaju męskim, to w tłumaczeniu maszynowym efekt “nur für Männer” będzie wzmocniony.

Język japoński w eTranslation

Jak informuje biuletyn ELRC, od stycznia możemy – za pomocą bezpłatnego publicznego serwisu eTranslation – tłumaczyć maszynowo język japoński. Możemy jako obywatele UE (na użytek prywatny, jako freelancerzy lub MŚP) – poddani korony brytyjskiej niestety utracili już dostęp do tego systemu 🙁

Inne nowości w eTranslation to, jak pisze Anna Kotarska, m.in. aktualizacje MT dla języka formalnego “dzięki nowej porcji danych, aby silniki lepiej radziły sobie z terminologią związaną z trwającym kryzysem zdrowotnym”.

Więcej informacji znajdziemy na unijnych stronach o narzędziach językowych.

Użyteczność eTranslation w tłumaczeniu na polski

Na konferencji EAMT 2020 została zaprezentowana praca dr Karoliny Stefaniak, reprezentującej Dyrekcję Generalną ds. Tłumaczeń Pisemnych Komisji Europejskiej, na temat użyteczności eTranslation w tłumaczeniach unijnych na język polski. Jak podstawowe kryterium użyteczności przyjęty został czas postedycji w porównaniu z czasem tłumaczenia od zera. Badania czasu wykazują umiarkowane korzyści z używania MT (eTranslation) – rzędu kilkunastu procent. Co ciekawe, korelacja między liczbą wprowadzanych poprawek a szybkością pracy jest słaba. Badanie wskazuje też błędy MT typowe dla unijnych tekstów prawnych i pary angielski-polski. Całe opracowanie jest dostępne w materiałach konferencyjnych.

Wycena postedycji

Jedna z ciekawszych sesji na konferencji EAMT 2020 była literalnie ostatnia w programie: przedstawiciele firmy acolad postanowili (odważyli się?) podzielić praktyką obliczania stawek za postedycję. Praktyka jest godna polecenia i opiera się na założeniu, że stawkę za słowo można – względem tłumaczenia – obniżyć mniej więcej o tyle, o ile MT przyspieszy pracę tłumaczy w porównaniu z tłumaczeniem od zera. Wyniki są badane dla próbki o wielkości co najmniej 5000 słów, a stawka dotyczy zawsze konkretnej dziedziny i pary językowej. Szczegóły można znaleźć w materiałach konferencyjnych.