Przejdź do treści

narzędzia

MT dla początkujących (klientów)

Firma Andovar publikuje króciutką ściągawkę dla firm, które chcą zacząć korzystać z tłumaczeń maszynowych. W siedmiu krokach pokazuje, co trzeba wziąć pod uwagę po stronie projektów, zespołu i narzędzi; jakie są pułapki prawne; co może dać trening MT oraz dlaczego zawsze warto notować, jak wypadły poszczególne projekty “z maszyną”.

Bardzo przydatna rzecz na początek dla biur, które dopiero przymierzają się do przygody z MT. Może też przydać się do urealnienia oczekiwań klienta, który okazjonalnie tłumaczy proste teksty za pomocą DeepL czy Google i ma nieco zbyt optymistyczne przekonanie o realiach pracy z MT 🙂

Intento: “The pt was given abx”

Firma Intento oferuje nowe narzędzie poprawiające jakość MT: glosariusz skrótów podłączany przed wpuszczeniem tekstu do maszyny, który rozwija je, zanim tekst trafi do maszyny. Proponowane obszary zastosowania to m.in. sklepy internetowe i inne obszary obsługi klienta, a przede wszystkim – teksty medyczne: elektroniczny odpowiednik pisma lekarskiego 🙂

Porównanie MT dostępnych przez API (i wtyczki)

Bardzo przystępne porównanie MT dostępnych przez API (w tym wtyczki do CAT-ów), stan na 19 marca 2021, opublikowała firma ModelFront. Czytelne zestawienie dostępnych języków, możliwości dostosowania MT do własnej dziedziny, cen i ochrony danych. W kolumnie “Context” wieje pustką 🙂

Z publikacji dowiemy się też o aktualnie dostępnych darmowych silnikach NMT “do samodzielnego złożenia”, a oprócz tego – jakie języki zostały niedawno dodane. DeepL na przykład włączył dosłownie przed momentem język czeski (i parę innych języków Europy Środkowej, tak że polski przestał być uprzywilejowany), a Microsoft obsługuje m.in. język tigrinia.

Poprawianie MT przez korpus tematyczny (1)

Dostępny jest krótki raport opisujący użycie przez Systran korpusu tematycznego dostarczonego przez TAUS, aby uzyskać lepsze MT na tematy COVID-owe. Dla 12 par językowych odnotowano średnią poprawę jakości o 18% wg miary automatycznej BLEU. W raporcie brak informacji, jak nowe MT tematyczne wypadło w ocenie tłumaczy-postedytorów lub odbiorców bezpośrednich.

Porozmawiajamy o tłumaczeniach maszynowych

Na przełomie lutego i marca 2021 miałam zaszczyt wystąpić w trzeciej edycji podcastu “Porozmawiajmy o tłumaczeniach“, jaki prowadzi Wojciech Wołoszyk (prawnik-lingwista, prezes IURIDICO). W ciągu nieco ponad godziny poruszyliśmy takie kwestie, jak:

  • rola tłumacza względem NMT,
  • sposób powstawania współczesnych tłumaczeń maszynowych,
  • ryzyka związane z użyciem tej technologii (jakościowe, prawne i psychologiczne),
  • obliczanie stawek za postedycję,
  • wybór właściwego narzędzia MT do danego zadania,
  • specyfika unijnego silnika eTranslation.

Zapytaj mentorkę

19 lutego 2021 miałam przyjemność wziąć udział w jednej z sesji mentoringu dla tłumaczy, jakie prowadzi Virginia Katsimpiri. Rozmawiałyśmy na następujące tematy:

  • jak zaczęłam pracę w tłumaczeniach i lokalizacji,
  • dlaczego tłumaczenia maszynowe i postedycja to istotna sprawa dla tłumaczy w roku 2021,
  • jak te usługi wyglądają od strony technicznej (w narzędziu CAT),
  • jak ocenić, czy cena za MT PE jest dobra (za pomocą kartki, ołówka i zegara!),
  • czego można używać oprócz Google Translate 🙂

Nagranie jest dostępne na YouTube.

Skutek uboczny adaptacji MT

Na webinarium “Deep Adaptive in MT – closing the gap with human parity” Manuel Herranz i Mercedes Garcia, reprezentujący firmę Pangeanic, opowiadali o tłumaczeniach maszynowych adaptowanych do zastosowania. Interesującym aspektem było pokazanie nieoczywistego skutku ubocznego takiej adaptacji: MT staje się lepsze – tak w ocenie automatycznej, jak i w ocenie przez tłumaczy – w dziedzinie, do której jest adaptowane, ale nieco pogarsza się jego jakość w dziedzinie ogólnej.

Maszyna upraszcza

Kolejna (po słynnym już post-editese Antonia Torala) bardzo świeża praca naukowa o tym, jak NMT upraszcza język – zwiększa udział terminów i konstrukcji gramatycznych, które dominują w korpusie, a marginalizuje terminy i konstrukcje rzadkie. Jeśli np. w danych treningowych większość przekazu jest adresowana do odbiorcy w rodzaju męskim, to w tłumaczeniu maszynowym efekt “nur für Männer” będzie wzmocniony.

Język japoński w eTranslation

Jak informuje biuletyn ELRC, od stycznia możemy – za pomocą bezpłatnego publicznego serwisu eTranslation – tłumaczyć maszynowo język japoński. Możemy jako obywatele UE (na użytek prywatny, jako freelancerzy lub MŚP) – poddani korony brytyjskiej niestety utracili już dostęp do tego systemu 🙁

Inne nowości w eTranslation to, jak pisze Anna Kotarska, m.in. aktualizacje MT dla języka formalnego “dzięki nowej porcji danych, aby silniki lepiej radziły sobie z terminologią związaną z trwającym kryzysem zdrowotnym”.

Więcej informacji znajdziemy na unijnych stronach o narzędziach językowych.

Przyszłość tłumaczenia książek? Hm…

Konstantin Savenkov, szef Intento, zwrócił uwagę na bardzo ciekawy projekt wydawnictwa Individuum: “A World Without Work” Daniela Susskinda został wstępnie przetłumaczony na język rosyjski za pomocą Yandex NMT i postedytowany; akapity pozostawione bez zmian są wyróżnione w tekście książki. Szerszy opis tego projektu jest dostępny po rosyjsku – i tu uwaga dla niecyrylicznych: Yandex naprawdę dobrze tłumaczy z rosyjskiego na angielski lub polski (na ogół lepiej niż Google, DeepL czy eTranslation).