postedycja

MT i postedycja a prawa autorskie

W szóstym odcinku podcastu “Porozmawiajmy o tłumaczeniach“, jaki prowadzi Wojciech Wołoszyk (prawnik-lingwista, prezes IURIDICO), gościem był dr Damian Flisak, radca prawny, tłumacz przysięgły języka niemieckiego, specjalista prawa najnowszych technologii. Panowie omówili kilka zagadnień bardzo istotnych przy pracy z MT oraz przy wykonywaniu postedycji:

  • Surowe tłumaczenie maszynowe nie stanowi oryginalnego utworu i nie podlega prawu autorskiemu…
  • …ale po postedycji – o ile nie ma ona charakteru kosmetycznego – staje się utworem tłumacza w takim samym znaczeniu, jak tłumaczenie wykonane przy pomocy innych narzędzi (np. edytora czy narzędzia CAT).
  • Ochrona własności intelektualnej, danych osobowych itd. w przypadku tłumaczenia maszynowego zależy od tego, co jest zapisane w warunkach korzystania z usług danego dostawcy MT i dla danego sposobu korzystania z tych usług (wersja ogólnodostępna vs. wersja spersonalizowana – często płatna). W skrócie: czytać umowę, co powtarzam na warsztatach z MT do znudzenia i jeszcze trochę!
  • Kwestia używania MT przez tłumaczy powinna być uregulowana w ich umowie z klientem. Jeśli natomiast takiego uregulowania nie ma, to – przy zachowaniu powyższych zasad ochrony treści – nie można przyjąć a priori, że tłumaczom z MT korzystać nie wolno, o ile finalne tłumaczenie jest jakościowo zgodne z oczekiwaniami klienta.

Inne, niemaszynowe zagadnienia poruszone w rozmowie to m.in.:

  • Czy tłumaczenie menu w barze mlecznym jest utworem?
  • Tłumacze na okładki!!!
  • Do kogo należy pamięć tłumaczeń i czy dwa takie same teksty można przetłumaczyć tak samo 🙂

Co duże firmy robią z MT

You understand the machine translation is not perfect. The dirty little secret is that you understand that human translation is not perfect.

Dyskusja panelowa “Modern Enterprise Use Cases for Machine Translation”, zorganizowana przez Memsource z przedstawicielami Lengoo, ex-Microsoftu, Tripadvisora i Welocalize, przyniosła parę spotrzeżeń, które nie zawsze zostają wypowiedziane tak wyraźnie:

  • Jeśli powstanie treści nie kosztuje firmę wiele, to na tłumaczenie tych treści też niechętnie się wydaje – dlatego są pierwsze w kolejce do MT bez postedycji: komentarze z zewnątrz, dyskusje serwisowe, bazy wiedzy itd.
  • Przy MT bez PE ważniejsze od automatycznych miar jakości okazują się miary biznesowe – np. czy strona zlokalizowana ma więcej kliknięć / działań użytkowników niż strona w oryginale.
  • Przewidywanie jakości MT nadal raczkuje, ale nieustannie przewija się koncepcja: najpierw – przy postedycji – zmierzyć, które teksty źródłowe wymagają najwięcej poprawek; potem – MT bez PE – sprawdzać, czy nowy oryginał jest podobny do tekstów mocno poprawianych (> nie puszczać bez PE), czy mniej poprawianych (> można spróbować).

MT Summit 2021

Za miesiąc konferencja MT Summit 2021, 5 dni online w strefie czasowej wschodniego wybrzeża USA. W programie między innymi:

  • The 4th Workshop on Technologies for MT of Low Resource Languages
  • 1st International Workshop on Automatic Translation for Signed and Spoken Languages
  • Theory and Practice for research in Post-editese
  • Understanding and Improving Context Usage in Context-aware Translation
  • Bad to the Bone: Predicting the Impact of Source on MT 🙂

Użyteczność eTranslation w tłumaczeniu na polski

Na konferencji EAMT 2020 została zaprezentowana praca dr Karoliny Stefaniak, reprezentującej Dyrekcję Generalną ds. Tłumaczeń Pisemnych Komisji Europejskiej, na temat użyteczności eTranslation w tłumaczeniach unijnych na język polski. Jak podstawowe kryterium użyteczności przyjęty został czas postedycji w porównaniu z czasem tłumaczenia od zera. Badania czasu wykazują umiarkowane korzyści z używania MT (eTranslation) – rzędu kilkunastu procent. Co ciekawe, korelacja między liczbą wprowadzanych poprawek a szybkością pracy jest słaba. Badanie wskazuje też błędy MT typowe dla unijnych tekstów prawnych i pary angielski-polski. Całe opracowanie jest dostępne w materiałach konferencyjnych.

Wycena postedycji

Jedna z ciekawszych sesji na konferencji EAMT 2020 była literalnie ostatnia w programie: przedstawiciele firmy acolad postanowili (odważyli się?) podzielić praktyką obliczania stawek za postedycję. Praktyka jest godna polecenia i opiera się na założeniu, że stawkę za słowo można – względem tłumaczenia – obniżyć mniej więcej o tyle, o ile MT przyspieszy pracę tłumaczy w porównaniu z tłumaczeniem od zera. Wyniki są badane dla próbki o wielkości co najmniej 5000 słów, a stawka dotyczy zawsze konkretnej dziedziny i pary językowej. Szczegóły można znaleźć w materiałach konferencyjnych.