modelfront

ISO ex machina

Ciekawe, czy uda się wdrożyć wróżenie jakości MT, które będzie dobrze skorelowane z faktyczną jakością MT ocenioną przez człowieka – czyli tekst postedytowany (zgodnie z wróżbą “tu trzeba”) i tekst niepostedytowany (zgodnie z wróżbą “nie trzeba”) będą nie do odróżnienia przez korektę/redakcję, zwłaszcza pod względem merytorycznym. Koncepcję objaśnia Adam Bittlingmayer, dyrektor firmy ModelFront zajmującej się – a jakże – wróżeniem jakości MT, w artykule dla tcworld.info:

“A quality prediction score should correlate with the decision of a professional human translator to edit or not edit a segment in a given translation workflow. (…) The most important question is whether humans can even tell the difference between the final output of the new process and the old process.

Przyznam, że chciałabym, żeby rozwój MTPE poszedł w kierunku “porządna postedycja za porządne stawki albo publikujemy surowe MT”, a nie w stronę dalszego obniżania stawek za PE i podnoszenia oczekiwanej wydajności postedycji, bo zbliżamy się chyba do granicy możliwości człowieka w zakresie przetwarzania informacji; dalej będzie już tylko pozorowanie sprawdzania, nieetycznie nie tylko z powodu przerzucania odpowiedzialności na tłumaczy, ale przede wszystkim ze względu na wprowadzanie konsumentów w błąd, że tłumaczenie jest zgodne merytorycznie z oryginałem i że ktoś za to odpowiada. A ponieważ postedytorami bywamy, a konsumentami jesteśmy – chciałabym jeszcze tylko przepisu, np. normy ISO, który wymusi oznaczanie wszelkich publikowanych tekstów jako “raw MT”, jeśli postedycji nie było, przy czym postedycja powinna być zdefiniowana jako pełna w rozumieniu normy ISO 18587 (“to obtain a product comparable to a product obtained by human translation”), a koncepcja “light PE” należy czym prędzej wyprowadzić za stodołę i zastrzelić.

Wróżenie jakości MT

Industry does not repeat, but it rhymes

Dobry, choć bez wątpienia lanserski wywiad na linii memoQ – ModelFront o prognozowaniu jakości MT, z którego można dowiedzieć się, jak to działa:

  • na podstawie danych z już wykonanych postedycji oblicza się % segmentów niezmienianych – jeśli jest wysoki, to warto przejść do następnego kroku;
  • na podstawie zmian wykonanych w postedycji trenowany jest silnik, który dla nowych segmentów maszynowych szacuje, czy trzeba je będzie poprawiać i jak bardzo;
  • dla każdego projektu i dodanego w nim MT będzie można przewidzieć, czy trzeba postedytować koniecznie i bezwarunkowo, czy też można postedycję odpuścić 🙂

Założeniem ModelFrontu jest wyeliminowanie żmudnej postedycji wszędzie tam, gdzie wnosi ona bardzo mało poprawek (a przy tym w zastosowaniach, gdzie nieuchronne przy tym podejściu, acz nieliczne błędy nie niosą ze sobą wielkiego ryzyka). Dla postedytorów mają pozostać zadania o wysokiej wartości dodanej.

Rozwiązanie ModelFrontu jest dostępne na razie dla kilku TMS-ów (w tym memoQ), ale firma planuje rozszerzanie tej listy.

…Ciekawe, czy takie narzędzia do wróżenia jakości MT będą używane zgodnie z założeniem, czy – niestety – do przycinania stawek za PE zgodnie z zasadą “wy udawajcie że sprawdzacie, my będziemy udawać że płacimy” 🙁

Pisanie pod maszynę

Jak pisać, żeby Neural MT sobie z tym poradziło? Centrum Tłumaczeń dla organów Unii Europejskiej publikuje broszurę z praktycznymi poradami, do pobrania bezpłatnie ze strony. Przykładowo:

  • używamy spójnej terminologii,
  • nie szalejemy z zaimkami,
  • unikamy TEKSTU WIELKIMI LITERAMI.

Poleca Anna Kotarska.

A od strony technicznej? Kilka porad znajdziemy na stronie firmy ModelFront, na przykład:

  • elementy odpowiedzialne za wygląd tekstu oddzielamy od tekstu,
  • wyróżniamy elementy nietłumaczalne w rodzaju nazw czy elementów interfejsu,
  • nie tniemy zdań na kawałki.

Poleca Adam Bittlingmayer.