gender

Maszyna upraszcza

Kolejna (po słynnym już post-editese Antonia Torala) bardzo świeża praca naukowa o tym, jak NMT upraszcza język – zwiększa udział terminów i konstrukcji gramatycznych, które dominują w korpusie, a marginalizuje terminy i konstrukcje rzadkie. Jeśli np. w danych treningowych większość przekazu jest adresowana do odbiorcy w rodzaju męskim, to w tłumaczeniu maszynowym efekt “nur für Männer” będzie wzmocniony.

Jakiego rodzaju jest gender?

Dlaczego MT częściej proponuje rodzaj męski? Bo tak ma w danych treningowych. Czy da się coś z tym zrobić? Tak, prace trwają. Polecam uwadze krótkie opracowanie Intento – rodzaj znajdziemy na slajdach 21-27, poza tym styl formalny/nieformalny i kwestie ochrony danych.