MT a tasiemce prawne
Tilde i Hieronymus zaprezentowały system tłumaczeń maszynowych, który przetwarza dokumenty prawne w Szwajcarii. Wśród typowych wyzwań i rozwiązań, takich jak ochrona danych, ilość zasobów do treningu czy preferowana terminologia, znalazła się ciekawostka: długość zdań w tekstach prawnych. O ile w innych zastosowaniach przetwarzanie tekstów przed i po maszynie często obejmuje łączenie krótkich segmentów w logiczne całości, a potem ich rozdzielanie (tak dzieje się np. przy automatycznym tłumaczeniu napisów do filmów), o tyle dla tekstów prawnych wskazane okazało się raczej dzielenie zdań na mniejsze logiczne całości, bardziej strawne dla MT. Taka specyfika 🙂