korpusy

Open for Good: darmowe dane treningowe dla AI

25 listopada 2020 startuje Open for Good: inicjatywa mająca na celu zbieranie danych treningowych dla różnych rozwiązań AI, przede wszystkim z terenów Afryki i Azji. Zebrane dane mają być ogólnodostępne i darmowe, mają też być zlokalizowane – co w tym przypadku niekoniecznie oznacza tłumaczenie: przede wszystkim zbieranie informacji na właściwym terenie i z lokalnych źródeł. Dane obejmują np. informacje głosowe czy geograficzne, ale w dużej mierze tekst – co będzie oznaczało nowy potencjał do rozwoju tłumaczeń maszynowych dla języków, dla których brak dziś korpusów do treningu MT.

TAUS Program 2021

Tydzień webinarów! Wczoraj Omniscien, dziś eTranslation, a jutro – TAUS Program 2021, czyli nowości na rynku dużych (ale to naprawdę dużych) danych językowych.