Open for Good: darmowe dane treningowe dla AI
25 listopada 2020 startuje Open for Good: inicjatywa mająca na celu zbieranie danych treningowych dla różnych rozwiązań AI, przede wszystkim z terenów Afryki i Azji. Zebrane dane mają być ogólnodostępne i darmowe, mają też być zlokalizowane – co w tym przypadku niekoniecznie oznacza tłumaczenie: przede wszystkim zbieranie informacji na właściwym terenie i z lokalnych źródeł. Dane obejmują np. informacje głosowe czy geograficzne, ale w dużej mierze tekst – co będzie oznaczało nowy potencjał do rozwoju tłumaczeń maszynowych dla języków, dla których brak dziś korpusów do treningu MT.