Технолошкиот гигант Meta претстави импресивен јазичен модел базиран на вештачка интелигенција, наречен “The Massively Multilingual Speech Project” (MMS), кој може да препознае над 4.000 јазици од целиот свет и да „зборува“ или произведува говор на повеќе од 1,000 од нив.
Слично на нивните други системи со вештачка интелигенција, MMS ќе биде достапен како алатка со отворен код (open source) со надеж дека ќе помогне во зачувуање на јазичниот диверзитет на светот и ќе им овозможи на корисниците пристап до информациите на нивниот претпочитан јазик за поинклузивно искуство со технологијата.
Според Мета, оваа технологија може да се користи во сѐ – од програми за виртуелна и проширена реалност до услуги за испраќање пораки, така што секој може да разбере и да биде разбран. Компанијата отворено ги охрабрува истражувачите да ја надоградат нејзината база на податоци.
Смислувањето начин да се снимаат аудио податоци за илјадници јазици во светот беше првиот предизвик на проектот, имајќи предвид дека најголемата постоечка говорна база на податоци досега складирала само над 100 јазици.
Со цел да создадат систем кој може да идентификува 40 пати повеќе говорени јазици, тимот одлучи да се сврти кон религиозни текстови, како што е Библијата, кои се преведени на голем број јазици и често се користат во истражувањето на јазични преводи.
Користејќи ги јавно достапните снимки од овие свети текстови, од Мета успеале да создадат база на податоци базирана на Новиот Завет на повеќе од 1.100 јазици. Со додавање на други неозначени снимки, бројот на говорени јазици што MMS може да ги препознае е зголемен на повеќе од 4.000.
Иако повеќето од користените снимки биле прочитани од машки говорници, досегашните анализи покажале дека системот подеднакво добро препознава машки и женски гласови.
Во иднина, тимот се надева дека дополнително ќе го прошири опсегот на системот за да поддржува уште повеќе јазици, вклучително и специфични дијалекти од целиот свет, што долго време се покажало како предизвик за постоечката говорна технологија.