In viitor, vom putea vorbi cu un chinez fara a sti niciun cuvant chinezesc, tehnologia facand totul prin traducerea audio instantanee, chiar cu vocea celui care vorbeste.
Noua tehnologie, dezvoltata de Microsoft, duce acuratetea si viteza traducerii automate la un nivel impresionant.
Rick Rashid, directorul Microsoft Research, a prezentat recent sistemul la un eveniment desfasurat la Tianjin, China, si a uimit asistenta aratand cum acesta nu numai ca recunoaste frazele rostite in engleza si le afiseaza in scris, ci le si poate traduce pe loc si emite audio, in mandarina (un dialect chinezesc), facandu-le sa sune ca si cind ar fi rostite de propria sa voce.
Desi cercetarile in domeniul recunoasterii vocii de catre computer dureaza de 60 de ani, pana de curand chiar si cele mai bune sisteme aveau rate de eroare de 20-25% in ceea ce priveste recunoasterea cuvintelor.
Dar Microsoft, in colaborare cu Universitatea dinToronto, Canada, a reusit, in urma cu doi ani, un mare progres.
Folosind o tehnologie numita a retelelor neurale profunde, prin care computerele invata intr-un mod inspirat din comportamentul creierului uman, cercetatorii au reusit sa determine sistemul sa inteleaga vorbirea cu o acuratete remarcabila. Rata erorilor a fost redusa cu peste 30% comparativ cu metodele precedente – insemnand ca sistemul greseste acum doar un cuvant din 7 sau 8.
Dupa cum a explicat Rick Rashid, tehnologia functioeaza in doua etape.
Intai, sistemul recunoaste cuvantul rostit in limba engleza si gaseste echivalentul lui chinez. In a doua etapa, cea mai dificila, sistemul trebuie sa rearanjeze cuvintele pentru a corespunde ordinii in fraza specifice dialectului mandarin; altfel, ar rezulta doar o insirurire de cuvinte disparate, lipsita de sens.
Remarcabil este si faptul ca fraza este apoi redata imitand vocea utilizatorului; cercetatorii au creat acest sistem combinand datele rezultate din cateva ore de inregistrari audio ale unui vorbitor nativ de mandarina cu caracteristicile vocii lui Rick Rashid, obtinute tot din inregistrari audio (in limba engleza).
Desi testul a fost facut doar la un nivel limitat, noua tehnologie promite totusi sa schimbe profund modul in care vom comunica in viitor, ajutandu-ne sa depasim mult mai usor barierele ligvistice.