Google a prezentat Gemini 3.5 Live Translate, un nou model AI pentru traducere vocală aproape în timp real. Tehnologia este gândită pentru conversații mai naturale între persoane care vorbesc limbi diferite.

Modelul poate traduce conversații audio în peste 70 de limbi și detectează automat limba vorbită.

Publicitate

Potrivit Google, Gemini 3.5 Live Translate poate începe traducerea înainte ca vorbitorul să termine fraza și poate păstra tonul, ritmul și intonația vocii.

Sistemul este destinat unor situații precum apeluri, întâlniri online, lecții sau discuții de lucru, unde traducerea rapidă poate face conversația mai ușor de urmărit.

De asemenea, Google precizează că modelul a fost evaluat în funcție de trei criterii principale: calitatea traducerii, latența și naturalețea vocii sintetizate.

Publicitate

În cazul traducerii live, latența este considerată un element important, deoarece arată cât de mult întârzie traducerea față de vorbirea originală.

Care sunt limitările

Totodată, Google menționează și limitările, cum ar fi:

Vocea generată poate fi inconsistentă în anumite situații, mai ales după pauze lungi sau în conversații rapide cu mai mulți vorbitori.

Detectarea limbii poate fi mai dificilă în cazul accentelor non-native, al limbilor asemănătoare sau al schimbărilor rapide între limbi.

Deși modelul este conceput să filtreze zgomotul de fundal, compania precizează că nu toate sunetele pot fi ignorate.

Astfel, în unele cazuri, zgomotele din jur pot afecta calitatea traducerii audio.

Publicitate
AlbaFest Articol 728x90 / 300x250

Cum va putea fi folosit pe Android și iOS

Gemini 3.5 Live Translate poate fi accesat de dezvoltatori prin Gemini Live API și Google AI Studio.

În cazul Google Meet, tehnologia va fi disponibilă mai întâi pentru testare, în cadrul unui private preview destinat unor clienți Google Workspace.

Pentru publicul larg, funcția este introdusă în aplicația Google Translate, pe Android și iOS.

Utilizatorii o pot folosi inclusiv cu o pereche de căști, pentru ca vocea tradusă să fie redată mai clar în timpul conversației.

O nouă funcție pe Android

Google anunță și o opțiune nouă pentru telefoanele Android.

Mai exact, traducerea poate fi ascultată direct prin difuzorul pentru apeluri al telefonului, astfel încât dispozitivul să poată fi ținut la ureche, ca în timpul unei convorbiri obișnuite.

Publicitate

În Google Meet, traducerea vocală va folosi noul model Gemini 3.5 Live Translate.

Totodată, cu această schimbare, numărul limbilor disponibile va crește de la cinci la peste 70, iar combinațiile de traducere vor depăși 2.000.