♦ Cea mai vizibilă consecinţă a lansării pentru utilizatorii obişnuiţi este extinderea Search Live – funcţia care permite căutarea prin voce pe Google, cu posibilitatea de a arăta şi obiecte prin camera telefonului (Google Lens) – în peste 200 de ţări şi teritorii.
Google a lansat Gemini 3.1 Flash Live, un model de inteligenţă artificială specializat pe conversaţii vocale în timp real, pe care compania îl descrie drept „cel mai performant model de voce şi audio de până acum“. Modelul alimentează două produse Google: Gemini Live, asistentul vocal disponibil pe telefoanele cu Android şi iOS, şi Search Live, funcţia care le permite utilizatorilor să caute pe Google prin conversaţie vocală, extinsă acum în peste 200 de ţări şi teritorii, în peste 90 de limbi, potrivit anunţului oficial publicat pe blogul companiei. „Gemini 3.1 Flash Live oferă o experienţă mai intuitivă pentru dezvoltatori, companii şi utilizatorii de zi cu zi“, susţine Google în anunţul oficial. Lansarea vine la mai puţin de o lună după ce Google a prezentat Gemini 3.1 Flash-Lite (3 martie), un model orientat spre dezvoltatori, optimizat pentru viteză şi cost redus, care a fost lansat la un preţ de 0,25 dolari per milion de jetoane de intrare (tokens, unităţile de text procesate de modelele AI) – de opt ori mai ieftin decât modelul Gemini Pro, potrivit VentureBeat. Gemini 3.1 Flash Live îmbunătăţeşte modelul anterior (2.5 Flash Native Audio) pe mai multe dimensiuni, potrivit Google şi 9to5Google:
Latenţa este mai mică – răspunsurile vin mai repede, cu mai puţine pauze stânjenitoare în conversaţie. Modelul poate urmări firul conversaţiei pe o durată de două ori mai lungă, ceea ce permite sesiuni extinse de brainstorming fără ca asistentul să piardă contextul. Recunoaşte mai bine nuanţele acustice – tonul, ritmul vorbirii, expresiile de frustrare sau confuzie -, adaptându-şi dinamic lungimea şi tonul răspunsurilor. ZF
Modelul filtrează mai eficient zgomotul de fundal (trafic, televizor) şi a obţinut un scor de 90,8% pe testul ComplexFuncBench Audio, un indicator al capacităţii de a utiliza instrumente externe (aplicaţii, funcţii) în timpul conversaţiei, potrivit Google. Toate conţinuturile audio generate de model sunt marcate cu SynthID, o tehnologie Google care integrează un filigran digital imperceptibil direct în semnalul audio, pentru a permite detectarea conţinutului generat de AI şi a preveni dezinformarea, potrivit anunţului companiei. Cea mai vizibilă consecinţă a lansării pentru utilizatorii obişnuiţi este extinderea Search Live – funcţia care permite să cauţi pe Google vorbind, cu posibilitatea de a arăta şi obiecte prin camera telefonului (Google Lens) – în peste 200 de ţări şi teritorii, în toate limbile şi locaţiile în care modul AI al Google Search este disponibil, potrivit Droid-Life.
Gemini Live, asistentul vocal, primeşte şi el un upgrade: conversaţiile sunt mai rapide, mai naturale şi se pot desfăşura pe perioade mai lungi fără pierderea contextului.
Modelul este disponibil în previzualizare (preview) prin Gemini Live API în Google AI Studio, platforma pentru dezvoltatori, şi prin Vertex AI, serviciul cloud pentru companii. Google a publicat separat un ghid tehnic pentru construirea de agenţi conversaţionali în timp real pe baza noului model, potrivit blogului Google pentru dezvoltatori.
La nivel de companii, Gemini 3.1 Flash Live este deja folosit de Verizon, operatorul american de telecomunicaţii, şi de Home Depot, cel mai mare lanţ de magazine de bricolaj din SUA, pentru centre de contact cu clienţii (customer service), potrivit Droid-Life.
Tot pe 26 martie, Google a extins funcţia Live Translate – care traduce conversaţiile în timp real prin căşti – pe iOS (până acum disponibilă doar pe Android). Funcţia suportă peste 70 de limbi şi a fost extinsă în Franţa, Germania, Italia, Japonia, Spania, Thailanda şi Regatul Unit. Funcţionează cu orice căşti standard, potrivit Droid-Life.
Lansarea Gemini 3.1 Flash Live vine pe fondul unei competiţii intense între Google, OpenAI şi Anthropic pe segmentul modelelor de inteligenţă artificială, în care fiecare companie lansează actualizări la intervale de săptămâni. Google a lansat trei modele din familia Gemini 3.1 doar în luna martie 2026: Flash-Lite (3 martie, orientat spre viteză şi cost), Flash Live (26 martie, orientat spre conversaţii audio) şi, separat, actualizări ale modelului principal Gemini 3 Flash…. Citește Întreg Articolul