Speechify a prezentat astăzi o versiune inițială a unui nou sistem de control vocal pentru computer, denumit intern Jarvis, o interfață vocală ce le permite utilizatorilor să își controleze întregul computer prin comenzi rostite. Demonstrația conturează un viitor în care utilizatorii pot controla aplicații, naviga fluxuri și finaliza sarcini fără să tasteze, să dea clic sau să atingă dispozitivele.
Prototipul a fost testat recent intern și prezentat public de fondatorul și CEO-ul Speechify, Cliff Weitzman. Sistemul permite utilizatorilor să vorbească natural, iar Speechify execută acțiunile în mai multe aplicații și ferestre, în timp real.
În demonstrație, instrucțiunile vocale declanșează acțiuni precum deschiderea aplicațiilor, găsirea contactelor, navigarea interfețelor și trimiterea mesajelor. În loc să schimbe manual ferestrele sau să interacționeze direct cu softul, utilizatorii rezolvă totul doar prin voce.
Am publicat un prim video cu această soluție aici, de la CEO-ul nostru, Cliff Weitzman.
O interfață vocală pentru tot computerul
Asistenții AI tradiționali răspund de obicei la întrebări sau generează text. Chiar și integrați în software, utilizatorii trebuie totuși să deschidă manual aplicații, să navigheze în meniuri și să ducă singuri la bun sfârșit acțiunile.
Speechify Jarvis propune un model diferit.
Utilizatorii vorbesc natural, iar sistemul execută direct instrucțiunile pe computer. Aplicațiile pornesc automat, fluxurile rulează în ordine, iar sarcinile se efectuează fără intervenție manuală.
Vocea devine o metodă activă de control pentru întregul sistem, nu doar un asistent pasiv de conversație.
De la chat AI la control vocal complet al calculatorului
Majoritatea uneltelor AI sunt bazate pe prompturi scrise și chat. Acestea pot genera răspunsuri sau conținut, dar nu pot controla aplicațiile reale.
Speechify Jarvis extinde platforma Speechify Voice AI pentru control direct al computerului.
În loc să întrebi asistentul și apoi să faci pașii manual, poți cere sistemului să execute sarcinile pe loc. Vocea devine principala interfață pentru software.
Speechify consideră această direcție parte din obiectivul de a reduce dependența de tastaturi și dispozitive tradiționale de input.
„Am creat ceva ce nu am mai văzut pe nimeni să facă”, spune Cliff Weitzman, fondator și CEO Speechify. „Doar vorbești cu computerul și el preia controlul. Nu dai click, nu scrii, nu atingi nimic. Vocea ta controlează totul.”
Creat pentru interacțiune naturală
Speechify Jarvis se bazează pe platforma Speechify orientată pe voce, care integrează text-to-speech, dictare vocală și un asistent AI conversațional.
Noul sistem extinde aceste funcții de la citire/scriere la control direct al fluxurilor. Poți deschide aplicații, trimite mesaje, schimba ferestre sau gestiona softuri doar prin voce, în limbaj natural.
Acțiunile sunt declanșate prin vorbire conversațională, nu prin comenzi rigide sau scurtături de la tastatură.
Sistemul rulează momentan intern, pe computerele Speechify, și reprezintă un preview timpuriu al viitoarelor actualizări de produs.
Spre un mod de lucru nativ vocal
Speechify marchează o tendință tot mai clară către computere controlate vocal. Deși tastaturile și interfețele grafice rămân standard, Speechify crede că vocea va deveni interfața principală pentru multe fluxuri.
Preview-ul Jarvis sugerează un viitor în care interacțiunea cu computerul este conversațională, fără input manual.
Speechify prezintă tehnologia ca pe un prim pas către voce ca interfață centrală pentru productivitate și munca de cunoștințe, cu actualizări suplimentare planificate.
Despre Speechify
Speechify este un asistent AI vocal care îi ajută pe oameni să citească, să scrie și să înțeleagă informația prin voce. Este folosit de peste 50 de milioane de utilizatori din toată lumea. Speechify oferă text-to-speech, dictare vocală și un asistent AI conversațional pe iOS, Android, Mac, web și Chrome. În 2025, Speechify a primit Apple Design Award pentru impactul asupra accesibilității și productivității. Speechify este folosit în aproape 200 de țări și oferă peste 1.000 de voci naturale în peste 60 de limbi, inclusiv voci de la Snoop Dogg și Gwyneth Paltrow.