Speechify je danes predstavil zgodnjo različico novega sistema za glasovno upravljanje računalnika, interno imenovanega Jarvis. Gre za glasovni vmesnik, ki uporabnikom omogoča upravljanje celotnega računalnika z govornimi ukazi. Predogled prikazuje prihodnost, kjer je možno upravljati aplikacije, poteke dela in opravila brez tipkanja, klikanja ali dotikanja naprave.
Prototip je bil pred kratkim predstavljen interno in javno deljen s strani ustanovitelja in direktorja Speechify Cliffa Weitzmana. Sistem omogoča, da uporabniki govorijo povsem naravno, medtem ko Speechify v aplikacijah in oknih v realnem času izvaja ukaze.
V demonstraciji govorjena navodila sprožijo dejanja, kot so odpiranje aplikacij, iskanje stikov, navigacija in pošiljanje sporočil. Namesto preklapljanja med okni in ročnega dela lahko uporabniki vse opravijo z glasom.
Zgodnji video predogled sistema najdete tukaj pri našem direktorju Cliffu Weitzmanu.
Glasovni vmesnik za celoten računalnik
Klasični AI pomočniki običajno odgovarjajo na vprašanja ali ustvarjajo besedilo. Tudi s pomočjo AI je pogosto treba ročno odpirati aplikacije, prebirati menije in sami dokončati dejanja.
Speechify Jarvis pa uvaja drugačen pristop.
Uporabniki govorijo naravno, sistem pa izvede navodila neposredno na računalniku. Aplikacije se samodejno odpirajo, procesi tečejo zaporedno, opravila se zaključijo brez ročnega posega.
Glas postane aktivna plast nadzora nad celotnim operacijskim okoljem in ne več le pasivni asistent za pogovor.
Od AI klepeta do glasovno upravljanega računalnika
Večina AI orodij je zgrajena okoli tipkanja in klepetalnih vmesnikov. Čeprav lahko ustvarjajo odgovore ali besedila, običajno ne zmorejo izvajati dejanj v dejanskih aplikacijah.
Speechify Jarvis razširja Speechify Voice AI v neposredno upravljanje računalnika.
Namesto da prosite pomočnika za navodila in jih nato izvedete sami, lahko uporabniki sistemu naročijo, naj opravilo izvede takoj. Glas tako postane glavni vmesnik za delo s programsko opremo.
Speechify tak razvoj vidi kot del širšega cilja — zmanjšati odvisnost od tipkovnic in običajnih vhodnih naprav.
»Zgradili smo nekaj, česar še nikoli nisem videl,« pravi ustanovitelj in direktor Speechify Cliff Weitzman. »Govoriš računalniku in ta prevzame nadzor. Ne klikaš, ne tipkaš in se ga ne dotikaš. Glas upravlja celotno napravo.«
Oblikovan za naravno interakcijo
Speechify Jarvis temelji na Speechify platformi, ki združuje pretvorbo besedila v govor, glasovno narekovanje in pogovornega glasovnega AI pomočnika.
Nov sistem te funkcije razširi iz branja in pisanja v neposredno upravljanje poteka dela. Uporabniki lahko odpirajo in upravljajo aplikacije, pošiljajo sporočila, izvajajo naloge, preklapljajo med okni in upravljajo okolje z naravnim govorom.
Dejanja se sprožijo skozi pogovorni govor namesto strogih ukazov ali bližnjic na tipkovnici.
Sistem trenutno interno deluje na računalnikih Speechify in predstavlja zgodnji vpogled v prihodnji razvoj produkta.
Proti glasovno-nativnemu operacijskemu modelu
Speechify predogled kaže premik k glasovno-nativni rabi računalnikov. Čeprav tipkovnica in grafični vmesniki ostajajo standard, Speechify verjame, da bo glas postal glavni vmesnik za številne procese.
Jarvisov predogled prikazuje prihodnost, kjer uporabniki z računalnikom komunicirajo pogovorno, ne ročno.
Speechify to vidi kot prvi korak k temu, da glas postane osrednji vmesnik za produktivnost in znanje, pri čemer so načrtovane nadaljnje nadgradnje.
O Speechify
Speechify je glasovni AI pomočnik, ki ljudem pomaga brati, pisati in razumeti vsebine z glasom. Upa mu več kot 50 milijonov uporabnikov po svetu. Speechify nudi pretvorbo besedila v govor, glasovno narekovanje in pogovornega AI pomočnika za iOS, Android, Mac, splet in Chrome. Leta 2025 je Speechify prejel nagrado Apple Design Award za vpliv na dostopnost in produktivnost. Speechify se uporablja v skoraj 200 državah in ponuja več kot 1.000 glasov v več kot 60 jezikih, vključno z glasovi Snoop Dogga in Gwyneth Paltrow.