Speechify ha presentat avui un primer avenç d'un nou sistema de control per veu de l'ordinador conegut internament com a Jarvis, una interfície vocal que permet controlar tot l’ordinador amb ordres parlades. El vídeo mostra un futur on és possible gestionar aplicacions, processos i tasques sense escriure, fer clic ni tocar el dispositiu.
El prototip es va mostrar recentment en una presentació interna i el va compartir públicament el fundador i CEO de Speechify, Cliff Weitzman. El sistema permet parlar amb naturalitat i Speechify executa accions en temps real en aplicacions i finestres.
A la demostració, les ordres parlades activen accions com obrir apps, cercar contactes, navegar i enviar missatges. Sense canviar de finestra ni interactuar manualment, pots fer tasques només amb la veu.
Hem compartit un vídeo inicial del sistema aquí amb el nostre CEO, Cliff Weitzman.
Una Interfície de Veu per a Tot l'Ordinador
Els assistents amb IA tradicionals només responen preguntes o generen text. Fins i tot amb IA integrada, cal seguir obrint apps, navegant i completant accions manualment.
Speechify Jarvis planteja un model diferent.
L’usuari parla amb normalitat i el sistema executa instruccions directament a l’ordinador. Les apps s’obren soles, els processos s’encadenen i les tasques es completen sense cap interacció manual.
La veu esdevé una capa activa de control a tot el sistema operatiu, no només un assistent passiu per conversar.
De la Xatbot IA al Control per Veu
Avui moltes eines d'IA es basen en xats escrits i respostes. Tot i poder escriure o contestar, no poden dur a terme accions en aplicacions reals.
Speechify Jarvis porta la plataforma de Veu IA de Speechify al control directe de l’ordinador.
En lloc de demanar instruccions i fer manualment els passos, només cal dir què vols i el sistema ho fa a l’instant. La veu passa a ser la interfície principal amb el programari.
Speechify defineix aquesta frontera com l’objectiu de minimitzar la dependència del teclat i de les entrades tradicionals.
“Hem creat quelcom que mai no havia vist abans”, diu Cliff Weitzman, fundador i CEO de Speechify. “Parles a l’ordinador i ell actua. No cliques, no escrius ni toques res. La veu controla tota la màquina.”
Dissenyat per a la Interacció Natural
Speechify Jarvis es basa en la plataforma veu-primer de Speechify, que integra lectura de text, dictat per veu i un assistent de conversa amb veu IA.
El nou sistema amplia aquestes funcions de lectura i escriptura al control de processos. Pots obrir apps, navegar, enviar missatges, executar fluxos de treball, canviar de finestra i controlar entorns amb llenguatge oral natural.
Les accions es desencadenen amb veu conversacional, no amb ordres fixes ni combinacions de tecles.
El sistema ara funciona internament als ordinadors de Speechify i mostra un primer avenç del producte futur.
Cap a un Model Natiu de Veu
Speechify fa un pas cap al càlcul natiu per veu. Tot i que el teclat i la interfície gràfica continuen sent l'estàndard, creuen que la veu esdevindrà la interfície principal per a molts usos.
L’avenç de Jarvis apunta a un futur on els usuaris es relacionen amb l’ordinador parlant, no amb entrada manual.
Speechify veu aquesta tecnologia com un primer pas per fer de la veu la interfície central per a la productivitat i les feines de coneixement, amb més novetats en el futur.
Sobre Speechify
Speechify és un Assistent de Veu IA que ajuda a llegir, escriure i comprendre informació oralment. Més de 50 milions de persones hi confien arreu del món. Speechify ofereix lectura de text, dictat per veu i un assistent IA a iOS, Android, Mac, web i Chrome. El 2025, Speechify va rebre l’Apple Design Award per la seva aportació a l’accessibilitat i la productivitat. Speechify s’utilitza a gairebé 200 països i ofereix més de 1.000 veus naturals en 60 idiomes, incloent veus de Snoop Dogg i Gwyneth Paltrow.