Speechify a présenté aujourd’hui un aperçu d’une version préliminaire d’un nouveau système informatique contrôlé par la voix, appelé Jarvis, une interface permettant de piloter tout son ordinateur grâce à des commandes vocales. Cette démonstration imagine un futur où les utilisateurs contrôlent applications, workflows et tâches sans clavier, clic ni toucher l’appareil.
Ce prototype a récemment été présenté en interne puis partagé publiquement par le fondateur et PDG de Speechify, Cliff Weitzman. Le système permet de parler naturellement tandis que Speechify exécute des actions sur les applications et fenêtres en temps réel.
Lors de la démonstration, des instructions vocales déclenchent des actions comme ouvrir des applications, retrouver des contacts, naviguer dans les interfaces et envoyer des messages. Fini de jongler entre les fenêtres ou d'utiliser la souris : tout se fait entièrement à la voix.
Une première vidéo du système a été partagée ici par notre PDG Cliff Weitzman.
Une interface vocale pour tout l’ordinateur
Les assistants IA classiques répondent surtout aux questions ou génèrent du texte. Même intégrés aux logiciels, l'utilisateur doit encore ouvrir les apps, parcourir les menus et agir manuellement.
Speechify Jarvis introduit un nouveau modèle.
Les utilisateurs parlent naturellement et le système exécute directement les ordres sur l’ordinateur. Les applications s’ouvrent toutes seules, les workflows s’enchaînent et les tâches s’exécutent sans action manuelle.
La voix devient une couche de contrôle active sur tout l'environnement, pas juste un assistant limité à la conversation.
Du chat IA au contrôle vocal total
La plupart des outils IA reposent sur la saisie de textes dans une interface de chat. Souvent, ces systèmes créent des réponses et du contenu écrit, mais ne peuvent pas agir dans de vraies applications.
Speechify Jarvis fait évoluer la plateforme Voice AI de Speechify vers un véritable contrôle de l’ordinateur.
Au lieu de demander de l’aide à un assistant puis d’agir manuellement, l’utilisateur ordonne au système d’agir immédiatement. La voix devient l’interface principale avec le logiciel.
Speechify voit ce choix comme un objectif plus large : réduire la dépendance au clavier ou aux périphériques classiques.
« Nous avons créé quelque chose d’unique », explique Cliff Weitzman, fondateur et PDG de Speechify. « Vous parlez à l’ordinateur, il fait tout. Plus besoin de cliquer, de taper ou de toucher. Votre voix pilote toute la machine. »
Pensé pour une interaction naturelle
Speechify Jarvis s’appuie sur la plateforme vocale existante de Speechify, combinant synthèse vocale, dictée vocale et un assistant IA conversationnel Voice AI Assistant.
Le nouveau système va au-delà de la lecture et de l’écriture et permet de piloter les workflows. L’utilisateur ouvre et parcourt les applis, envoie des messages, change de fenêtres et pilote l’environnement grâce à la voix.
Les actions se déclenchent via des phrases naturelles et non via des commandes ou raccourcis clavier.
Ce système est déjà utilisé en interne chez Speechify et illustre un aperçu des évolutions à venir.
Vers un modèle natif vocal
Speechify anticipe un futur orienté voix. Même si le clavier et l’interface graphique dominent encore, Speechify pense que la voix va devenir l’interface majeure de nombreux workflows.
L’aperçu Jarvis montre un futur où l’ordinateur se pilote à la voix, pas par saisie manuelle.
Speechify décrit cette technologie comme un premier pas pour faire de la voix l’interface centrale du travail productif et des métiers de la connaissance, avec d’autres innovations à venir.
À propos de Speechify
Speechify est un assistant vocal IA qui aide à lire, écrire et comprendre via la voix. Déjà adopté par plus de 50 millions d’utilisateurs, Speechify propose la synthèse vocale, la dictée vocale et un assistant IA sur iOS, Android, Mac, web et Chrome. En 2025, Speechify a reçu un Apple Design Award pour son impact sur l’accessibilité et la productivité. Speechify est utilisé dans près de 200 pays, propose plus de 1 000 voix réalistes dans 60+ langues, incluant celles de Snoop Dogg et Gwyneth Paltrow.