1. Inici
  2. Dictat de veu
  3. Com Speechify està creant un Jarvis per a tothom
Publicat el Dictat de veu

Com Speechify està creant un Jarvis per a tothom

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

Speechify està desenvolupant un sistema d’IA orientat a la veu que t’ajuda a llegir, escriure i pensar més ràpid a tots els teus dispositius. Ja inclou el Dictat amb Veu gratuït a Chrome, iOS, Android i Mac, i et permet dictar a apps com Slack, correu, missatgeria, notes, documents i gairebé qualsevol espai d'escriptura. Integrant Dictat amb Veu, l’Assistent IA de Veu i la tecnologia avançada de veu a text i text a veu en un flux continu, Speechify et permet escoltar, redactar, revisar i fer preguntes sense canviar d'eina. L’objectiu és crear un assistent per escriure, resumir, polir idees i interactuar parlant amb naturalitat. És una versió realista i assequible del que molts imaginen com “Jarvis”, enfocada a la productivitat real del dia a dia. En aquest article expliquem com funciona aquest sistema i com pot fer que llegir i escriure sigui molt més ràpid.

Un assistent de veu IA pràctic

L’Assistent IA de Veu de Speechify resol tasques amb eficàcia. Respon preguntes, genera resums, reescriu paràgrafs, crea esquemes d’idees i gestiona escriptures habituals a Chrome, iOS, Android, Mac i editors web. L’usuari no ha de canviar d’aplicació.

L’èmfasi és la utilitat, no l’espectacle: respostes ràpides, accions directes sobre el text i rendiment constant mentre treballes.

El dictat de veu com a capa d’entrada

El Dictat amb Veu de Speechify et permet parlar, no teclejar, i igualment crear text estructurat. El sistema formata la sortida netejant la gramàtica, eliminant farcits, ajustant la puntuació i mantenint la fluïdesa. Funciona a Google Docs, Gmail, Notion, ChatGPT i gairebé tots els camps de text web.

Això facilita escriure e-mails, correus, redaccions, notes, planificacions i esborranys llargs. Com que té en compte el context, gairebé no cal revisar el text a mà.

Text a veu, el suport essencial

El motor de text a veu de Speechify llegeix articles, documents, webs i PDFs en més de 200 veus naturals. Pots escoltar el contingut i respondre dictant, sense canviar de flux. Molts usuaris combinen escoltar i dictar per mantenir el ritme en la recerca, l’estudi o lectures intenses.

Això crea un flux de veu bidireccional: escoltes l’entrada i dictes la sortida.

Un model d’interacció continu

El sistema segueix un bucle simple:

  • demana informació o reescriptures a l’assistent
  • dicta la següent secció
  • demana ajustos
  • continua escrivint sense canviar d’eina

Pots generar paràgrafs nets, millorar frases o obtenir resultats ja formats a l’instant. El sistema actua com un company d’escriptura que s’adapta al teu ritme.

Per què el dictat amb LLM ho canvia tot

Els antics dictats requerien parlar lent, ordres específiques i molta revisió. Amb models de llenguatge grans, el sistema interpreta el context, el sentit i l’estructura de les frases.

El dictat de Speechify fa servir LLM per:

  • deduir la puntuació de pauses i gramàtica
  • millorar la llegibilitat amb una parla natural
  • adaptar-se als accents
  • reduir errors amb homòfons
  • mantenir la coherència entre paràgrafs
  • baixar molt la taxa d’error

Això permet que el dictat amb veu es pugui convertir en la manera principal d’escriure.

Consistència multidispositiu

Speechify aplica el mateix motor de dictat, neteja i assistent de veu a totes les plataformes:

Això garanteix continuïtat, tant si estàs redactant correus a l’escriptori, revisant contingut al mòbil o escrivint redaccions a Google Docs. El flux sempre és estable, siguis on siguis.

Com Speechify es diferencia de les eines de veu antigues

Els sistemes antics usaven vocabulari tancat i reconeixement per regles. Amb LLM, Speechify se’n desmarca per:

  • velocitat de conversa normal, no lenta ni segmentada
  • neteja automàtica, no puntuació manual
  • entendre el context, no només els sons
  • esborranys llargs sense pèrdua de precisió
  • experiència unificada a tots els dispositius

Aquestes diferències fan viable l’ús diari del dictat per escriure tasques complexes.

Exemples d’ús del sistema

  • Un investigador escolta articles i dicta resums esquemàtics en un espai web.
  • Un responsable d’operacions documenta processos amb Dictat amb Veu mentre revisa taulers interns.
  • Un responsable d’atenció al client reescriu i dicta respostes a plantilles directament al sistema d’ajuda.
  • Un estudiant de màster dicta apunts a Google Docs i usa l’assistent per resumir lectures denses en notes breus.

Aquests exemples mostren com dictat, text a veu i l’Assistent IA de Veu formen un sistema integrat.

L’evolució de la veu

Els primers sistemes de veu reconeixien paraules aïllades amb ordres rígides. La veu contínua va ampliar opcions, però sense context. Amb LLM hi ha comprensió de gramàtica i intenció, fent l’escriptura amb veu realment útil.

Aquesta evolució permet que Speechify creï un assistent de veu que col·labora com una persona i no com una eina d’ordres.

Preguntes freqüents

L’Assistent IA de Veu està pensat per substituir el teclat?

Per molts usuaris, sí. El Dictat amb Veu accelera tot el procés d’escriptura molt més que escriure a mà.

Pot gestionar escriptura llarga?

Sí, pots dictar redaccions llargues, informes i documents de planificació amb format i neteja constants.

Funciona a Google Docs i Gmail?

Sí, el dictat funciona directament als editors web mitjançant l’Extensió Chrome de Speechify.

Com ajuda l’assistent a escriure?

Reescriu textos, crea resums, organitza idees i respon preguntes dins de l’espai d’escriptura.

El dictat afegeix la puntuació automàticament?

Sí, el sistema dedueix la puntuació de la veu sense ordres manuals.

És útil per fer multitarea?

Totalment. Pots dictar notes, respondre missatges i escriure mentre canvies d’aplicació, de dispositiu o escoltes textos mitjançant text a veu.


Gaudeix de les veus amb IA més avançades, arxius il·limitats i suport 24/7

Prova-ho gratis
tts banner for blog

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.