Simba. La nostra API de text a veu

300ms de latència, qualitat humana, $10 per 1M caràcters, tots els idiomes que vulguis. Ho tens tot.

Accés a l’API

Contacta vendes

300msLatència

50+Idiomes

Prova mostres i descobreix com la nostra API adapta qualsevol veu a qualsevol emoció

Gwyneth Paltrow

Actriu

Controla l’expressivitat amb milers de veus predefinides i qualsevol veu clonada

Creem les veus IA més atractives testant-les amb la nostra base d'usuaris de +50M d'oients

Speechify té les apps de text a veu més utilitzades del món. Els nostres usuaris donen feedback diari i milloren constantment les veus i models d’IA.

Fet servir per líders innovadors

Millor preu del mercat

Inicial

Gratuït

Accés a l'API amb funcions limitades, ideal per a projectes petits o per fer proves abans d’actualitzar

50.000 caràcters
100 minuts de text a veu
Latència de 250 ms
Més de 50 idiomes
Més de 1.000 veus predefinides disponibles
Compatibilitat amb SSML
Marques de veu
SDKs per a Javascript i Python
Certificació SOC2
Sense clonació de veu

Selecciona el pla

Paga pel que utilitzes

MÉS POPULAR

$10 /1M caràcters

Accés il·limitat a la nostra API i funcions avançades. Sense compromisos ni desbordaments.

Tot el que inclou el pla Gratuït +
Caràcters il·limitats
2.000 minuts de text a veu
Inclou clonació de veu
Fins a 20 vegades més econòmic que la competència
Escalable a milions de trucades telefòniques simultànies

Selecciona el pla

Empresa

Personalitzat

Solucions d’API a mida amb preus i funcionalitats flexibles per a negocis amb necessitats específiques

Tot el que inclou el pla Gratuït +
Qüestionaris de seguretat
Condicions i garanties personalitzades sobre DPA/SLA
Serveis de clonació i doblatge de veu a mida
Múltiples usuaris
Atenció prioritària
Compromís anual de 5.000 $

Parlem-ne

IA conversacional

Hem creat veus per a IA conversacional: suport i vendes, avatars IA i qualsevol agent IA que dissenyis.

Veus en vídeos

Veus per a vídeos, doblatge i anuncis, fetes a mida per a Hollywood, YouTubers, TikTokers i marques.

Narració IA

Veus narratives per a editors, autors i formació, que entenen el context i fan que s’escolti tot el contingut.

Funcionalitats adaptables

60+ idiomes

English

Spanish

French

German

Portuguese

Afrikaans

Arabic

Bangla

Bulgarian

Catalan

Chinese

English

Spanish

French

German

Portuguese

Afrikaans

Arabic

Bangla

Bulgarian

Catalan

Chinese

Cantonese

Croatian

Czech

Danish

Dutch

Estonian

Filipino

Finnish

Georgian

Greek

Hebrew

Cantonese

Croatian

Czech

Danish

Dutch

Estonian

Filipino

Finnish

Georgian

Greek

Hebrew

Hindi

Hungarian

Icelandic

Indonesian

Italian

Japanese

Kazakh

Korean

Lithuanian

Latvian

Malay

Hindi

Hungarian

Icelandic

Indonesian

Italian

Japanese

Kazakh

Korean

Lithuanian

Latvian

Malay

Nepali

Norwegian

Persian

Polish

Romanian

Russian

Slovak

Slovenian

Sinhala

Swedish

Swahili

Nepali

Norwegian

Persian

Polish

Romanian

Russian

Slovak

Slovenian

Sinhala

Swedish

Swahili

Tamil

Telugu

Thai

Turkish

Urdu

Ukrainian

Vietnamese

Irish

Tamil

Telugu

Thai

Turkish

Urdu

Ukrainian

Vietnamese

Irish

English

Spanish

French

German

Portuguese

Afrikaans

Arabic

Bangla

Bulgarian

Catalan

Chinese

Cantonese

Croatian

Czech

Danish

Dutch

Estonian

Filipino

English

Spanish

French

German

Portuguese

Afrikaans

Arabic

Bangla

Bulgarian

Catalan

Chinese

Cantonese

Croatian

Czech

Danish

Dutch

Estonian

Filipino

Finnish

Georgian

Greek

Hebrew

Hindi

Hungarian

Icelandic

Indonesian

Italian

Japanese

Kazakh

Korean

Lithuanian

Latvian

Malay

Nepali

Norwegian

Persian

Finnish

Georgian

Greek

Hebrew

Hindi

Hungarian

Icelandic

Indonesian

Italian

Japanese

Kazakh

Korean

Lithuanian

Latvian

Malay

Nepali

Norwegian

Persian

Polish

Romanian

Russian

Slovak

Slovenian

Sinhala

Swedish

Swahili

Tamil

Telugu

Thai

Turkish

Urdu

Ukrainian

Vietnamese

Irish

Polish

Romanian

Russian

Slovak

Slovenian

Sinhala

Swedish

Swahili

Tamil

Telugu

Thai

Turkish

Urdu

Ukrainian

Vietnamese

Irish

Clona la teva veu

Zero Shot

Puja uns segons d'àudio i genera al moment una clonació IA de qualsevol veu

Veu ajustada

Envia diverses mostres i col·labora amb Speechify per crear una clonació de veu d’alta qualitat amb el teu estil únic

El CEO Ari Emanuel ($10B+) fa servir la IA de veu de Speechify per a totes les trucades de resultats

Des de febrer de 2023, Endeavor (NYSE: EDR) col·labora amb Speechify per generar la introducció dels resultats trimestrals amb la veu clonada d’Ari Emanuel. Ell i l’equip hi estalvien temps valuós.

Accés a l’API

Explora doc.

Model de veu IA per a empreses

No som només proveïdors, som el teu partner. Ens endinsem en cada cas d'ús i t’ajudem a cobrir totes les necessitats de veu.

Solució on-prem

Compartim els nostres models de veu per desplegar on-prem i maximitzar control i seguretat. També t’ajudem amb la implantació.

Biblioteques de pronunciació

Crearem una biblioteca de pronunciació a mida perquè les teves veus IA siguin sempre coherents amb el teu ús.

Escalabilitat extrema

Cobrim milions de peticions simultànies amb fiabilitat empresarial i servei fins i tot en pics de demanda.

Models de veu personalitzats

Necessitats especials? Truca’ns i el nostre equip d’IA dissenyarà solucions a mida.

Tot l'altre

Necessites un idioma poc habitual? Assessorament setmanal de veus? Pregunta’ns.

Parla amb vendes Enterprise

L'API de conversió de text a veu de Speechify (API TTS) és una eina d'alta qualitat que utilitza tècniques avançades de síntesi de veu, aprenentatge automàtic i intel·ligència artificial per convertir text en veu amb so natural en una àmplia varietat de llengües, i ofereix centenars d'opcions de veus, inclosa la possibilitat de crear una veu personalitzada. Pot complementar fluxos de treball de transcripció, convertint el text transcrit en àudio realista per a aplicacions com eines d'accessibilitat, plataformes d'e-learning i creació de continguts multimèdia. Admet aplicacions en temps real, permetent als desenvolupadors crear locucions realistes amb IA, millorar l'experiència d'usuari i automatitzar processos.

Accés a l’API

Sí, l'API de conversió de text a veu de Speechify proporciona opcions de desplegament on-premise per a organitzacions amb necessitats específiques de seguretat o compliment normatiu. Això garanteix que tot el procés de conversió de text a veu romangui dins de la vostra infraestructura interna i ofereixi la màxima fiabilitat i baixa latència. Poseu-vos en contacte amb el nostre equip per comentar els vostres requeriments i explorar solucions a mida.

Accés a l’API

L'API de conversió de text a veu de Speechify és una API de veu multilingüe que ofereix veus naturals en una àmplia varietat de llengües i és capaç de gestionar tant textos escrits en una sola llengua com sortides de llenguatge mixt per optimitzar l'experiència global dels usuaris. Les llengües següents estan suportades:

Anglès, francès, alemany, espanyol, portuguès brasiler, portuguès, àrab, danès, holandès, estonià, finès, grec, hebreu, hindi, italià, japonès, noruec, polonès, rus, suec, turc, ucraïnès, vietnamita, bielorús, bengalí, búlgar, cantonès, català, croat, txec, filipí, georgià, gujarati, hongarès, indonesi, japonès, coreà, malai, mandarí, marathi, nepalès, persa, romanès, serbi, eslovac, tàmil, telugu, tailandès i urdú.

Estem treballant activament per afegir encara més idiomes.

Accés a l’API

Sí, l'API de conversió de text a veu de Speechify és compatible amb Speech Synthesis Markup Language (SSML). Aquesta funció permet als desenvolupadors controlar el to, la velocitat, les pauses, l'emoció i altres aspectes de la veu sintetitzada, millorant-ne la personalització per a aplicacions com ara audiollibres, plataformes d'e-learning i IA conversacional.

Accés a l’API

L'API TTS de Speechify és una eina potent àmpliament utilitzada en diversos sectors. En l' e-learning, millora el contingut educatiu amb narració realista, fent les lliçons més atractives i accessibles. Per a podcasts, ajuda a automatitzar les locucions i assegura una producció àgil. També és molt eficaç per a audiollibres, on converteix el text en veus humanes per oferir una experiència d'escolta immersiva. En xatbots i IA conversacional, proporciona veus realistes d'alta qualitat que milloren les interaccions amb els usuaris. A més, impulsa l'accessibilitat, afavorint la inclusió de les persones amb discapacitat visual, i suposa una revolució per a la creació d'aplicacions personalitzables amb veus úniques.

Accés a l’API

La integració és senzilla i només requereix coneixements bàsics d'APIs RESTful. Només cal que envieu peticions HTTP amb el vostre text en format JSON, configureu els paràmetres de veu i idioma, i recupereu la resposta d'àudio. Les guies d'integració detallades per a llenguatges de programació populars com Python, Java i JavaScript i els exemples de codi estan disponibles a la nostra documentació per ajudar-vos a començar ràpidament. Accediu a la nostra documentació per a instruccions pas a pas, SDKs i endpoints per a desenvolupadors.

Accés a l’API

L'autenticació es gestiona mitjançant claus API. Podeu obtenir la vostra clau des del vostre panell de control de Speechify. Per autenticar-vos, incloeu aquesta clau a la capçalera Authorization de les vostres peticions HTTP.

Accés a l’API

L'API de conversió de text a veu de Speechify admet formats d'arxiu d'àudio àmpliament utilitzats com MP3 i WAV, garantint la compatibilitat amb diferents aplicacions i dispositius, inclosos Windows, Android i Chrome. Podeu especificar el format preferit en els paràmetres de la petició per garantir la compatibilitat amb la vostra aplicació.

Accés a l’API

Sí, l'API de conversió de text a veu de Speechify ofereix una àmplia gamma de veus en diferents idiomes i dialectes. Podeu seleccionar atributs de veu específics com ara gènere, accent i to per adaptar-los als requeriments de la vostra aplicació. A més, l'API TTS permet la clonació de veu amb IA gràcies a les eines de reconeixement de veu, cosa que us permet crear una veu personalitzada per a aplicacions a mida.

Accés a l’API

Els límits depenen del pla de preus que seleccioneu. L'API de conversió de text a veu de Speechify ofereix diversos nivells, inclòs un pla gratuït per a necessitats bàsiques i opcions escalables per a textos i càrregues de treball més grans. Visiteu la nostra pàgina de preus per obtenir informació detallada.

Accés a l’API

Els preus estan estructurats en diferents plans segons el volum d'ús i les funcionalitats. Podeu trobar informació detallada sobre cada pla a la nostra pàgina de preus, i així seleccionar l'opció que millor s'adapta a les vostres necessitats. Speechify ofereix una franja gratuïta molt generosa.

Accés a l’API

La seguretat de les dades és una prioritat màxima. Speechify xifra totes les transmissions i compleix els estàndards del sector per garantir la privadesa i la seguretat del vostre text i de la veu sintetitzada.

Accés a l’API

En comparació amb proveïdors com ElevenLabs, PlayHT, IBM, Microsoft Azure, Amazon Polly i Google Cloud Text-to-Speech, Speechify destaca com la millor API de conversió de text a veu pel seu enfocament en la síntesi de veu en temps real, la generació de veus realistes i la funcionalitat avançada de SSML. Els nostres models de veu únics ofereixen una experiència d'usuari fluida i la millor combinació del mercat entre qualitat humana, controlabilitat, enfocament empresarial i escalabilitat.

Accés a l’API

Visiteu la nostra documentació oficial per trobar guies detallades, tutorials, referències de l'API i consells de resolució d'errors. Per a qualsevol dubte addicional, el nostre equip de suport està a la vostra disposició per ajudar-vos.

Accés a l’API

Sí, el suport per a SSML a través de l'API de Speechify Text to Speech us permet ajustar la velocitat, el to i la intensitat de la veu sintetitzada per adaptar-los a fluxos de treball o casos d'ús específics. Els paràmetres de configuració detallats es descriuen a la nostra documentació.

Accés a l’API

Sí, és legal utilitzar veus amb IA generades per l'API de conversió de text a veu de Speechify Voice API per a aplicacions aprovades, sempre que compligueu les nostres condicions de servei i la legislació vigent.

Accés a l’API

Sí, manteniu la propietat dels arxius d'àudio generats a través de l'API TTS de Speechify, fet que us garanteix el control total sobre el seu ús.

Accés a l’API

L'API TTS de Speechify utilitza aprenentatge automàtic avançat i intel·ligència artificial per crear veus humanes realistes. Aquestes veus naturals són ideals per a audiollibres, locucions i altres aplicacions que requereixen àudio d'alta qualitat.

Accés a l’API