Text a veu: Baidu
Baidu ha fet avanços importants en intel·ligència artificial (IA) aplicada als seus serveis d’internet. El text a veu de Baidu ofereix una experiència de lectura fluida per a diversos usos. Tanmateix, la IA de Baidu no és l’únic programari que pot funcionar amb els seus serveis.
Vegem quin programari TTS ofereix més possibilitats interessants amb Baidu.
Què és Baidu?
Baidu és un gegant xinès especialitzat en intel·ligència artificial i serveis relacionats amb internet. Baidu ofereix més de 50 serveis de recerca i comunitat, com ara:
- Baidu Cercador, el segon cercador més gran del món
- Baidu Maps, app i tecnologia de mapes
- Baidu Baike, enciclopèdia col·laborativa online
- Baidu Wangpan, servei d’emmagatzematge al núvol
- Baidu Tieba, fòrum en línia
Baidu ha invertit en recerca sobre aprenentatge profund i vol integrar noves tecnologies a les seves aplicacions i productes. El seu projecte més ambiciós és DeepVoice, un algorisme de síntesi de veu en temps real. Ja n’han creat tres versions:
- Deep Voice 1
- Deep Voice 2
- Deep Voice 3
L’última versió de DeepVoice pot crear veus humanes noves en temps real, molt més ràpidament que el seu gran competidor: WaveNet de DeepMind (Google).
Speechify funciona amb Baidu
Pots treure molt profit de qualsevol servei Baidu combinant-lo amb el programari de text a veu de Speechify.
Amb l’aprenentatge automàtic i la IA, Speechify pot llegir contingut digital de l’enciclopèdia o el fòrum Baidu amb una veu gairebé humana.
Fer servir Speechify amb Baidu Cercador t’ajuda a aprofitar millor els resultats i obtenir una resposta ràpida.
Avantatges d’usar Speechify en la recerca
El programa de text a veu de Speechify pot ser una eina molt útil per al cercador. Pot llegir-te els resultats de Baidu amb una veu natural, així pots triar ràpidament el que t’interessa més.
Pots ajustar la velocitat i revisar resultats més ràpid que llegint. A més, Speechify TTS et permet multitasca. Ideal per a estudiants i professionals: pots seguir escrivint o llegint mentre Speechify et llegeix els resultats.
Quan escoltis alguna cosa interessant, pots centrar-te en la pàgina i obrir el resultat que vulguis. Des d’allà, Speechify pot llegir la pàgina sencera mentre treballes amb les dades.
Speechify funciona en diversos idiomes
Speechify pot llegir textos en molts idiomes i accents. Cada idioma té diferents veus perquè triïs la que més s’adapta al que t’agrada escoltar.
En qualsevol versió de Speechify pots canviar d’idioma tocant la icona en forma de persona.
Els idiomes més populars són:
- Anglès
- Espanyol
- Xinès
- Francès
- Portuguès
Com utilitzar Speechify
El programari de text a veu Speechify està disponible en diverses plataformes. Segons el que necessitis, pots usar:
- Extensió per a Google Chrome
- App per a Mac
- App per a iPhone o iPad
- App per a Android
Sigui quin sigui el format, pots començar amb Speechify en tres passos:
- Descarrega la versió de Speechify que prefereixis.
- Segueix el tutorial en pantalla per personalitzar l’experiència TTS.
- Tria la veu que vulguis a partir de les mostres d’àudio.
Un cop hagis configurat Speechify, pots escollir:
- Convertir imatges en fitxers d’àudio
- Enganxar un text específic i escoltar-lo
- Importar fitxers de text directament
- Escoltar contingut d’un enllaç web
Speechify també ofereix una API que pots integrar a qualsevol web per escoltar contingut amb només un clic.
Descarrega l'extensió per al navegador
Speechify té l’extensió líder per a Google Chrome. Permet llegir gairebé tot el que veus a Chrome, com Google Docs. Pots fer-la servir per llegir emails, documents llargs i aprofitar millor les cerques.
Amb aquesta extensió, qualsevol document es converteix en un podcast per escoltar-lo allà on siguis, així que descarrega-la avui mateix.
Després de descarregar l’extensió de Speechify per al navegador, pots:
- Enllaçar el teu compte Speechify amb Apple o Gmail
- Afegir pàgines web a la teva biblioteca
- Seleccionar quines parts vols escoltar
- Canviar la veu i la velocitat de lectura
- Escoltar l’àudio en un altre idioma
Comença a utilitzar TTS per a Baidu avui
Si vols començar a utilitzar TTS per a Baidu per ser més productiu o evitar la fatiga visual, pots descarregar Speechify gratis avui mateix.
Preguntes freqüents
Què és Baidu TTS?
Baidu TTS és un sistema que converteix text en veu.
Què és Deep Voice 3?
Deep Voice 3 és un sistema neuronal totalment convolucional de text a veu. És tan natural com els sistemes més avançats de síntesi, però s’entrena 10 cops més ràpid.
Què és el TTS neuronal?
El TTS neuronal és un sistema d’IA que crea una veu sintètica gairebé indistingible d’una de real.
Quina diferència hi ha entre TTS neuronal i Deep Voice 3?
Deep Voice 3 és un sistema TTS neuronal que sintetitza veu molt més ràpid que el TTS neuronal tradicional.
Què és Text to Speech Baidu?
Text to Speech Baidu converteix qualsevol text en so mitjançant tècniques d’aprenentatge profund.
Com funciona el TTS neuronal?
El TTS neuronal té una xarxa neuronal i un vocoder. La xarxa converteix la seqüència de fonemes en un espectrograma. El vocoder transforma l’espectrograma en ones de veu.
Quins avantatges té usar Baidu TTS?
Baidu TTS es pot fer servir online i offline. Ofereix una experiència estable, fluida i natural per llegir o per a hardware intel·ligent.
Diferències entre Deep Voice 3 i Baidu TTS?
Deep Voice 3 és el model més nou de text a veu creat dins del projecte Deep Voice de Baidu Research.
Com funciona Deep Voice 3?
Deep Voice 3 té tres components:
- Un codificador que passa el text a una representació interna
- Un descodificador que converteix això en àudio
- Un convertidor que calcula els paràmetres finals del vocoder

