A diferència de la clonació real, la clonació de veu és segura, fàcil d’aprendre i a l’abast de tothom amb connexió a internet. A més, no només és pràctica, sinó molt útil, i està revolucionant la manera com entenem l’educació, els negocis, els videojocs, la literatura i molts altres àmbits. Vols provar-ho? Continua llegint!
Què és la clonació de veu?
La clonació de veu és just el que imagines: replicar i generar la veu d’algú mitjançant la intel·ligència artificial (IA). Pot semblar ciència-ficció, però segur que ja n'has fet servir d’alguna manera. Recordes aquell Text to Speech (TTS) que llegia notícies com si fos l’Arnold Schwarzenegger? Això és un exemple de clonació de veu. Les extensions TTS bàsiques no són tan sofisticades ni potents per clonar veus. Tampoc cal que ho siguin. Les solucions avançades de clonació de veu analitzen molt més els patrons i permeten captar tots els detalls que fan única una veu. Com més detallada és l’anàlisi, més realista serà la veu i més avançat és l’aprenentatge automàtic.
Usos de la clonació de veu
La clonació de veu és més que una curiositat i té molts usos en educació, negocis, medicina, etc. Igual que amb la clonació real, hi ha qüestions ètiques (pensa en els deepfakes), però deixem els debats filosòfics per a un altre dia i centrem-nos en el costat positiu.
Educació
L’educació, de mica en mica, es digitalitza. No discutirem si això és bo o dolent, però sí remarcarem un fet clar: les pantalles i les videotrucades substitueixen aules i pissarres. Tenim més recursos per fer les classes més atractives. Amb la clonació de veu, per exemple, podem recrear veus històriques. Imagina’t escoltar Nikola Tesla explicant-te el corrent altern.
Audiollibres
Els audiollibres no són només eines educatives o de relax, sinó molt més importants. Per a persones amb discapacitat visual, són l’únic accés a la lectura. Amb clonació de veu, els audiollibres poden ser molt més entretinguts i atractius.
Serveis de Text to Speech
Abans de veure com funciona la clonació de veu i la síntesi de parla en temps real, repassem els programes TTS. Per exemple, Speechify és una de les solucions TTS més avançades. Què pot fer Speechify? Converteix qualsevol text en àudio, escaneja documents i fa locucions per a blogs, etc. Són apps accessibles i assequibles, ideals per acostar la clonació de veu al gran públic. De fet, Speechify ofereix veus de famosos, així pots escoltar una novel·la narrada per Gwyneth Paltrow. Prova-ho.
Com es creen les veus amb IA?
Ara podem explicar com realment es creen les veus amb IA i com aconsegueixen sonar humanes. Tranquil, no serà complicat. Com hem dit, la IA de clonació de veu fa servir deep learning per identificar què fa única cada veu: to, accent, volum... Tot això requereix una tecnologia potent, però és possible. El més important és donar molts àudios al sistema, igual que aprenem idiomes. Avui dia, algunes solucions només necessiten unes hores per recrear la veu (ideal si, per exemple, vols una veu històrica sense gaire àudio disponible).
Apps de Clonació de Veu
Hi ha moltes apps de clonació de veu, ara que internet és a tot arreu. Algunes són millors que altres. Aquestes són algunes de les nostres opcions preferides per crear veus sintètiques i treure el màxim partit de la síntesi de parla des de casa:
- Respeecher
- Murf
- Resemble
- Descript
Webs de Clonació de Veu
Si coneixes eines TTS, saps que no fa falta descarregar apps: pots usar extensions i webs. Passa el mateix amb la clonació de veu amb IA; per exemple, amb Zzlab. Però, per treure més profit dels programes de parla sintètica, et recomanem baixar Speechify o altres de la llista.
Preguntes freqüents
Quina diferència hi ha entre la clonació de veu i el voice morphing?
La resposta és simple: el voice morphing simplement altera la veu aplicant-hi un filtre digital. La clonació de veu és un procés més complex: fa servir aprenentatge automàtic per crear una IA que genera àudio propi, no només per modificar veus en temps real.
Quina és la persona més fàcil de clonar?
La veu més fàcil de clonar és la que té més mostres i àudios disponibles. Pots fer servir gravacions teves o buscar veus de creadors de contingut i famosos — els algorismes ja hi estan adaptats.

