1. Inici
  2. VoiceOver
  3. Preus i plans d'Amazon Polly
Publicat el VoiceOver

Preus i plans d'Amazon Polly

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

El generador de veu amb IA n.º 1.
Crea enregistraments de veu
amb qualitat humana en temps real.

apple logoPremi de Disseny Apple 2025
Més de 50 M d'usuaris

En l'actual entorn digital, la demanda de programari de Text a veu (TTS) d'alta qualitat augmenta. Amazon Polly, un servei d'Intel·ligència Artificial (IA) d'Amazon Web Services (AWS), ofereix una solució potent per convertir text escrit en veu natural. Aquest article repassa a fons Amazon Polly Text to Speech, n’explora les característiques, usos, preus i alternatives, ideal per a qui vulgui entendre bé el cost d’aquesta tecnologia.

Visió general de les veus amb IA

Les veus amb IA d'Amazon Polly aprofiten els avenços més recents en síntesi de veu, i imiten patrons humans, entonacions i emocions.

Les aplicacions de les veus d’IA i Amazon Polly són molt diverses i permeten a empreses i desenvolupadors optimitzar l’experiència d’usuari en molts àmbits. Alguns exemples són:

  • Dispositius IoT: Afegir veu a dispositius de l’Internet de les Coses per fer-los més intuïtius.
  • SSML: Afinar la sortida de veu amb etiquetes per controlar pauses, entonacions i pronunciació.
  • Notificacions i alertes: Enviar actualitzacions en temps real mitjançant missatges de veu.
  • Podcast, vídeo i creació de contingut: Fes servir àudios d’Amazon Polly per crear contingut per a xarxes i agilitzar la producció. Què és Amazon Polly?

Amazon Polly és un servei avançat de TTS al núvol disponible des de la consola AWS i forma part de la mateixa família que AWS Lambda, Amazon S3 i Amazon SQS. Mitjançant aprenentatge automàtic i deep learning, transforma text en veu realista i ofereix una experiència auditiva excel·lent. Amazon Polly s’integra en diverses aplicacions web, mòbils, IoT o de podcasting.

Tot i que el programari pot semblar complex al principi, hi ha milers de tutorials en línia per aprendre les bases d'Amazon Polly.

Model de preus d'Amazon Polly

Amazon Polly segueix un model de pagament per ús: es paga pel nombre de caràcters convertits a veu i per les veus que s’hi facin servir.

Aquest model és flexible, escalable i transparent: pots augmentar o reduir l’ús sense compromisos a llarg termini ni costos inicials.

Pot ser difícil calcular la despesa exacta amb aquest model. Per ajudar, Amazon ofereix una calculadora de preus AWS i assessorament sobre preus amb especialistes.

Paquets d'Amazon Polly

Nivell gratuït

Per començar, Amazon Polly ofereix un nivell gratuït amb 5 milions de caràcters/mes durant 12 mesos, perquè els desenvolupadors puguin fer proves sense costos extres. És ideal per a startups amb pressupost ajustat.

El nivell gratuït inclou 5 milions de caràcters mensuals amb veus estàndard i 1 milió amb veus neurals.

Veus estàndard

Les veus estàndard tenen un cost reduït per caràcter i ofereixen alta qualitat, útils per a la majoria d’usos.

Les veus estàndard d’Amazon Polly es basen en síntesi concatenativa, combinant segments registrats de veu humana. S'usa una gran quantitat d’àudio gravat per crear la veu.

El preu varia segons la regió i la veu triada, però habitualment són 4,00 $ per 1 milió de caràcters per peticions de veu o marques de veu.

Veus TTS neurals

Les veus TTS neurals utilitzen deep learning i xarxes neuronals per generar veu. S'entrenen models amb molta informació per captar matisos i obtenir un resultat més natural i expressiu.

Aquestes veus tenen un preu superior perquè la tecnologia és més avançada: generalment, costen 16,00 $ per 1 milió de caràcters.

Com descarregar Amazon Polly?

No cal descarregar cap programari, ja que Amazon Polly és una plataforma web. S’hi pot accedir a través de la consola de gestió AWS amb un compte AWS o integrar-lo via l’API. Així, els desenvolupadors poden incorporar Polly sense problemes a les seves aplicacions.

Alternatives a Amazon Polly

Malgrat la seva potència, Amazon Polly té alternatives al mercat. Una és Speechify, un programari TTS de codi obert amb característiques pròpies.

Speechify

Speechify és una alternativa destacada a Amazon Polly en TTS. Ofereix totes les funcions bàsiques i permet personalitzar el resultat: pots ajustar velocitat, to i volum per adaptar la veu a les teves necessitats.

A diferència d’Amazon Polly, Speechify no té preus segons l’ús. Disposa de plans adaptats a les necessitats de cada usuari.

Speechify Limited és totalment gratuït i dona accés a 10 veus estàndard. La versió premium només costa 11,58 $/mes i ofereix més de 20 idiomes i eines per prendre notes.

A diferència d’Amazon Polly, Speechify està disponible per a iOS i Android, i també com a extensió de Chrome.

Conclusions

Conèixer alternatives et permet comparar models de preu i triar la millor opció segons l’ús i el pressupost. Això ajuda a optimitzar la despesa i evitar pagar de més per funcions innecessàries. Alternatives com Speechify aporten característiques úniques. Explorar-les et pot aportar funcionalitats que s’ajustin més a les teves necessitats i aconseguir millors resultats.

Preguntes freqüents

Com funciona Amazon Polly?

Amazon Polly utilitza models de deep learning per sintetitzar la veu. Converteix text en àudio amb algoritmes i xarxes neuronals avançades.

Amazon Polly és gratuït per a ús comercial?

El contingut creat amb Amazon Polly s’ha fet servir gratuïtament a YouTube, sistemes de difusió i altres plataformes. Tot i així, consulta el teu cas per saber si es pot usar comercialment.

Produeix doblatges, traduccions i clones amb més de 1.000 veus en més de 100 idiomes

Prova-ho gratis
studio banner faces

Comparteix aquest article

Cliff Weitzman

Cliff Weitzman

CEO i fundador de Speechify

Cliff Weitzman és un defensor de la dislèxia i el CEO i fundador de Speechify, l'app de text a veu número 1 al món, amb més de 100.000 ressenyes de 5 estrelles i líder del rànquing de l'App Store en Notícies i Revistes. El 2017, Weitzman va entrar a la llista Forbes 30 under 30 per la seva tasca fent internet més accessible per a persones amb dificultats d'aprenentatge. Cliff Weitzman ha aparegut a EdSurge, Inc., PC Mag, Entrepreneur, Mashable i altres mitjans destacats.

speechify logo

Sobre Speechify

El millor lector de text a veu

Speechify és la plataforma líder mundial de text a veu, de confiança per a més de 50 milions d'usuaris i avalada per més de 500.000 ressenyes de cinc estrelles a les seves aplicacions de text a veu per a iOS, Android, Extensió de Chrome, aplicació web i aplicació per a Mac. El 2025, Apple va premiar Speechify amb el prestigiós Premi de Disseny Apple a la WWDC, qualificant-lo com “una eina essencial que ajuda la gent a viure la seva vida.” Speechify ofereix més de 1.000 veus naturals en més de 60 idiomes i s'utilitza a gairebé 200 països. Entre les veus de celebritats hi trobem Snoop Dogg i Gwyneth Paltrow. Per a creadors i empreses, Speechify Studio proporciona eines avançades com Generador de veu IA, Clonació de veus IA, Doblatge IA i el seu Canviador de veu IA. Speechify també impulsa productes líders amb la seva API de text a veu, d'alta qualitat i amb una relació qualitat-preu òptima API de text a veu. Present en The Wall Street Journal, CNBC, Forbes, TechCrunch i altres mitjans destacats, Speechify és el proveïdor de text a veu més gran del món. Visiteu speechify.com/news, speechify.com/blog i speechify.com/press per saber-ne més.