A IBM é praticamente sinônimo de computadores e tecnologia moderna. É uma daquelas marcas como Microsoft e Apple que ficam gravadas na nossa cabeça — e por bons motivos. Eles criam alguns dos softwares mais avançados do mercado, cheios de recursos úteis para facilitar o nosso dia a dia.
Um desses softwares é, sem dúvidas, o IBM Watson. Um aplicativo de text to speech baseado em deep learning, pronto para transformar qualquer conteúdo escrito em um arquivo de áudio de alta qualidade usando diversas vozes realistas. Por isso, no texto a seguir, vamos te mostrar todos os detalhes desse app e avaliar se o preço realmente compensa.
O que é o Watson Text to Speech?
Em essência, o Watson Text to Speech é uma API em nuvem que oferece processamento de linguagem natural. Ele automatiza vozes geradas por IA que funcionam em diferentes idiomas para esse fim. Esses narradores soam muito naturais, quase indistinguíveis de vozes humanas reais. É um software excelente, com ótima funcionalidade e sem necessidade de tutoriais.
Você pode usá-lo como assistente virtual para se comunicar com parceiros estrangeiros na língua nativa deles, além de reduzir o tempo de espera em interações de atendimento ao cliente. Também aumenta a acessibilidade para pessoas com dislexia, TDAH ou deficiência visual. Mas vamos com calma: falaremos dos usos e benefícios em instantes.
Recursos
Como todo grande aplicativo, o Watson Text to Speech oferece muito aos seus usuários. Ele não é apenas uma ferramenta simples de síntese de fala em tempo real. Vai muito além disso. Então, vamos ver alguns dos recursos mais interessantes, certo?
Idiomas
O Watson Text to Speech suporta mais de 10 idiomas diferentes. Entre eles estão inglês, alemão, italiano, chinês, árabe e português. No entanto, ao contrário de alguns outros apps TTS, você pode importar texto em um idioma e pedir que o app leia em outro. Esse é um excelente recurso, especialmente útil para estudantes de idiomas estrangeiros.
Capacidades de edição
Embora este não seja um programa de edição propriamente dito, você pode brincar com algumas opções básicas de manipulação via SDK. Por exemplo, ao abrir o Watson Text to Speech, você já vê a caixa de texto onde pode começar a escrever ou colar um texto pronto. Depois, basta escolher o idioma e personalizar a voz.
Ou seja, é possível selecionar diferentes dialetos e vozes, além de ajustar velocidade e tom. Por exemplo, o inglês possui sotaques americano, britânico e australiano para você escolher. Claro, isso não é nada revolucionário em comparação com o que outros apps TTS oferecem hoje, mas já é mais do que suficiente para a maioria dos usuários.
Variedades de vozes
Como mencionado, cada idioma possui vozes diferentes. Isso significa que, para inglês americano, você pode escolher entre 11 narradores de IA. De Alisson a Michael, cada um tem suas próprias características. Além de masculino ou feminino, alguns são mais indicados para narração educacional e e-learning, enquanto outros são mais descontraídos e perfeitos para vídeos no YouTube.
O que o diferencia?
Então, o que torna o IBM Watson diferente de outras opções TTS do mercado? Além do peso da marca, este app realmente conta com ótimas vozes de IA, todas neurais, ou seja, ainda mais realistas. Além disso, você pode criar uma voz personalizada, o que é um diferencial bacana para criadores de conteúdo.
Mas não é só isso. O Watson Assistant tem ainda mais para oferecer. É possível personalizar a pronúncia de palavras. Esse recurso é útil para ajustar termos incomuns, tornando o resultado mais profissional.
Além disso, há a expressividade do narrador. Cada voz pode ter um estilo ao falar, como GoodNews, Apology e Uncertainty. Somando isso à personalização de tom, volume e velocidade, o resultado fica realmente impressionante.
Benefícios de uso
Tudo isso nos leva à pergunta mais importante: quem se beneficia mais com o IBM Watson Text to Speech? Muita gente! Desde donos de pequenos negócios que querem otimizar a experiência do usuário com um bom chatbot até quem cria vídeos para redes sociais ou e-learning. É uma ferramenta para todos nós. Mas será que vale a pena? Vamos ver.
Preços
Embora não seja um app open source, o Watson possui uma versão gratuita, chamada Lite. É uma boa solução para quem não pode investir em um software de text-to-speech no momento. Você pode transcrever até 10.000 caracteres por mês, usar 35 vozes e contar com 16 idiomas e dialetos para escolher.
Por outro lado, há os planos Standard, Premium e Deploy Anywhere. Os preços variam, e você pode entrar em contato com a IBM para negociar. Todos eles permitem transcrição ilimitada, 35 vozes, além de todos os idiomas e dialetos. A grande diferença está na integração com serviços de nuvem terceirizados, como o Google Cloud.
Speechify
É claro que, além do Watson, há outras opções no mercado de text to speech. Um dos apps mais populares é o Speechify, que vale muito a pena conhecer. Ele é baseado em modelos de machine learning, inteligência artificial e algoritmos OCR. Tudo isso permite tirar fotos de textos para que o Speechify leia em voz alta, além da transcrição básica de textos.
O Speechify oferece mais de 30 vozes de IA que falam em mais de 15 idiomas diferentes. O Speechify está disponível para smartphones iOS e Android, como app para computadores macOS e como plugin para os navegadores Google Chrome e Safari. Então, confira e transforme qualquer texto em áudio.
Perguntas frequentes
Posso usar o IBM Watson Text to Speech comercialmente?
O acordo SaaS que você faz com a IBM diz que você só pode usar o Watson TTS para fins pessoais, e não comerciais. Por exemplo, você não pode cobrar de outras pessoas para transcrever textos usando sua versão licenciada do Watson.
Como faço para baixar o app Watson Text to Speech?
Primeiro, você precisa criar uma conta na nuvem IBM. Depois disso, será redirecionado para a página de download, onde poderá escolher a versão (x64 ou x86) do Watson Text to Speech adequada para o seu dispositivo.

