Teksto skaitymo balsu (TTS) sprendimai tapo būtina pagalbine technologija, padedančia daugeliui kompiuterių naudotojų bendrauti su tekstu – pramogoms, mokslui ar darbui.
Kaip suprantate, TTS rinka gana prisotinta – gausu programėlių ir naršyklės plėtinių. Daugelis jų tikrai naudingi, didina produktyvumą ir gerina patirtį. Šiandien daugiausia dėmesio skirsime Microsoft TTS sprendimui – Azure.
Kas yra Microsoft sintezė iš teksto?
Kas tada yra Azure? Galima paklausti kitaip: ar norėtumėte kurti turinį natūraliu balsu arba klausytis skaitymo su daug nustatymų, pvz., tempo, tono, tarimo? Microsoft Azure leidžia visa tai – ir dar daugiau.
Azure – debesų platforma, kupina galimybių. Be Azure kognityvinių paslaugų, kurios siūlo puikią sintezę iš teksto ir atpažinimą iš kalbos, galite naudotis debesų saugykla ir analitika bei dar labiau didinti produktyvumą be sudėtingų sistemų mokymosi.
Azure suderinama su įvairiais atvirais sprendimais, todėl yra labai lanksti. Balsų integravimas į programas ir mašininio mokymosi pranašumai jau prieinami ypač lengvai, nes Azure palaiko daugiau nei 100 kalbų ir jų variantų.
Kaip naudoti Microsoft sintezės programą iPhone ar kompiuteryje
Azure nustatyti savo įrenginyje paprasta – tereikia kelių paspaudimų registracijai oficialioje Azure svetainėje. Jei naudojate tik Outlook, Word, PowerPoint, Docs ar OneNote, nieko diegti nereikės – šiose programose jau yra įmontuota skaitymo balsu funkcija Speak.
Nors ši funkcija nėra aukščiausios kokybės, Speak praverčia prireikus ir ją itin paprasta įjungti:
- Spauskite Customize Toolbar parinktį
- Pasirinkite More Commands
- Spauskite All Commands
- Suraskite Speak, spauskite ir pridėkite Add
Alternatyvos Microsoft sintezės programai
Kaip minėjome, teksto skaitytuvų yra daug: nuo profesionalių programų su įspūdingomis kainomis iki vos veikiančių kalbos atpažinimo sprendimų GitHub. Jei Microsoft TTS asistentas netinka arba ieškote įvairovės, siūlome keletą alternatyvų, kurios tikrai sužavės.
Speechify
Pirmoje vietoje – Speechify. Geriausias TTS įrankis, paverčiantis bet ką garso įrašu. Veikia su visomis Microsoft programomis, o balsų kokybė nustebins. Galingos API galimybės – universali išeitis visiems poreikiams.
Amazon Polly
Antroje vietoje – Amazon Polly. Puikus sprendimas, žinomas dėl natūralių balsų ir įvairių skaitymo stilių. Palaiko daug kalbų, o neuroninė TTS technologija leidžia lengvai reguliuoti parametrus.
Google Cloud Text to Speech
Trečioje vietoje – Google Cloud Text to Speech. Google čia stipri, kaip ir kitur. Naudoja SSML žymėjimą, apmokestinimas vyksta už ženklus, todėl tinka vienkartiniams projektams.
IBM Watson Text to Speech
IBM Watson užima ketvirtą vietą. Ši sistema vertinama dėl universalumo versle – ją galima naudoti kaip asistentą, klientų aptarnavimą ar TTS įrankį. Be to, kaina labai patraukli.
Readspeaker
Penktoje vietoje – ilgametis Readspeaker. Ketvirtį amžiaus patirties sukaupęs įrankis palaiko virš 100 kalbų, puikiai tinka studijoms ir e. mokymuisi, veikia internete ir be jo.
NaturalReader
Šeštoje vietoje – NaturalReader. Gerai sintetina tiesioginę kalbą, veikia beveik su visomis programomis. Labiausiai išsiskiria režimu, kuris išvalo tekstą nuo nereikalingų elementų, pvz., reklamų.
VoiceDream Reader
Septintoje vietoje – VoiceDream Reader, paskutinė šiandienos alternatyva Azure. Ji tinka paprastoms užduotims, tačiau daugelis vartotojų skundžiasi ribotu pritaikomumu ir silpnu sinchronizavimu. Jei reikia greito sprendimo ir nesvarbi pati naujausia TTS technologija – šis pasirinkimas tinkamas.
DUK
Ar Windows 10 TTS nemokamas?
Windows 10 turi daug TTS sprendimų – yra ir nemokamų, ir mokamų. Integruota Speak funkcija (pvz., Outlook, Word) yra nemokama, bet pažangesni sprendimai, pvz., su pritaikomais neuroniniais balsais, reikalauja prenumeratos.
Kuris TTS balsas realiausias?
Realiausi balsai – sudėtingose TTS sistemose, pvz., Amazon Polly ar Speechify. Realumo lygis priklauso nuo kalbos, modelio ir pasirinktų nustatymų.
Kuo skiriasi sintezė iš teksto ir balso atpažinimas?
Nors daugelyje TTS programų yra abi funkcijos, jas reikia skirti. Sintezė iš teksto konvertuoja tekstą į garsą, o balso atpažinimas analizuoja žmogaus kalbą siekiant ją interpretuoti ar identifikuoti.

