1. Avaleht
  2. TTS
  3. Mis on teksti kõneks ja häälsünteesi ajalugu?
Avaldatud TTS

Mis on teksti kõneks ja häälsünteesi ajalugu?

Cliff Weitzman

Cliff Weitzman

Speechify tegevjuht/asutaja

apple logo2025. aasta Apple'i disainiauhind
50M+ kasutajat

Tekst kõneks (TTS) ja häälsüntees võivad tunduda uued tehnoloogiad, kuid nende ajalugu ulatub sajandite taha.

Varastest inimkõnet matkivatest mehhaanilistest seadmetest kuni tänapäevase tehisintellekti ja süvaõppeni on TTS areng olnud põnev teekond.

Selles artiklis uurime teksti kõneks ja häälsünteesi ajalugu ning vaatame põnevaid tulevikuväljavaateid.

Tekst kõneks ja häälsüntees: algusaegadest tänapäevani

18. ja 19. sajand

Teksti kõneks ja häälsünteesi ajalugu sai alguse 18.–19. sajandil. Sel perioodil tehti esimesed katsetused kõnesünteesiks, kasutades vaid mehhaanilisi seadmeid. 1770ndatel töötas ungari leiutaja Wolfgang von Kempelen välja akustilis-mehaanilise kõnemasina, mis imiteeris inimese hääletrakti. See analoogseade kasutas lõõtsa, vilesid ja torusid, et toota vokaali- ja konsonandihääli.

18. sajandi lõpus leiutas inglise füüsik Charles Wheatstone Kempeleni masina mehhaanilisema versiooni, mida ta nimetas "kõnemasinaks". See seade suutis matkida eri muusikainstrumentide helisid. Kuigi see polnud mõeldud otseselt kõnesünteesiks, kinnistas see mehhaaniliste heligeneraatorite idee.

19. sajandil arendati ka teisi seadmeid, sh Faber'i "tehisjutu" masin, mis kasutas mehaanika ja pneuma kombinatsiooni, et luua kõnehääli.

20. sajandi algus ja esimene täiselektriline kõnesüntees

20. sajandi alguses muutus kõnesünteesi tehnoloogia keerukamaks esimese täiselektrilise kõnesüsteemi – Homer Dudley loodud vookoodri – leiutamisega. Seade loodi Bell Labsis New Jerseys.

Dudley vookooder kasutas rida resonaatoreid ja filtreid, et luua sünteetilist kõnet. 1939–1940. aasta New Yorgi maailmanäitusel demonstreeriti seda "Voder" nime all. Masinat kasutati klaviatuuri ja jalgpedaalidega kõne loomiseks.

1950ndate algus kuni 1970ndate lõpp – sünteesaatorite tõus

1951. aastal innustas Dudley töö Dr. Franklin S. Cooperit looma Haskinsi laboris süsteemi "pattern playback". Seade analüüsis salvestatud heli ning jagas selle spektraalseteks mustriteks, mis salvestati lintidele ja mängiti sünteetilise helina ette.

1976. aastal jõudis turule esimene äriliselt edukas teksti kõneks süsteem Kurzweil Reading Machine. Seda kasutati peamiselt abivahendina puuetega inimestele, kuid peagi muutus see laialt levinud lugemisabiks. Süsteem kasutas sünteesi, mis ühendab eelnevalt salvestatud foneeme ja sõnu, et luua kõnet.

1978. aastast alustas Texas Instruments tööd kõnesünteesikiibiga, mida kasutati videomängudes ja muus arvutitarkvaras. Kiip kasutas kontaktiivset sünteesi, ühendades salvestatud kõneühikuid (difoonid), et saada inimkõne moodi tulemus. Seda tehnoloogiat kasutati ka DECtalkis, mis pakkus kvaliteetset tuge kõnesünteesiks puuetega kasutajatele.

Kaasaegsed teksti kõneks süsteemid

Viimaste aastate üks võtmetäiustusi on närvivõrkudel põhinev sünteetiline kõne. Google ja Microsoft on loonud kõrgtasemel TTS-süsteeme, mis kasutavad süvaõpet suurte inimhäälte andmekogude pealt, et toota loomulikult kõlavaid hääli.

Veel üks oluline areng sünteesitehnoloogias on ühikuvaliku ja kontaktiivse sünteesi levik. Need võimaldavad luua realistlikumat kõnet salvestatud väikeste ühikute (difoonid või sõnad) kombineerimise teel. Seda kasutavad nt Speechify, Apple Siri ja Amazon Alexa ning ka vanemad lahendused nagu IBM ViaVoice.

Ka kõnetuvastuse tehnoloogia on viimastel aastatel teinud suure arenguhüppe, mis on võimaldanud TTS-süsteemidel muutuda veelgi arenenumaks. Kõnetuvastuse algoritme kasutades muutuvad sünteetilised üleminekud loomulikumaks.

Viimastel aastatel on tehtud edusamme ka prosoodia ja intonatsiooni osas – kõne kõlab loomulikumalt, selles on pausid, rõhud ja toonimuutused. Prosoodia on eriti oluline näiteks inglise keeles, kus rõhul ja intonatsioonil on lause mõtte jaoks suur tähtsus.

Süvaõpe ja tulevik: uus ajajärk

TTS-tehnoloogia tulevik on põnev ja lootustandev. AI ja süvaõppe arenguga muutub sünteetiline kõne üha loomulikumaks, suutes jäljendada kõne peensusi ja nüansse.

Eriti kasulik on see virtuaalsete assistentide ja vestlusrobotite arendamisel. Need muutuvad järjest vestluslikumaks ning kasutajad saavad nendega loomulikumalt suhelda.

Samuti oodatakse arenguid foneetilises transkriptsioonis ehk teksti-foneemideks teisendamises. Masinad muutuvad täpsemaks kõne äratundmises ja tõlgendamises, mis parandab pidevalt hääletuvastussüsteemide täpsust ja kiirust.

TTS-tehnoloogia laiem levik ja igapäevaellu põimumine jätkub. Mida rohkem seadmeid saab ühendatud asjade internetti, seda rohkem saame neid päriselt häälkäsklustega juhtida – mugavamalt ja tõhusamalt.

Liitu teksti kõneks revolutsiooniga Speechifyga

Kui otsid võimekat teksti kõneks teenust, mis toodab loomuliku ja kvaliteetse jutustuse, vali Speechify.

Speechify kasutab moodsat formatsünteesi tehnoloogiat, et luua tõetruud ja loomulikud hääled – erinevalt varasematest robotlikest häältest. Isegi sellised tuntud nimed nagu Stephen Hawking oleksid Speechify'st muljet avaldanud.

Speechify'd kasutada on lihtne – külasta veebisaiti või laadi alla mobiilirakendus ja sisesta oma tekst. Vali sobiv hääl, timmi kiirust ja tooni ning valmis! Speechify sobib suurepäraselt e-õppeks, selgitavate videote, podcastide ja esitluste jutustamiseks. Võid luua ka enda kohandatud hääli YouTube'i jaoks ja sotsiaalmeediasse.

Ära lepi kehvemate TTS-teenustega – proovi Speechify'd juba täna ja koge teksti kõneks tulevikku.

KKK

Kes töötas välja maailma esimese kõnesünteesija?

Homer Dudley lõi maailma esimese kõnesünteesija 1930ndate alguses New Yorgi Bell Laboratoriesis.

Mis on kõnesünteesi eesmärk?

Kõnesünteesi eesmärk on genereerida tekstist kunstkõne, kasutades keeleanalüüsi ja sagedusanalüüsi.

Millised on neli TTS kasutusviisi?

TTS-i kasutatakse ligipääsetavuseks, meelelahutuseks, keeleõppeks ja häälteenuste automatiseerimiseks.

Millised on teksti kõneks eelised?

Tekst kõneks suurendab ligipääsetavust, toetab õppimist ja tõstab tõhusust, võimaldades tarbida tekstilist sisu kuulates.

Mis oli teksti kõneks arengu üllatuslikem hetk?

Üks üllatavamaid hetki teksti kõneks arengus oli Charles Wheatstone'i mehhaanilise kõnesünteesi masina leiutamine.

Naudi tipptasemel AI-hääli, piiramatult faile ja ööpäevaringset kliendituge

Proovi tasuta
tts banner for blog

Jaga seda artiklit

Cliff Weitzman

Cliff Weitzman

Speechify tegevjuht/asutaja

Cliff Weitzman on düsleksia eestkõneleja ning Speechify tegevjuht ja asutaja. Speechify on maailma populaarseim kõnesünteesi rakendus, millel on üle 100 000 viietärnilise arvustuse ja mis on App Store'is Uudiste & Ajakirjade kategoorias esikohal. 2017. aastal kanti Weitzman Forbesi „30 alla 30” nimekirja tema töö eest interneti ligipääsetavuse parandamisel õpiraskustega inimestele. Cliff Weitzmanist on kirjutanud ka EdSurge, Inc, PC Mag, Entrepreneur, Mashable ja paljud teised juhtivad väljaanded.

speechify logo

Speechify'st

#1 tekst kõneks rakendus

Speechify on maailma juhtiv tekst kõneks platvorm, mida usaldab üle 50 miljoni kasutaja ja millele on antud enam kui 500 000 viietärnilist arvustust selle tekstist kõneks tehnoloogia eest iOS-, Android-, Chrome Extension-, veebirakendus- ja Mac desktop-rakendustes. 2025. aastal pälvis Speechify Apple’ilt prestiižse Apple’i disainiauhinna WWDC-l, nimetades seda „oluliseks ressursiks, mis aitab inimestel paremini elada.” Speechify pakub üle 1 000 loodusliku kõlaga hääle rohkem kui 60 keeles ning seda kasutatakse ligi 200 riigis. Kuulsuste häältest on saadaval näiteks Snoop Dogg ja Gwyneth Paltrow. Loojatele ja ettevõtetele pakub Speechify Studio täiustatud tööriistu, sh AI-häälegeneraatorit, AI-häälekloonimist, AI-dubleerimist ja AI-häälevahetust. Speechify panustab ka juhtivatesse toodetesse tänu kvaliteetsele ja kuluefektiivsele tekst kõneks API-le. Esindatud näiteks The Wall Street Journal, CNBC, Forbes, TechCrunch ja muudes juhtivates meediakanalites, on Speechify maailma suurim kõnesünteesi teenusepakkuja. Vaata lisaks: speechify.com/news, speechify.com/blog ja speechify.com/press.