TTS lugejate järele on suur nõudlus ja neid on palju. Aga kas kõik teksti kõneks lahendused pakuvad sama head tulemust? Enamik TTS-ekraanilugejaid suudab töödelda digitaalteksti Microsoft Wordi dokumentidest, HTML-veebilehtedelt või muud tüüpi failidest. Vähesed neist suudavad aga teisendada piltidel olevat lukustatud või füüsilist teksti loomuliku kõlaga kõneks. Need, mis seda teevad, kasutavad optilise märgituvastuse (OCR) tehnoloogiat.

Mis on OCR?
OCR ehk optiline märgituvastus (tekstituvastus) on tehnoloogia teksti automaatseks tuvastamiseks. Seda kasutatakse äris, igapäevaelus ja meelelahutuses. OCR-il on tavaliselt kaks osa: riistvara pildi skaneerimiseks ning tarkvara andmete eraldamiseks ja ümbertöötlemiseks. Peamine ja põnevam pool on tarkvara – see tunneb ära tähed, sõnad ja paneb neist kokku laused. Lisaks saab muidu lukustatud teksti, näiteks PDF-failides, hiljem redigeerida.
Kuidas OCR töötab
Optiline märgituvastus (OCR) muudab näiteks skannitud dokumendid, PDF-id või digikaamera pildid redigeeritavaks ja otsitavaks tekstiks. Tarkvara analüüsib dokumendi ülesehitust, tuvastab tekstiosad ning jagab need ridadeks, sõnadeks ja märkideks. Iga märki võrreldakse mustritega või tuvastatakse masinõppemudelite abil ning teisendatakse masinloetavaks tekstiks. Nii saab pildil oleva teksti digitaalselt töödelda.
Teksti kõneks ja OCR ühendamine
OCR-i ja teksti kõneks tehnoloogia ühendamine teeb info palju kättesaadavamaks ja kiiremaks tarbida. OCR tuvastab teksti piltidelt, skaneeritud dokumentidelt või trükimaterjalidelt ning muudab selle masinloetavaks tekstiks, mida TTS-tarkvara saab ette lugeda. Selline lahendus aitab näiteks nägemispuudega inimesi, muudab raamatud või dokumendid helifailideks, võimaldab trükitud võõrkeelset teksti reaalajas kõnesse tõlkida. OCR ja TTS lubavad tekstiga suhelda paindlikumalt – info muutub kõigile lihtsamini kättesaadavaks, sõltumata lugemisoskustest või -võimetest.
Teksti kõneks ja OCR-i kasutusvaldkonnad
OCR-i ja TTS-i kooskasutus avab palju võimalusi info paremini kättesaadavaks tegemiseks erinevates olukordades. Siin on mõned foto teksti kõneks kasutusalad:
- Abitehnoloogia nägemispuudega inimestele: loeb ette teksti raamatutest, dokumentidest või ekraanidelt, aidates neil sisu „lugeda”.
- Õppimine ja haridus:
- Toetus düsleksiaga õpilastele: muudab teksti kõneks ja toetab lugemisraskustega õppijaid.
- Mitmemoodiline õppimine: võimaldab kuulata ja lugeda korraga, parandades arusaamist ja meelespidamist.
- Tõlge ja keeleõpe: võõrkeelse teksti ettelugemine parandab hääldust ja mõistmist.
- Digitaalse sisu tarbimine: muudab raamatud, artiklid ja muu trükitud teksti audioraamatuteks või taskuhäälinguks liikvel olles.
- Dokumentide ligipääsetavus: teeb PDF-id ja muud muudetamatud formaadid kõigile kuulatavaks.
- Ajalooliste dokumentide analüüs: muudab vanad käsikirjad ja arhiivid kuulatavaks, sobides uurijatele ja huvilistele.
- Äri ja produktiivsus: loeb prinditud aruanded kiiretele spetsialistidele ette.
- Korrektuur: aitab autoritel ja toimetajatel vigu leida, lastes teksti valju häälega ette lugeda.
- Meelelahutus: muudab koomiksid, graafilised romaanid ja muu visuaalse meedia kuuldavaks kogemuseks.
Kuidas pildilt teksti ette lugeda
Paljud Apple'i ja Androidi kasutajad ei teagi, et nende seadmetes võib olla OCR-i ja TTS-i tugi, mis võimaldab lihtsalt teksti kõneks muuta. Sisseehitatud TTS-funktsioonid võivad olla tasuta abirakendused, mis loevad teksti pildilt, kuid nende kvaliteet jääb alla parematele teksti kõneks programmidele. Siit leiad juhised, kuidas Androidi ja Apple'i seadmetes kasutada piltidelt teksti ettelugemist:
Android
Android-seadmetel (Android 12 ja uuemad) on sisseehitatud TTS-lugeja. See sobib näiteks navigeerimiseks või lühikese teksti lugemiseks. Samuti saab lugeda teksti piltidelt. Seadista seade nii:
- Ava „Seaded” ja sealt menüü „Juurdepääsetavus”.
- Lülita sisse „Select to Speak”.
- Mine TTS-lugeja seadistustesse ja aktiveeri valik „Loe teksti piltidelt”.
- Naase avakuvale ja ava „Kaamera” rakendus.
- Suuna kaamera raamatu, ajalehe või muu teksti ekraani poole.
- Vajuta „Select to Speak” nuppu ja puuduta seejärel mõnda sõna „Kaamera” äpis.
Androidi TTS-lugeja alustab ettelugemist tähistatud sõnast. Tekstikatkeid saab valida sõrmega, sarnaselt tekstitöötlusprogrammis valimisele.
Apple
Teksti ettelugemiseks iPhone'is on vaja töötavat kaamerat, iOS 15 või uuemat versiooni ning sisse lülitatud TTS-lugejat.
- Ava „Seaded” ja vali „Juurdepääsetavus”.
- Vali „Spoken Content”.
- Lülita sisse „Speak Selection” ja „Speak Screen”.
- Naase avakuvale ja ava kaamera.
- Suuna kaamera lehe poole ja oota, kuni kuvatakse „Live Text” nupp.
- Puuduta nuppu, et lubada OCR ja ekraanilugemine.
- Libista kahe sõrmega alla, et alustada ettelugemist lehe ülaosast.
- Puuduta sõna või vali ekraanil tekstiosa, mida soovid ette lugeda.
Nagu Androidi seadmetel, on ka iPadidel ja iPhone’idel OCR-i ja TTS-i võimalused piiratud. Kuigi tekstituvastus on üsna täpne, kõlab hääl siiski mõnevõrra robotlikult.
Speechify – parim TTS koos OCR-iga
Sisseehitatud TTS-lugejad ja OCR-tarkvarad on mugavad, kuid nende kvaliteet ja tulemus võivad jääda tagasihoidlikuks. Õnneks on olemas tugev alternatiiv – Speechify on teksti kõneks lugeja, mis ühendab OCR-tehnoloogia ja kvaliteetsed AI-hääled. See ületab tavalisi mobiilseid tekstilugejaid – suudab skannida ja töödelda terveid raamatuid ja paberdokumente digitekstiks. Nutikas algoritm loeb seejärel teksti ette loomuliku kõlaga häälega, mille kiirust saad ise valida. Speechify teksti kõneks tarkvara on saadaval nendel platvormidel:
Laadi Speechify alla Apple'i App Store'ist, Google Playst, Maci töölauale või Chrome'i laiendusena – ühe litsentsiga saad seda kasutada kõigis oma seadmetes. Lihtne liides sobib nii algajale kui ka kogenud kasutajale. Speechify OCR töötab reaalajas, et lugeda teksti ette otse võrgus.
Speechify sobib düsleksiaga, lugemisraskustega, nägemispuudega inimestele ja ka neile, kes armastavad mitut asja korraga teha – see pakub rohkem kui tavaline ekraanilugeja. Sellega saad muuta füüsilise või digitaalse teksti audioraamatuks, teha taskuhäälingut või lihvida lugemisoskust lihtsamalt ja keskendunumalt. Proovi Speechify kõnetarkvara tasuta ja kohanda lugemiskogemus endale sobivaks. Speechify’s on ka veebipõhine AI Voice Generator, millega saad oma teksti prooviks ette lugeda lasta.

