Οι λύσεις μετατροπής κειμένου σε ομιλία (TTS) είναι απαραίτητη υποβοηθητική τεχνολογία, βοηθώντας αμέτρητους χρήστες υπολογιστών να αλληλεπιδρούν με το γραπτό λόγο για ψυχαγωγία, σπουδές ή εργασία.
Όπως φαντάζεστε, η αγορά TTS είναι κορεσμένη, με δεκάδες εφαρμογές και επεκτάσεις προγράμματος περιήγησης. Οι περισσότερες είναι χρήσιμες, αυξάνουν την παραγωγικότητα και κάνουν τη χρήση πιο φιλική. Σήμερα, εστιάζουμε στη λύση TTS της Microsoft — Azure.
Τι είναι το Microsoft text to speech;
Τι είναι λοιπόν το Azure; Αν θέλετε να δημιουργείτε περιεχόμενο με φυσικές φωνές ή να ακούτε τα αγαπημένα σας sites με πολλές ρυθμίσεις για ταχύτητα, τόνο, προφορά κ.α., το Azure το προσφέρει — και πολλά ακόμα.
Το Azure είναι μια cloud πλατφόρμα με τεράστιες δυνατότητες. Μαζί με τις γνωσιακές υπηρεσίες Azure για μετατροπή κειμένου σε ομιλία και αναγνώριση ομιλίας, μπορείτε να αξιοποιήσετε αποθήκευση και ανάλυση στο cloud για ακόμα μεγαλύτερη παραγωγικότητα, χωρίς να ξέρετε μηχανική μάθηση.
Το Azure είναι ευέλικτο και συμβατό με λύσεις ανοιχτού κώδικα. Μπορείτε εύκολα να ενσωματώσετε φωνητική αφήγηση σε custom apps και να προσφέρετε ισχυρό machine learning στο κοινό σας, ειδικά με πάνω από 100 γλώσσες και διαλέκτους που παρέχει η πλατφόρμα.
Πώς να χρησιμοποιήσετε την εφαρμογή text to speech της Microsoft σε iPhone ή υπολογιστή
Η εγκατάσταση του Microsoft Azure στη συσκευή σας είναι απλή, με λίγα κλικ στην επίσημη ιστοσελίδα Azure. Ωστόσο, αν χρησιμοποιείτε μόνο Outlook, Word, PowerPoint, Docs, ή OneNote, δεν χρειάζεται να κατεβάσετε κάτι, αφού αυτά περιλαμβάνουν τη δυνατότητα ομιλίας Speak.
Η Speak μπορεί να μην προσφέρει κορυφαία ποιότητα, αλλά βγάζει ασπροπρόσωπη σε δύσκολες στιγμές και ρυθμίζεται πολύ εύκολα:
- Κάντε κλικ στο 'Προσαρμογή γραμμής εργαλείων'
- Επιλέξτε 'Περισσότερες εντολές'
- Κλικ 'Όλες οι εντολές'
- Βρείτε Speak, επιλέξτε το και πατήστε Προσθήκη
Εναλλακτικές στο Microsoft text to speech
Όπως είπαμε στην αρχή, υπάρχουν πολλοί text readers: από επαγγελματικές εφαρμογές για όλες τις ανάγκες, έως απλά SDK αναγνώρισης ομιλίας στο GitHub. Αν η φωνή του Microsoft TTS δεν σας ταιριάζει ή αν θέλετε κάτι διαφορετικό, δείτε μερικές εναλλακτικές που σίγουρα θα σας φανούν ενδιαφέρουσες.
Speechify
Στο #1 βρίσκεται το Speechify, κορυφαίο TTS εργαλείο που μετατρέπει σχεδόν τα πάντα σε ήχο. Συνεργάζεται με όλες τις εφαρμογές της Microsoft ενώ τα μοντέλα του προσφέρουν εκπληκτικά αποτελέσματα. Με ισχυρό API, καλύπτει κάθε σας ανάγκη.
Amazon Polly
Στο #2 είναι το Amazon Polly, γνωστό για φυσικές φωνές και πολλές επιλογές ομιλίας. Υποστηρίζει πολλές γλώσσες και το neural TTS δίνει πολλές ρυθμίσεις για εξατομίκευση σε κάθε σας έργο.
Google Cloud Text to Speech
Στο #3, το Google Cloud Text to Speech. Εκεί που υπάρχει τεχνολογική πρόοδος, θα βρείτε και τη Google — και στο TTS. Η λύση της Google χρησιμοποιεί SSML και πληρώνετε ανά χαρακτήρα, ιδανική για μεμονωμένα projects με χαμηλό κόστος.
IBM Watson Text to Speech
IBM Watson στη θέση #4. Αυτό που το ξεχωρίζει σε επαγγελματικά περιβάλλοντα είναι η ευελιξία: μπορεί να γίνει εικονικός βοηθός, εργαλείο υποστήριξης πελατών και TTS. Είναι πολύ οικονομικό — δύσκολα θα βρείτε καλύτερη προσφορά για τόσο ευέλικτη λύση.
Readspeaker
Στο #5 συναντάμε τον βετεράνο Readspeaker. Με εμπειρία σχεδόν 25 ετών, το TTS του είναι πραγματική τέχνη. Υποστηρίζει 100+ γλώσσες και είναι εξαιρετικό για στούντιο και e-learning, online ή offline.
NaturalReader
Στη θέση #6 το NaturalReader. Προσφέρει άριστη real-time ομιλία, δουλεύει με τις περισσότερες εφαρμογές PC κι έχει λειτουργία reader mode που καθαρίζει το κείμενο από διαφημίσεις και περιττά στοιχεία.
VoiceDream Reader
Στο #7 το VoiceDream Reader, τελευταία σημερινή εναλλακτική για το Azure TTS. Ενώ κάνει τα βασικά, πολλοί παραπονιούνται για ελλιπή προσβασιμότητα και συγχρονισμό. Αν χρειάζεστε γρήγορη λύση χωρίς τις πιο πρόσφατες τεχνολογίες, το VoiceDream επαρκεί.
Συχνές ερωτήσεις
Είναι δωρεάν το Windows 10 TTS;
Υπάρχουν πολλές TTS λύσεις για Windows 10. Κάποιες είναι δωρεάν, άλλες όχι. Η ενσωματωμένη Speak που λειτουργεί σε Outlook, Word κ.λπ. διατίθεται δωρεάν, ενώ υπηρεσίες όπως το Microsoft Azure με custom φωνές απαιτούν συνδρομή.
Ποια είναι η πιο ρεαλιστική TTS φωνή;
Οι πιο ρεαλιστικές TTS φωνές ανήκουν σε προηγμένα εργαλεία, π.χ. Amazon Polly και Speechify. Ο ρεαλισμός εξαρτάται από γλώσσα, μοντέλο και τις παραμέτρους που επιλέγετε.
Ποια η διαφορά μετατροπής κειμένου σε ομιλία και αναγνώρισης φωνής;
Αρκετά TTS διαθέτουν και τις δύο λειτουργίες, αλλά πρόκειται για ξεχωριστές τεχνολογίες. Η μετατροπή κειμένου σε ομιλία μετατρέπει το κείμενο σε ήχο ώστε να το ακούτε παράλληλα με άλλες εργασίες. Η αναγνώριση φωνής αναλύει τη φωνή για κατανόηση ή ταυτοποίηση.

