MEDIA ZONE

Το Mozilla «συλλέγει» φωνές για να φτιάξει νέο πρόγραμμα αναγνώρισης ομιλίας

Το Common Voice έχει συγκεντρώσει περίπου 400.000 εγγραφές από 20.000 διαφορετικούς ανθρώπου – Μελλοντικά μάλιστα σκοπεύει να υποστηρίξει και άλλες γλώσσες εκτός από την αγγλική

Ο καθένας μπορεί εδώ και λίγες μέρες να «κατεβάσει» στον υπολογιστή του εκατοντάδες χιλιάδες δείγματα φωνής που έχει ήδη συλλέξει το Ίδρυμα Mozilla στο πλαίσιο του νέου έργου του Common Voice.

Πρόκειται για ένα σύστημα αναγνώρισης ομιλίας ανοιχτού κώδικα, το οποίο βασίζεται σε εθελοντές που υποβάλλουν δείγματα της ομιλίας τους. Στόχος του Mozilla είναι, μέσα από τη συλλογή των δειγμάτων αυτών, να εκπαιδεύσει μια νέα εφαρμογή ανοιχτού κώδικα για την αναγνώριση της ομιλίας.

Η συλλογή δειγμάτων φωνής ξεκίνησε πριν λίγους μήνες και μέχρι σήμερα το Common Voice έχει συγκεντρώσει περίπου 400.000 εγγραφές από 20.000 διαφορετικούς ανθρώπους, συνολικά περίπου 500 ώρες ομιλίας.
Διάφορα συστήματα τεχνητής νοημοσύνης, όπως της Google, εκπαιδεύονται στην αναγνώριση ομιλίας χρησιμοποιώντας δεδομένα των χρηστών. Στην περίπτωση του Mozilla (δημιουργού, μεταξύ άλλων, του δημοφιλούς προγράμματος διαδικτυακής περιήγησης Firefox), ο μηχανισμός αναγνώρισης της ομιλίας είναι ανοιχτός κώδικας, κάτι που θα επιτρέψει την επαναχρησιμοποίηση αυτής της τεχνολογίας.

Έως πρόσφατα, οι προγραμματιστές, επιχειρήσεις και ερευνητές που ήθελαν να πειραματιστούν και να αναπτύξουν νέες τεχνολογίες φωνής, είχαν πρόσβαση σε μια περιορισμένη συλλογή δεδομένων φωνής. Η συλλογή Common Voice είναι ήδη το δεύτερο μεγαλύτερο γνωστό δημόσιο φωνητικό σύνολο δεδομένων, καθώς άνθρωποι σε όλο τον κόσμο προσθέτουν σταδιακά και τη δική τους φωνή (σε πρώτη φάση μόνο στα αγγλικά).

Με τη δημιουργία του νέου δημόσιου συνόλου δεδομένων, το Mozilla Foundation συμβάλλει να ξεπερασθούν τα εμπόδια και να διευκολυνθεί η ανάπτυξη καλύτερων συστημάτων αναγνώρισης ομιλίας. Μελλοντικά μάλιστα σκοπεύει να υποστηρίξει και άλλες γλώσσες εκτός από την αγγλική.

Μπορεί κανείς να «κατεβάσει» με ελεύθερη άδεια «κοινού κτήματος» την πρώτη έκδοση της φωνητικής συλλογής Common Voice στη διεύθυνση: https://voice.mozilla.org/data.

πηγη protothema.gr