Il mio blog

Simone Foschi

Frontend Developer

‹ Back to Blog index


Mozilla Common Voice cos'è e i numeri in Italia

Simo 2020/3/15

updated 2020/3/15


Al RiminiLUG ci sono alcune persone che per interesse personale hanno bisogno di un sistema di riconoscimento vocale Open Source.

In passato abbiamo anche realizzato un assistente vocale con un Raspberry PI e MyCroft.

L'interesse per gli assistenti vocali Open Source deve tenere in considerazione le tecnologie che lo permettono, e il progetto Common Voice di Mozilla è una di queste, forse il suo pezzo più fondamentale.

Esso permette di raccogliere le voci donate dalle persone per consentire ai software di intelligenza artificiale di analizzarle e creare dei pattern tramite i quali possano sviluppare l'abilità nel riconoscere un insieme molto grande di voci e di dialetti in forma di comandi vocali.

Voglio fare questo articolo per sponsorizzare a titolo gratuito un iniziativa lodevole (tra le tante) Open Source da parte di Mozilla Foundation.

Secondo me la tecnologia che sta alla base del riconoscimento vocale da parte delle macchine, è un ambito che se sviluppato a dovere può avere ricadute importanti sulla tecnologia e sulla vita delle singole persone.

Un po' di storia

Il riconoscimento vocale qualche anno fa è entrato di prepotenza nelle nostre vite, senza un vero controllo sulla privacy da parte dei fornitori e preinstallato in quasi tutti i telefonini android da maggio 2016, nei dispositivi Apple con Siri dall'iPhone 4s, nelle auto, sul desktop e via via in un crescendo di dispositivi.

Il debutto di questa tecnologia negli assistenti casalinghi quali Google Home e Amazon Echo Dot ha portato con se varie considerazioni a riguardo della privacy ed un buon numero di abusi da parte delle aziende che ne gestiscono i server centralizzati.

Mozilla Common Voice ci viene incontro, consentendo agli sviluppatori di avere a disposizione un Dataset molto completo utilizzabile per i loro progetti Open Source, che dovrebbero garantire un livello di privacy eccellente (condizionale d'obbligo).

Cos'è Mozilla Common Voice

Mozilla Common Voice è un progetto di crowfunding non pensato per raccogliere soldi ma bensì la voce delle persone possibilmente in tutte le lingue del mondo e con la miriade di accenti esistenti.

Lo scopo è di creare un Dataset di voci in lingua liberamente accessibile, pensato per dare ai ricercatori e dagli sviluppatori software un archivio tramite il quale sviluppare in maniera open progetti di riconoscimento vocale e quant'altro si può inventare.

Su https://www.mozillaitalia.org/home/tag/common-voice/ potete avere una panoramica migliore dell'argomento

È una delle rare iniziative Open Source di un certo successo, che tenta di rendere giustizia a chi desidera più privacy nel riconoscimento vocale.

Collegandosi al sito https://voice.mozilla.org/ (cosa per la quale ho creato questo post) si può iniziare a donare la propria voce al progetto leggendo delle frasi e verificare quelle delle altre persone che hanno aderito all'iniziativa su base volontaria.

Progetti che ne fanno uso

https://mycroft.ai

https://github.com/mozilla/tts

https://github.com/mozilla/voice-web/tree/master/server/data

Un po' di numeri

Facendo il login a https://voice.mozilla.org/ si possono vedere anche le statistiche delle voci donate e controllate, oltre che tenere traccia dei propri progressi.

Ad oggi per la lingua italiana siamo piuttosto scarsetti e giornalmente vedo sempre sulle 60 registrazioni inserite, giorno più giorno meno.

Quelle controllate sono un pelino in più, ma è vero che è anche più semplice controllarle, piuttosto che leggere dei testi a volte complicati.

Negli Stati Uniti arrrivano sempre alla soglia delle 2400 registrazioni giornaliere.

Dai ragazzi/e diamoci da fare e aiutiamo questo progetto. È semplice e non ci vogliono attitudini particolari a parte......saper leggere ;)

Per i commenti -> https://mastodon.uno/@simooooone/103827951105331086

‹ prevnext ›

‹ Back to Blog index