Un passo avanti decisivo nello studio e nella gestione del rumore ambientale arriva da un gruppo di ricercatori italiani del Consiglio Nazionale delle Ricerche (CNR) e delle Università di Pisa e della Campania “Luigi Vanvitelli”, che hanno pubblicato su Nature Scientific Data due nuovi dataset aperti, DataSEC e DataSED, pensati per il riconoscimento e la classificazione automatica dei suoni ambientali reali.
Il lavoro, coordinato da Luca Fredianelli dell’Istituto di Processi Chimico-Fisici del CNR, è stato realizzato insieme a Francesco Artuso, Geremia Pompei, Gino Iannace, Andac Akbaba e Gaetano Licitra, responsabile del settore acustica ambientale di ARPAT e tra i maggiori esperti europei di inquinamento acustico.
Un archivio sonoro per l’intelligenza artificiale ambientale
I due dataset – scaricabili liberamente da Zenodo – mettono a disposizione oltre 35 ore di registrazioni autentiche in formato .wav, raccolte con fonometri di classe I e da archivi sonori open source.
- DataSEC (Sound Event Classification) comprende 4.292 campioni audio, ciascuno appartenente a una delle 22 classi e 28 sottoclassi: dal traffico veicolare agli aerei, dai canti degli uccelli al frinire delle cicale, fino a voci, musica, campane, allarmi e turbine eoliche.
- DataSED (Sound Event Detection) contiene 712 registrazioni reali con eventi multipli e oltre 4.000 etichette temporali che permettono di analizzare la presenza simultanea di più sorgenti sonore in contesti realistici, urbani e rurali.
Entrambi i dataset, standardizzati a 44,1 kHz mono, consentono di addestrare e validare reti neurali per la classificazione e il rilevamento automatico di eventi acustici, offrendo un supporto prezioso alla ricerca su inquinamento acustico, monitoraggio della biodiversità, pianificazione urbana e tecnologie smart-home.
Dalla misurazione al riconoscimento automatico
Finora, la mancanza di archivi sonori standardizzati e realistici ha frenato l’applicazione dell’intelligenza artificiale in acustica ambientale. Molti dataset internazionali si basano su suoni sintetici o campioni limitati.
DataSEC e DataSED superano questi limiti grazie a una costruzione rigorosa, che include:
- verifica manuale di ogni campione da parte di più operatori;
- etichettatura accurata tramite un software open source sviluppato dagli stessi autori;
- bilanciamento statistico tra le classi sonore più frequenti e quelle più rare.
Come spiega Gaetano Licitra, “questi archivi colmano un vuoto nella ricerca applicata, fornendo dati reali indispensabili per addestrare algoritmi di intelligenza artificiale capaci di distinguere le diverse sorgenti di rumore in ambienti complessi. È un passo verso strumenti più efficaci per la tutela acustica e la pianificazione sostenibile delle città”.
Una risorsa aperta per la comunità scientifica
Rilasciati con licenza Creative Commons, i due dataset sono pensati per essere espandibili e aggiornabili nel tempo, grazie ai contributi della comunità di ricercatori e tecnici del suono.
Il progetto si inserisce nell’ambito del PRIN 2022 “COMBINE – Sustainable Condition Monitoring of Wind Turbines using Acoustic Signals and Machine Learning Techniques”, finanziato dal Ministero dell’Università e della Ricerca nell’ambito di NextGeneration EU.
Verso città più silenziose e intelligenti
La possibilità di automatizzare il riconoscimento dei suoni ambientali apre nuovi scenari per la gestione del rumore urbano, la protezione della salute pubblica e la valutazione dell’impatto acustico di infrastrutture e impianti.
In prospettiva, questi strumenti potrebbero affiancare i sistemi di monitoraggio delle città europee, rendendo più efficiente la raccolta e l’analisi dei dati sonori in tempo reale.
“L’automazione dell’analisi acustica è un passo chiave per comprendere meglio il nostro ambiente sonoro e progettare spazi urbani più vivibili”, sottolinea Luca Fredianelli, primo autore dello studio.
Riferimenti
- Fredianelli L., Artuso F., Pompei G., Licitra G., Iannace G., Akbaba A. (2025), Environmental Noise Dataset for Sound Event Classification and Detection, Scientific Data (Nature).
- Dataset DataSEC: https://doi.org/10.5281/zenodo.15340689
- Dataset DataSED: https://doi.org/10.5281/zenodo.15346092

