sabato, Settembre 7, 2024

Le cuffie basate sull’intelligenza artificiale ti consentono di ascoltare le singole voci in mezzo alla folla

Must read

Romano Strinati
Romano Strinati
"Esperto di social media. Pluripremiato fanatico del caffè. Esploratore generale. Risolutore di problemi."

Immagina di essere in un aeroporto affollato, a un concerto o in un bar rumoroso. Tutto intorno a te c’è un caos di suoni: gli altri parlano, la musica suona, tutti i tipi di rumore di fondo. Ma cosa accadrebbe se potessi scegliere di ascoltare la voce di una sola persona in modo chiaro e distinto in mezzo a tutto il rumore?

Questa è la visione alla base di un nuovo progetto di ricerca guidato da ricercatori dell’Università di Washington e Microsoft. Hanno sviluppato una nuova tecnica chiamata “Vedere una volta per ascoltare”, che ti consente di concentrarti sul discorso di una persona specifica, filtrando tutti gli altri suoni. La tecnologia viene quindi integrata in un paio di cuffie abilitate all’intelligenza artificiale.

Vedere una volta per ascoltare chiaramente

Questa tecnologia funziona guardando la persona che desideri ascoltare per alcuni secondi, tenendo premuto un pulsante sul lato dell’auricolare. Durante questi secondi, due microfoni a destra e a sinistra rilevano la firma vocale unica di una persona, anche se c’è molto rumore intorno.

Questa impronta vocale viene quindi utilizzata da un’app per smartphone o da un dispositivo specializzato per isolare la voce di quella persona. Anche se distogli lo sguardo o ti muovi, ora sarai in grado di sentire quella persona in modo chiaro e distinto, come se fossi solo nella stanza.

Le cuffie AI utilizzano l’apprendimento automatico avanzato per raggiungere questo obiettivo. Le registrazioni microfoniche insieme al rumore di fondo vengono elaborate da una rete neurale che è stata addestrata a distinguere e amplificare l’impressione vocale unica della persona target.

Molti usi per le cuffie con intelligenza artificiale

I ricercatori prevedono molte potenziali applicazioni per questa tecnologia. Potrebbe essere utile ascoltare una guida in un museo affollato o un insegnante in un’aula con molto rumore di sottofondo. Può essere utile anche per le persone con problemi di udito che hanno difficoltà a seguire le conversazioni in ambienti rumorosi. L’integrazione della tecnologia negli apparecchi acustici è il naturale passo successivo.

READ  Eiyuden Chronicle alla fine avrà un seguito: Eiyuden Chronicle: Hundred Heroes

Le cuffie AI sono attualmente in fase di prototipo, ma i ricercatori hanno dimostrato che funzionano con normali cuffie collegate a un piccolo computer. Sperano che questa tecnologia venga prima o poi integrata nei normali smartphone e negli auricolari wireless.

Leggi anche

Questo non è uno scherzo del pesce d’aprile!

Dyson Zone è il primo purificatore d’aria portatile di Dyson, che pulisce l’aria dai gas di scarico e dalle particelle, sopprimendo al tempo stesso i rumori indesiderati e offrendo un suono Hi-Fi puro.

Meglio della cancellazione del rumore

A differenza delle normali cuffie con cancellazione del rumore, che bloccano tutti i suoni, le nuove cuffie KI ti consentono di scegliere selettivamente il suono che desideri ascoltare. Rappresenta quindi un importante progresso nell’elaborazione audio e potrebbe rivoluzionare il modo in cui il suono viene percepito in ambienti rumorosi.

La tecnologia separa ciò che vuoi sentire e filtra il resto. Illustrazione: Università di Washington

E la traduzione?

Quando entri per la prima volta nel campo dell’intelligenza artificiale, è facile immaginare di poter anche eseguire traduzioni dirette da una lingua straniera nella tua lingua madre. Magari con la firma sonora del tema? Ciò significa che puoi viaggiare per il mondo senza traduttore e comprendere la maggior parte di ciò che viene detto intorno a te.

spiare

Non possiamo evitare di pensare se la tecnologia possa essere utilizzata per scopi dannosi. Perché cosa può impedire alle persone di spiare gli altri? Bene, per prima cosa devi isolare la voce della persona che ascolterai. Questo è il motivo per cui dovresti sederti relativamente vicino e la persona dovrebbe parlarti direttamente. I microfoni su ciascun lato della testa dovrebbero essere alla stessa distanza dalla bocca che ti sta parlando, in modo che il sistema possa distinguere il suono dall’ambiente circostante, poiché ciascun suono ha una durata diversa per ciascun orecchio. Se ti siedi troppo lontano dalla persona, la risposta di fase al suono non sarà abbastanza diversa dall’ambiente da poterla distinguere.

READ  Microsoft sta testando i bordi arrotondati della barra delle applicazioni, un nuovo menu di finitura e altro in Windows 11

Ma questo non ti impedisce di avvicinarti prima alla persona e di scambiare una bella parola durante la creazione di un profilo vocale. Quindi puoi ritirarti e spiare la persona quanto vuoi.

Se questa tecnologia deve essere utilizzata nei prodotti di consumo, la persona da comprendere deve condividere in qualche modo il suo consenso.

fonte: dl.acm.org

Geir Gerben Nordby

(Nato nel 1978): Giornalista. Gråbein non aveva mai avuto un lavoro a tempo pieno prima di Lyd & Bilde. Al contrario, è qui da quasi metà della sua vita, da quando ha inviato la sua domanda di lavoro all’indirizzo sbagliato nel 2001 (originariamente voleva andare in uno studio di registrazione con lo stesso nome). L’esperienza di Gråbein riguarda principalmente l’hi-fi, le cuffie e l’home cinema, ma occasionalmente brilla anche in altri ambiti.

More articles

Latest article