Dalla parola alla melodia: come l’intelligenza artificiale rivoluziona la creazione musicale. Sistemi per generare musica da un testo scritto, usando le tecnologie più avanzate di intelligenza artificiale sviluppate da Google e altri gruppi di ricerca

La musica è un linguaggio universale che gli uomini hanno sempre usato per esprime emozioni, sentimenti, idee e personalità. Ma è possibile generare musica da un testo, trasformando le parole in note, ritmi e armonie? La risposta è sì, grazie all’intelligenza artificiale (Ai) e ai suoi strumenti di generazione automatica di contenuti. La creazione di musica a partire da una descrizione testuale è una sfida che interessa molti settori musicali e non e che mette alla prova l’impiego delle ultime tecnologie.

In questo articolo vedremo come funzionano alcuni dei sistemi più innovativi che permettono di generare musica da un testo scritto. Google e altri laboratori di ricerca stanno combinando l’intelligenza artificiale con la creatività musicale. Cercheremo di capire quali possibilità offrono per compositori, musicisti, educatori e appassionati di musica, per trovare nuove idee, generare colonne sonore coinvolgenti e personalizzare l’esperienza musicale.

Indice

Cos’è la musica computazionale

La musica computazionale è una disciplina che da alcuni anni si occupa di studiare, analizzare, modellare e generare la musica usando il computer. Si basa su diverse aree della conoscenza, come la matematica, la fisica, la psicologia, la linguistica e l’informatica. Ha diverse applicazioni pratiche che permettono di usare il computer come uno strumento creativo per aiutare i compositori a generare nuove idee musicali o a completare le loro opere.

Il rapporto tra musica e tecnologia è importante perché permette di ampliare le possibilità espressive e creative, di arricchire la cultura musicale e di migliorare l’esperienza degli ascoltatori. Grazie al potere terapeutico della musica, i nuovi strumenti possono contribuire a risolvere alcuni problemi sociali, come l’isolamento, la depressione, l’ansia o la demenza. Con particolari software è possibile estrarre informazioni da opere e canzoni, come struttura, stile, genere, umore, emozioni e molto altro.

Studiare la musica con l’intelligenza artificiale consente di organizzare le playlist in base a criteri prestabiliti o personalizzati, ad esempio per suggerire agli utenti canzoni che potrebbero piacere in base ai gusti musicali o al contesto. Il computer può insegnare o apprendere la musica in modo semplice, interattivo e personalizzato e allo stesso tempo produrre suoni e brani musicali completi a partire da dati o algoritmi.

Generazione di musica da un testo

La generazione di musica da una descrizione testuale consiste nel produrre sequenze musicali a partire da un testo scritto che ne descrive il contenuto o le caratteristiche. Si tratta di un compito particolarmente difficile, perché il sistema deve capire il significato del testo, interpretarlo in termini musicali e generare una melodia coerente, originale e piacevole. Per realizzare questo compito, i sistemi di generazione di musica automatica usano principalmente due tipi di tecnologie: le reti neurali e i sistemi basati su regole.

Le reti neurali sono modelli matematici che imitano il funzionamento dei neuroni biologici. Sono in grado di apprendere da grandi quantità di dati e di generare nuovi dati simili a quelli di partenza. Le reti neurali sono molto usate nell’ambito dell’intelligenza artificiale, perché possono risolvere problemi complessi e non lineari, come la visione artificiale, il riconoscimento vocale o la traduzione automatica. Nella generazione di musica da una descrizione testuale, le reti neurali sono usate per apprendere le relazioni tra il testo e la musica, e per generare nuove sequenze musicali a partire da un testo dato.

I sistemi basati su regole sono modelli logici che usano un insieme di regole predefinite per manipolare i dati. Le regole possono essere basate su principi teorici, empirici o creativi. I sistemi basati su regole sono usati da molto tempo nell’ambito della musica computazionale, perché permettono di modellare la struttura, la grammatica e lo stile della musica. Nella generazione di musica da una descrizione testuale, i sistemi basati su regole sono usati per trasformare il testo in una rappresentazione musicale, e per applicare delle restrizioni o delle trasformazioni alla musica generata.

Spesso i sistemi di generazione di musica da un testo combinano le reti neurali e i sistemi basati su regole, per sfruttare i vantaggi di entrambe le tecnologie. Ad esempio, si può usare una rete neurale per generare una bozza musicale a partire da un testo, e poi usare un sistema basato su regole per raffinarla o modificarla secondo dei criteri musicali.

Sistemi per generare musica

La generazione di musica dal testo è una sfida che coinvolge diverse discipline, come l’informatica, la matematica, la linguistica e la musicologia. Per affrontare questa sfida, sono stati sviluppati diversi sistemi che sfruttano le potenzialità dell’intelligenza artificiale e del machine learning. Vediamo alcuni esempi di questi sistemi, che rappresentano lo stato dell’arte nel campo della musica computazionale.

Uno dei sistemi più noti è Magenta, un progetto di Google che mira a creare nuove esperienze musicali usando il deep learning. Magenta è in grado di generare musica a partire da un testo scritto, usando una rete neurale ricorrente che apprende da un corpus di brani musicali. Il sistema può anche ricevere in input uno stile musicale o un genere e adattare la sua generazione di conseguenza. Magenta è disponibile come libreria open source e come applicazione web, che permette agli utenti di creare e condividere le proprie composizioni musicali.

Un altro sistema innovativo è Jukebox, sviluppato da OpenAI, una società di ricerca dedicata all’intelligenza artificiale. Jukebox è un modello generativo che può produrre musica a partire da un testo scritto, usando una rete neurale convoluzionale che apprende da un vasto dataset di brani musicali. Il sistema può anche imitare lo stile e la voce di artisti famosi, come Frank Sinatra o Lady Gaga. Jukebox è in grado di generare musica di alta qualità e con una grande varietà di generi e stili.

Un terzo sistema degno di nota è Music Embedding, un tool per incorporare la teoria musicale nelle applicazioni di musica computazionale. Music Embedding è stato sviluppato da SeyyedPooya HekmatiAthar e Mohd Anwar, due ricercatori nel campo del suono e dell’intelligenza artificiale. Questo strumento permette di rappresentare digitalmente la musica in modo conciso e basato sulla teoria musicale. Il tool può essere usato per analizzare, processare e generare dati relativi alla musica, come note, accordi, scale e ritmi.

Lo sviluppo di Google MusicLm

MusicLM è il sistema più recente basato sull’intelligenza artificiale che può generare canzoni uniche basate sulle descrizioni testuali. Ad esempio scrivendo “jazz animato per una festa”, MusicLM creerà due versioni di una nuova canzone da ascoltare. Il modello si basa su una rete neurale ricorrente che apprende le relazioni tra le parole e i suoni, e usa un algoritmo di beam search per selezionare le sequenze musicali più probabili.

MusicLM è uno strumento sperimentale che fa parte di AI Test Kitchen, una piattaforma di Google che permette di testare le ultime novità nel campo dell’intelligenza artificiale. Per accedere a MusicLM, bisogna registrarsi al AI Test Kitchen sul web, su Android o su iOS. Una volta registrati, è possibile scrivere dei prompt e ascoltare le canzoni generate da MusicLM. Sì possono anche votare le tracce che piacciono di più, aiutando a migliorare il modello.

MusicLM è nato dalla collaborazione tra Google Research e vari musicisti professionisti, che hanno fornito feedback e suggerimenti per rendere lo strumento più creativo e utile. Sul sito del progetto é possibile ascoltare alcuni esempi di come i musicisti hanno usato il sistema di generazione musicale. Il suo scopo è stimolare la creatività per fare scoprire nuovi generi e stili.

In ogni caso, nonostante i progressi nell’intelligenza artificiale, la generazione automatica di musica può ancora risultare limitata nella sua capacità di creare composizioni musicali originali e sorprendenti. Spesso, il modello può produrre risultati prevedibili o ripetitivi, mancando di quella creatività e innovazione tipica dell’espressione umana.

Sfide della musica automatica

La generazione di musica da un testo è una sfida affascinante sia per i compositori che per gli ascoltatori. La possibilità di creare musica in modo rapido e semplice, senza bisogno di conoscere la teoria musicale o di saper suonare uno strumento, è indubbiamente qualcosa di rivoluzionario perchè offre a tutti la possibilità di esprimere le proprie emozioni, idee e storie usando il linguaggio naturale come mezzo di comunicazione.

Tutti possono sperimentare nuovi stili, generi e sonorità musicali, ampliando le proprie conoscenze e il proprio gusto musicale, scoprendo nuove musiche generate da altri utenti o da sistemi automatici e arricchendo la propria cultura musicale. Tuttavia la generazione di musica da una descrizione testuale presenta anche delle sfide e dei limiti che devono essere affrontati dai ricercatori e dagli sviluppatori.

Così come nel caso di ChatGpt per la scrittura, o dei sistemi per generare immagini in modo automatico a partire da una descrizione testuale, valutare la qualità e l’originalità della musica generata dipende da criteri estetici, culturali e personali. A lungo andare queste capacità del pubblico di ascoltatori potrebbero venire meno senza una adeguata preparazione culturale. Inoltre non è semplice garantire il rispetto del diritto d’autore e della proprietà intellettuale della musica generata automaticamente.

La creatività può essere influenzata anche da fonti preesistenti o da altri utenti come nel caso delle Ai cover. Queste sfide richiedono un approccio interdisciplinare che coinvolga diverse aree di conoscenza, come la musica computazionale, la linguistica computazionale, la psicologia, la sociologia e l’etica. Solo così si potranno sviluppare sistemi di generazione di musica da una testo efficaci, creativi e responsabili. Come sempre l’intelligenza artificiale ha potenzialità enormi, ma è necessario controllarla.