Indica un intervallo di date:
  • Dal Al
tecnologia

Dal testo alla musica: ecco come funziona MusicGen, il ChatGpt della musica di Meta

Come funziona l’intelligenza artificiale generativa applicata alla musica. Ne avevamo brevemente discusso chiacchierando (e  ascoltando) MusicLM nelle nostre lezioni di Ai generativa.  Il modello realizzato dal alcuni ricercatori di Google che genera musica ad alta fedeltà da descrizioni testuali. Tipo: “una melodia di violino calmante accompagnata da un riff di chitarra distorto”.  In questi giorni è stato rilasciato in formato open source il codice di Music Ge di Meta.

Come funziona Music Gen

Il funzionamento è simile dei Chatbot più noti. Si scrive il tipo di musica che si vuole, gli strumenti e lo stile e il software al posto di un testo genera un file audio. Si può anche allegare un file audio per integrare l’”ispirazione”. Nel paper di presentazione c’è scritto che il trasformer si è allenato su un catalogo di circa 10 mila brani musicali in alta qualità, oltre ai contenuti derivati dalla piattaforma di immagini video e musica Shutterstock e da Pond5. I modelli messi a disposizioni hanno un taglio diverso. Da 300 milioni di parametri a 3,3 miliardi. Più parametri ci sono e più alta sarà la qualità audio del file prodotto ma anche l’accuratezza dell’abbinamento del testo con l’output audio. Il campionamento del suono è stato prodotto a 32 kHz e corredati di metadati relativi a generi, descrizioni sintetiche e bpm.

I ricercatori hanno anche pubblicato un demo che permette agli utenti di sperimentare l’Ai generando file musicali della durata massima di 12 secondi. Il risultato è discutibile ma sicuramente interessante.

Per approfondire. 

A proposito di Ai generativa, come funziona il copilota di Microsoft per il web?

Da prodotto a piattaforma, le novità di Bing, Microsoft Designer ed Edge

Come si misura l’”intelligenza” di Gpt-4?

Come si scrive un prompt per Midjourney? 

Adobe Firefly, Dall-E2 e Midjourney, scopri le differenze #Datavizandtools

Come riconoscere immagini e testi generati dall’AI? Parte 2 #Datavizandtools

ChatGpt è un buon programmatore, non è un sofware engingeer e neppure uno sviluppatore.

Wikipedia, l’intelligenza collettiva e gli affari #datavizandtools

L’Ai ha cambiato Bing: tutte le novità (finora)

Scrivi qualche riga e il servizio crea un video. Ecco la frontiera dell’Ai generativa

Cosa sono e a cosa servono i plugin di OpenAi e Microsoft