MusicGen, l’intelligenza artificiale di Meta che crea la musica

Meta ha rilasciato MusicGen, un modello di intelligenza artificiale in grado di creare la musica, partendo da una richiesta testuale o basandosi su una melodia già esistente.

MusicGen, l’intelligenza artificiale di Meta che crea la musica

Meta ha rilasciato MusicGen, un modello open source di linguaggio di deep learning in grado di creare musica partendo da una richiesta testuale o basandosi su una melodia già esistente. Si tratta di una specie di ChatGPT audio. L’intelligenza artificiale entra anche a far parte della musica. MusicGen si basa su un modello GPT, che in questo caso è addestrato con circa 20.000 ore di musica di cui la metà proveniente da brani di alta qualità, offerti con licenza, l’altra da tracce prese da Shutterstock e Pond5.

Per rendere il processo più veloce, Audiocraft ha usato il tokenizer audio EnCodec a 32Khz di Meta, che permette di generare blocchi di musica più piccoli che possono essere elaborati in parallelo.

L’utilizzo è molto semplice. Basta descrivere lo stile musicale, inserire una melodia esistente, della durata massima di 30 secondi, in modo facoltativo, e cliccare su “genera”. Ci vorranno solo un paio di minuti e MusicGen sarà in grado di realizzare un campione di alta qualità, completamente nuovo, della durata di circa 12 secondi. Il processo generativo può essere eseguito anche localmente e sono disponibili tre versioni del modello con varie dimensioni: 300 milioni (300 M), 1,5 miliardi (1,5 B) e 3,3 miliardi (3,3 B) di parametri.

Quest’ultimo è quello con un potenziale più alto per la produzione di musica più complessa, il migliore per abbinare in modo accurato l’input di testo e l’output audio.

MusicGen è un modello migliore di quello di Google

Rispetto ad altri modelli musicali, come Riffusion, Mousai, Noise2Music e MusicLM, lanciato un mese fa da Google, MusicGen si comporterebbe meglio su metriche oggettive e soggettive. In generale, i modelli sono stati ritenuti appena sopra il livello raggiunto da MusicLM. MusicGen è open source e può anche essere usato per creare musica commerciale.