A Inteligência Artificial é uma tecnologia capaz de estudar, desenvolver, criar como humanos. Com ela, máquinas podem realizar atividades humanas de maneira autônoma, a partir de configurações pré-estabelecidas. Dessa forma, a tecnologia pode ser usada de diversas formas, inclusive para criar músicas, como é o caso do MusicLM.
A ferramenta, criada pelo Google, é capaz de criar músicas utilizando inteligência artificial. Neste artigo, você vai conhecer tudo sobre o MusicLM e o que essa solução inovadora promete.
O que é MusicLM?
O MusicLM é uma inteligência artificial que gera músicas com base em descrições de textos e o áudio da voz de uma pessoa, instrumento ou outros tipos de sons. Isso é possível por meio da modelagem hierárquica de sequência a sequência. A tecnologia gera música a 24 kHz, que pode ser reproduzida de forma consistente por vários minutos.
A tecnologia foi criada pelo Google e a empresa a define como “um modelo gerador de música de alta fidelidade a partir de descrições em texto”.
O MusicLM vai criar faixas de músicas em 24 kHz de diferentes estilos, a partir de características indicadas pelo usuário. As músicas podem ter duração de até 5 minutos, bem como trilhas curtas. A tecnologia conta com cerca de 280 mil horas de conteúdos de músicas para que possa aprender e gerar melodias para cada tipo de contexto que o usuário quiser.
O MusicLM pode se basear em melodias que já existentes, podendo ser cantaroladas, cantadas, assobiadas ou tocadas em um instrumento. A tecnologia também pode pegar várias descrições escritas em sequência e criar uma melodia em forma de história ou narrativa.
A inteligência artificial é capaz de criar faixas a partir de imagens e gerar melodias a partir do som de um instrumento, ou ainda, músicas que remetem a uma época específica.
O MusicLM vai poder criar trilhas sonoras de games clássicos de fliperama, um solo de guitarra, jazz ou música eletrônica, músicas curtas e faixas mais longas, além de trilhas sonoras para acompanhar histórias narradas.
Como funcionará o MusicLM?
O MusicLM vai funcionar de duas formas. A primeira é utilizando uma sequência de tokens de áudio, ou seja, pedaços do som, e mapeando-os como tokens semânticos – de acordo com o significado de cada um – e transformando-os em legendas.
A segunda forma é recebendo as legendas ou áudios de entrada dos usuários. Com esses dados, vai gerar tokens acústico, ou seja, partes do som que vão compor a saída da música criada. Dessas duas formas, o MusicLM vai poder reproduzir desde sons específicos, até trilhas de ambientes e de períodos da história.
Segundo o Google, a tecnologia vai superar os geradores de música por inteligência artificial que já foram criados, tanto em qualidade de áudio quanto em equivalência das descrições de texto.
MusicLM vai plagiar músicas?
O próprio Google assume que existem diversos desafios éticos para a atuação do MusicLM no mercado. A incorporação do material protegido por direitos autorais e dados de treinamento nas músicas geradas é um desafio.
Durante testes com a ferramenta, a empresa identificou que cerca de 1% da música gerada pela inteligência artificial era replicada das músicas que eram utilizadas por ela para treinar. Esse limite foi considerado alto pela empresa, fazendo com que ela adie o lançamento da tecnologia como está no momento.
Ainda que as criações do MusicLM não sejam originais e os usuários possam encontrar semelhanças nas faixas com as músicas de artistas específicos, a tecnologia não chega a plagiar músicas de outra propriedade.
Ainda assim, o Google afirma que reconhece “o risco de potencial apropriação indébita de conteúdo criativo associado ao caso de uso”, por isso acreditam que é necessário mais trabalho dos desenvolvedores da empresa “para lidar com esses riscos associados à geração de música”.
Quando estará disponível o MusicLM?
Ainda não há previsão de lançamento para o MusicLM. Principalmente por causa de questões legais, como direitos autorais e plágio, ainda é necessário aprimorar a tecnologia e como será seu funcionamento.
Resumindo
Ainda não há previsão de lançamento para o MusicLM.
O MusicLM é uma inteligência artificial que gera músicas com base em descrições de textos e o áudio da voz de uma pessoa, instrumento ou outros tipos de sons.
O MusicLM vai funcionar de duas formas. A primeira é utilizando uma sequência de tokens de áudio, ou seja, pedaços do som, e mapeando-os como tokens semânticos – de acordo com o significado de cada um – e transformando-os em legendas. A segunda forma é recebendo as legendas ou áudios de entrada dos usuários. Com esses dados, vai gerar tokens acústico, ou seja, partes do som que vão compor a saída da música criada.