O novo modelo de IA da NVIDIA, Fugatto, pode criar áudio a partir de prompts de texto.


0

A NVIDIA acaba de apresentar um novo modelo experimental de inteligência artificial generativa, que promete revolucionar a forma como interagimos com o som. Chamado de Foundational Generative Audio Transformer Opus 1, ou Fugatto, esse modelo é descrito como “um canivete suíço para o som”. Ele é capaz de receber comandos por meio de textos e, a partir disso, criar áudios ou modificar músicas, vozes e arquivos sonoros existentes.

Desenvolvido por uma equipe de pesquisadores de IA de diversas partes do mundo, o Fugatto se destaca por suas capacidades multilíngues e multiacento, o que o torna ainda mais versátil. Rafael Valle, um dos responsáveis pelo projeto e gerente de pesquisa aplicada em áudio na NVIDIA, comentou: “Queríamos criar um modelo que entende e gera som como os humanos fazem.” Essa abordagem humanizada é um dos grandes diferenciais do Fugatto.

As aplicações práticas desse modelo são vastas e empolgantes. Por exemplo, produtores musicais podem utilizá-lo para gerar rapidamente protótipos de ideias para músicas, que podem ser facilmente editados para experimentar diferentes estilos, vozes e instrumentos. Além disso, pessoas que estão aprendendo idiomas podem gerar materiais de estudo na voz que preferirem, tornando o aprendizado mais dinâmico e personalizado.

Os desenvolvedores de jogos também podem se beneficiar do Fugatto, criando variações de ativos pré-gravados que se adaptam às escolhas e ações dos jogadores. Isso significa que a experiência de jogo pode se tornar ainda mais imersiva e interativa. Outro aspecto interessante é que o modelo demonstrou a capacidade de realizar tarefas que não estavam em seu treinamento inicial, desde que ajustado adequadamente. Por exemplo, ele pode combinar instruções separadas, como gerar uma fala que soe zangada com um sotaque específico ou criar o som de pássaros cantando durante uma tempestade.

O Fugatto também pode gerar sons que evoluem ao longo do tempo, como o barulho de uma chuva forte se movendo pela paisagem, trazendo uma nova dimensão à criação sonora. Embora a NVIDIA ainda não tenha anunciado se o público terá acesso ao Fugatto, é importante notar que não é a primeira tecnologia de IA generativa a criar sons a partir de textos. A Meta já lançou um kit de IA de código aberto que realiza essa tarefa, enquanto o Google possui sua própria IA de texto para música, chamada MusicLM, acessível através do site AI Test Kitchen.

Com tantas possibilidades, o Fugatto promete abrir novas portas para a criatividade sonora, tornando a produção de áudio mais acessível e inovadora. A tecnologia avança rapidamente e, com ela, as formas de expressão artística também se transformam, permitindo que todos explorem sua criatividade de maneiras antes inimagináveis.

Redação Confraria Tech.

Referências:
NVIDIA’s new AI model Fugatto can create audio from text prompts


Like it? Share with your friends!

0

What's Your Reaction?

hate hate
0
hate
confused confused
0
confused
fail fail
0
fail
fun fun
0
fun
geeky geeky
0
geeky
love love
0
love
lol lol
0
lol
omg omg
0
omg
win win
0
win
admin

Choose A Format
Personality quiz
Series of questions that intends to reveal something about the personality
Trivia quiz
Series of questions with right and wrong answers that intends to check knowledge
Poll
Voting to make decisions or determine opinions
Story
Formatted Text with Embeds and Visuals
List
The Classic Internet Listicles
Countdown
The Classic Internet Countdowns
Open List
Submit your own item and vote up for the best submission
Ranked List
Upvote or downvote to decide the best list item
Meme
Upload your own images to make custom memes
Video
Youtube and Vimeo Embeds
Audio
Soundcloud or Mixcloud Embeds
Image
Photo or GIF
Gif
GIF format