Funcionalidades AudioCraft
MusicGen
O MusicGen é uma ferramenta que permite a geração de música de alta qualidade a partir de inputs de texto, atendendo as necessidades de quem precisa de áudio único e personalizado.
AudioGen
Permite a produção de sons ambientais a partir de texto. É ideal para usuários que precisam de sons específicos para projetos audiovisuais.
EnCodec
EnCodec é um codec de áudio neural usado para aprender tokens de áudio discretos a partir da forma de onda bruta. Isso ajuda a produzir áudio de alta qualidade.
Text-to-sound
Produz áudio de sons ambientais a partir de texto, tornando mais fácil para os usuários criar sons ambientais personalizados.
Text-to-music
Funcionalidade que gera músicas diversas e longas a partir de inputs de texto do usuário, proporcionando criação de música personalizada.
Modelagem autoregressiva
Esta funcionalidade permite modelar eficientemente sequências de áudio, captando dependências de longo prazo no áudio, o que é crucial para a qualidade do áudio gerado.
Tokens Interleaved
Abordagem inovadora para aproveitar a estrutura interna das streams paralelas de tokens, permitindo alta qualidade e eficiência no modelamento de áudio.
Modelos de condicionamento
Permitem controlar a geração de áudio, como usar um codificador de texto pré-treinado para aplicações de texto para áudio, proporcionando maior flexibilidade aos usuários.