SWEN.AI
NotíciasFerramentas500+BenchmarkTutoriaisRankingGitHub RadarArtigos
CtrlK
NotíciasFerramentasBenchmarkTutoriaisRanking
SWEN.AI
NotíciasFerramentas500+BenchmarkTutoriaisRankingGitHub RadarArtigos
CtrlK
NotíciasFerramentasBenchmarkTutoriaisRanking
  1. Início
  2. Inteligência Artificial
  3. OpenAI anuncia Bidi 1, novo modelo de voz que pode cantar...
Inteligência Artificial

OpenAI anuncia Bidi 1, novo modelo de voz que pode cantar e gerar sons

A OpenAI revelou o Bidi 1, um modelo de voz que possui a capacidade de cantar e gerar diferentes sons. Amostras do modelo foram compartilhadas.

GM
Gabriel Mota23 de junho de 2026, 15:21 Atualizado em há cerca de 2 horas
4 min
Twitter Radar
x.com
Ver original
Compartilhar:
OpenAI anuncia Bidi 1, novo modelo de voz que pode cantar e gerar sons
Toque duas vezes para ampliar

# OpenAI anuncia Bidi 1, novo modelo de voz que pode cantar e gerar sons

A OpenAI revelou o Bidi 1, um modelo de voz baseado em inteligência artificial que introduz capacidades inéditas na geração de áudio: além de produzir fala natural, o sistema consegue cantar e criar diferentes tipos de sons ambientais e expressivos. Amostras de áudio do modelo foram compartilhadas publicamente pela empresa, permitindo que desenvolvedores e o público avaliem o alcance dessa nova tecnologia.

Como o Bidi 1 avança a síntese de voz com IA

O Bidi 1 representa uma mudança de paradigma na síntese de voz. Modelos anteriores da OpenAI — como os utilizados no ChatGPT Voice — já entregavam conversação fluida, mas operavam dentro dos limites da fala falada. O novo modelo expande essa fronteira ao integrar geração musical e efeitos sonoros em uma única arquitetura.

Na prática, isso significa que o Bidi 1 não apenas converte texto em fala, mas interpreta instruções para produzir melodias cantadas, variações de entonação emocional e sons que simulam ambientes reais. Segundo as demonstrações divulgadas pela OpenAI, o modelo consegue alternar entre fala e canto dentro de uma mesma saída de áudio, algo que exige controle fino sobre pitch, ritmo e timbre simultaneamente.

Para desenvolvedores, essa capacidade abre caminhos concretos: assistentes virtuais com respostas cantadas, trilhas sonoras geradas sob demanda para jogos e vídeos, e ferramentas de acessibilidade que usam variações sonoras para transmitir contexto emocional a pessoas com deficiência visual.

Demonstrações revelam versatilidade do modelo de voz Bidi 1

As amostras publicadas pela OpenAI mostram o Bidi 1 reproduzindo diferentes estilos musicais e sons complexos com naturalidade notável. Entre os exemplos compartilhados, o modelo demonstra capacidade de gerar vocalizações em estilos variados, ajustar dinâmica vocal e produzir efeitos sonoros que vão além da simples reprodução de fala.

Essa versatilidade diferencia o Bidi 1 de soluções concorrentes como o Eleven Labs e o Suno, que tendem a se especializar ou em text-to-speech de alta qualidade ou em geração musical, mas raramente combinam ambas as funções em um único modelo. A abordagem unificada da OpenAI sugere uma arquitetura multimodal de áudio que trata voz, música e som como manifestações de um mesmo espaço de representação.

Vale destacar que, até o momento, a OpenAI não detalhou publicamente a arquitetura técnica completa do Bidi 1 nem confirmou uma data específica de disponibilidade geral via API. As amostras servem como demonstração de capacidade, e a integração em produtos como o ChatGPT ou a API da OpenAI ainda depende de anúncios futuros.

Impacto do Bidi 1 no ecossistema de IA generativa

Com o lançamento do Bidi 1, a OpenAI reforça sua posição no mercado de IA generativa ao atacar um segmento — o de áudio criativo — que vinha sendo dominado por startups especializadas. A empresa já acumula marcos relevantes nessa trajetória: o GPT-4o, lançado em maio de 2024, foi o primeiro modelo da companhia a oferecer interação de voz em tempo real com latência reduzida.

O movimento também levanta questões importantes sobre direitos autorais e uso ético. A capacidade de um modelo de IA cantar em estilos que se aproximam de artistas reais intensifica o debate sobre proteção de voz e identidade sonora, tema que já mobiliza legisladores nos Estados Unidos e na União Europeia.

Para criadores de conteúdo, músicos e estúdios de produção, o Bidi 1 representa tanto uma oportunidade de acelerar fluxos de trabalho quanto um desafio competitivo. A tecnologia não substitui a criatividade humana, mas reduz drasticamente a barreira técnica para produzir áudio de qualidade profissional — o que pode democratizar a criação sonora ou pressionar profissionais que dependem de serviços de locução e produção musical.

A OpenAI ainda não divulgou informações sobre preços ou níveis de acesso ao Bidi 1, mas o histórico da empresa sugere uma disponibilização gradual, começando por parceiros selecionados antes de uma abertura mais ampla ao público.

Ver no Ranking SWEN.AI →

ChatGPT — por ELO, preço e velocidade

Abrir Benchmark
Compartilhar:

Benchmark de IA

Compare GPT, Claude, Gemini e mais: preços, velocidade e benchmarks.

Ver Ranking GeralComparar ModelosTop LLMs 2026

Aprenda na Prática

Guias do Udio: geração de música com qualidade sonora premium.

Tutoriais de UdioTodos os Tutoriais

Explore outras categorias

Relacionadas

  • Mistral lança OCR 4 com suporte a 170 idiomas e recursos avançados
  • Modelo de voz Bidi 1 da OpenAI permitirá tradução em tempo real
  • OpenAI testa modelo de voz bidirecional Bidi 1 com novas funcionalidades
  • OpenAI prepara Bidi 1 para lançamento na web