SWEN.AI
NotíciasFerramentas500+BenchmarkTutoriaisRankingGitHub RadarArtigos
CtrlK
NotíciasFerramentasBenchmarkTutoriaisRanking
SWEN.AI
NotíciasFerramentas500+BenchmarkTutoriaisRankingGitHub RadarArtigos
CtrlK
NotíciasFerramentasBenchmarkTutoriaisRanking
  1. Início
  2. Inteligência Artificial
  3. OpenAI testa modelo de voz bidirecional Bidi 1 com novas ...
Inteligência Artificial

OpenAI testa modelo de voz bidirecional Bidi 1 com novas funcionalidades

A OpenAI realizou os primeiros testes do modelo de voz bidirecional Bidi 1, que promete melhorias significativas na interação. O modelo deve ser integrado ao ChatGPT e ao Codex em breve.

GM
Gabriel Mota23 de junho de 2026, 08:08 Atualizado em há cerca de 2 horas
3 min
Twitter Radar
x.com
Ver original
Compartilhar:
OpenAI testa modelo de voz bidirecional Bidi 1 com novas funcionalidades
Toque duas vezes para ampliar

OpenAI testa modelo de voz bidirecional Bidi 1 com novas funcionalidades

A OpenAI realizou os primeiros testes do modelo de voz bidirecional Bidi 1, um avanço que promete transformar a forma como os usuários interagem por voz com assistentes de inteligência artificial. O modelo, que opera com processamento simultâneo de entrada e saída de áudio, deverá ser integrado ao ChatGPT e, possivelmente, ao Codex em breve — marcando uma evolução concreta na experiência conversacional por voz.

Como funciona o modelo de voz bidirecional Bidi 1

Diferentemente dos modelos de voz tradicionais, que operam em turnos alternados (o usuário fala, o sistema processa, depois responde), o Bidi 1 adota uma arquitetura bidirecional que permite processar e gerar áudio ao mesmo tempo. Na prática, isso significa que a IA pode responder enquanto ainda está recebendo a fala do usuário — um comportamento muito mais próximo de uma conversa humana natural.

As principais funcionalidades identificadas nos testes incluem:

  • Interação simultânea (full-duplex): O modelo fala enquanto o usuário está falando e continua ouvindo, eliminando a latência típica dos sistemas turn-based.
  • Alternância dinâmica de tarefas: O Bidi 1 consegue mudar de assunto ou ajustar sua resposta no meio de uma frase, reagindo em tempo real ao que o usuário diz.
  • Gerenciamento inteligente de interrupções: O modelo lida de forma mais natural com interrupções, pausas e sobreposições de fala — um dos maiores desafios em interfaces de voz conversacionais.
  • Retenção aprimorada de contexto: Mesmo durante trechos longos de fala do usuário, o Bidi 1 mantém e memoriza o contexto da conversa com maior precisão.

Limitações observadas nos testes do Bidi 1

Apesar dos avanços significativos, os testes revelaram que o modelo de voz bidirecional Bidi 1 ainda possui restrições quanto à duração contínua de fala gerada. Durante as avaliações, o modelo conseguiu contar sequencialmente até 23 sem pausar — um resultado que, embora represente progresso em relação a modelos anteriores, evidencia que há espaço para otimização na geração de áudio prolongado.

Essa limitação sugere que a janela de contexto de saída de áudio ainda está sendo refinada, algo esperado em modelos que processam streams bidirecionais de voz em tempo real.

Quando o Bidi 1 estará disponível

O modelo ainda não foi liberado para o público geral. No entanto, considerando que a OpenAI já iniciou a fase de testes e que preparações para integração ao ChatGPT estão em andamento, a expectativa é de que o lançamento ocorra nas próximas semanas ou meses.

A chegada do Bidi 1 ao mercado representaria um salto qualitativo para assistentes de voz baseados em IA, aproximando a interação máquina-humano de uma conversa genuinamente fluida — algo que empresas como Google e Apple também buscam com seus respectivos assistentes, mas que ainda não alcançaram nesse nível de bidirecionalidade em tempo real.

Ver no Ranking SWEN.AI →

ChatGPT — por ELO, preço e velocidade

Abrir Benchmark
Compartilhar:

Benchmark de IA

Compare GPT, Claude, Gemini e mais: preços, velocidade e benchmarks.

Ver Ranking GeralComparar ModelosTop LLMs 2026

Aprenda na Prática

Tutoriais práticos de ChatGPT, prompt engineering e integração com Python.

Tutoriais de ChatGPTTodos os Tutoriais

Explore outras categorias

Relacionadas

  • Modelo de voz Bidi 1 da OpenAI permitirá tradução em tempo real
  • OpenAI prepara Bidi 1 para lançamento na web
  • GLM-5.2 supera Opus 4.8 em teste real de correção de bugs
  • OpenAI anuncia atualização do modelo GPT-5.5-Cyber com desempenho melhorado