# ChatGPT receberá atualização de modo de voz com novo modelo GPT-Bidi-1
O ChatGPT está prestes a receber uma atualização significativa no modo de voz com a introdução do modelo GPT-Bidi-1, identificado em registros internos da OpenAI junto com referências a novos anúncios de funcionalidades. A mudança aponta para uma reformulação na forma como a inteligência artificial processa e gera linguagem falada em tempo real.
O que é o modelo GPT-Bidi-1 e por que ele importa para o modo de voz do ChatGPT
O termo "bidi" no nome GPT-Bidi-1 é uma abreviação de *bidirectional* (bidirecional), o que indica que o modelo foi arquitetado para processar áudio de entrada e saída simultaneamente. Na prática, isso significa que o ChatGPT poderá ouvir e falar ao mesmo tempo, eliminando a dinâmica de turnos alternados que caracteriza o modo de voz atual.
O modo de voz avançado do ChatGPT, lançado em agosto de 2024, já representou um salto em relação ao sistema anterior baseado em transcrição texto-a-texto. No entanto, usuários frequentemente relatam latência perceptível entre o fim de uma frase e o início da resposta — um intervalo que quebra a naturalidade da conversa. O GPT-Bidi-1 parece ter sido desenvolvido especificamente para resolver essa limitação.
Referências ao modelo foram encontradas por desenvolvedores que monitoram atualizações nos aplicativos da OpenAI, prática comum na comunidade de engenharia reversa que já antecipou corretamente lançamentos anteriores, como o próprio modo de voz avançado e o modelo GPT-4o.
Como o GPT-Bidi-1 pode transformar a interação por voz
A principal mudança esperada com o GPT-Bidi-1 é a capacidade de processamento bidirecional de áudio, que traz implicações concretas para a experiência do usuário:
- Interrupções naturais: o modelo poderá detectar quando o usuário começa a falar durante uma resposta e ajustar seu comportamento em tempo real, assim como ocorre em conversas humanas.
- Redução de latência: ao processar entrada e saída de forma simultânea, o tempo entre pergunta e resposta tende a diminuir significativamente.
- Contexto conversacional contínuo: a bidirecionalidade permite que o modelo mantenha o fio da conversa mesmo quando há sobreposição de falas, algo que modelos unidirecionais não conseguem fazer com a mesma eficiência.
Atualmente, o modo de voz avançado do ChatGPT utiliza o modelo GPT-4o, que já processa áudio nativamente sem depender de transcrição intermediária. O GPT-Bidi-1 representa a próxima evolução dessa abordagem, com foco específico na fluidez da interação vocal.
Contexto da atualização e o que esperar da OpenAI
A identificação do GPT-Bidi-1 ocorre em um momento de intensa competição no mercado de assistentes de voz baseados em IA. O Google anunciou melhorias no Gemini Live durante o Google I/O 2025, e a Meta tem investido em capacidades de voz para sua IA integrada ao WhatsApp e outros aplicativos. A OpenAI, que detém a maior base de usuários de chatbots com mais de 300 milhões de usuários ativos semanais reportados em março de 2025, tem incentivo estratégico para manter a liderança nesse segmento.
A OpenAI ainda não fez um anúncio oficial sobre a data de lançamento do GPT-Bidi-1. Contudo, o fato de referências ao modelo já aparecerem em atualizações de aplicativos sugere que a implementação está em estágio avançado de desenvolvimento. Historicamente, a empresa costuma disponibilizar novos recursos primeiro para assinantes do plano Plus (US$ 20/mês) antes de expandir para usuários gratuitos.
Para quem utiliza o ChatGPT como ferramenta de trabalho, estudo ou acessibilidade, a atualização do modo de voz com o GPT-Bidi-1 representa um avanço prático: conversas mais naturais, com menos pausas artificiais e maior capacidade de acompanhar o ritmo real de uma interação humana. À medida que a OpenAI divulgar detalhes oficiais, será possível avaliar o alcance completo dessas melhorias.