A OpenAI acaba de apresentar ao mundo o novo carro-chefe da empresa: o GPT-4o. Essa recente atualização é omnimodal e suporta uma variedade de mídias, incluindo áudios, vídeos e imagens.
Esta versão permite respostas em tempo real a partir de imagens, busca na web, análise de dados e criação de tabelas. Além disso, o Voice Mode promove conversas naturais e fluidas com a IA – nessa função é possível pedir que a IA gagueje e/ou respire durante a conversa, deixando mais humanizado e real.
Em testes, o GPT-4o agiu como uma assistente virtual, respondendo a perguntas com uma voz feminina e reconhecendo o humor através de imagens e voz. As respostas são incrivelmente rápidas, com uma média de 232 milissegundos.
Além disso, o novo carro-chefe da OpenAI consome menos recursos de API, sendo 50% mais eficiente em idiomas não ingleses.
Inicialmente, o GPT-4o está disponível apenas com ferramentas de texto e imagens – as vozes serão limitadas e sujeitas às políticas de segurança da OpenAI.
Isso porque, a empresa reconhece que os modelos de áudio apresentados podem trazer diversos riscos, e, durante os próximos meses, a OpenAI trabalhará na usabilidade pós-treinamento e segurança necessária para lançar a solução.
Para a OpenAI é importante que todos tenham acesso à sua tecnologia. Com isso, o GPT-4o ganhou uma versão para desktop e está liberado para os usuários que acessam a versão gratuita – com diferenças notáveis na velocidade e no Voice Mode em testes alpha.
Para os desenvolvedores, o acesso também está liberado para as funções de texto e imagem e o suporte para áudio e vídeo será liberado durante as próximas semanas para um pequeno grupo de parceiros.
Durante o anúncio, a OpenAI apresentou o GPT-4o de uma forma bastante única. Primeiro, a revelação ocorreu um dia antes do evento Google I/O – destacando a vontade da empresa em estar na vanguarda desta inovação.
Além disso, chamou a atenção o fato de que todos os dispositivos utilizados durante a demonstração eram da Apple, mostrando uma parceria ou preferência estratégica da OpenAI pela tecnologia usada nesses smartphones.
Outro ponto foi a revelação de que os modelos de IA foram treinados com GPUs da NVIDIA, ferramenta que contribuiu para o desenvolvimento dessas soluções avançadas.
Imagem principal: YouTube/OpenAI
Explore os
nossos materiais
Tenha acesso à uma fonte inesgotável de insights, guias e recursos sobre chatbot, inovação, atendimento e muito mais!
Fale com nosso time pelo WhatsApp: +55 (34) 3218-7079
Avenida Cesário Alvim, 3813 - Uberlândia - MG
2801 N.W. 74th Ave. Suite 211 - Miami, FL 33122
2025 © EZ SOFTWARES LTDA - CNPJ: 18.531.719/0001-14