3 semanas atrás 5

Google lança Gemini 3, sua IA mais poderosa até agora com 'raciocínio em nível de PhD'

Segundo a empresa, o Gemini 3 é o modelo mais avançado em compreensão multimodal, ou seja, capaz de interpretar simultaneamente diferentes formatos de mensagens, como textos, imagens, áudios e códigos. O Google fala que ele tem raciocínio de alto nível (entenda mais abaixo).

A empresa diz que o Gemini 3 e suas soluções para desenvolvedores começam a ser disponibilizados a partir de hoje para todos os usuários.

Veja os vídeos que estão em alta no g1

Veja os vídeos que estão em alta no g1

'Raciocínio em nível de PhD'

A empresa também está oferecendo o Gemini 3 Pro para tarefas ainda mais complexas. "O Gemini 3 Pro superou significativamente o Gemini 2.5 Pro em todos os testes de desempenho em IA", afirmou o Google.

Segundo a companhia, ele alcançou pontuação recorde de 1.501 pontos e demonstrou raciocínio em nível de PhD, com destaque em exames como o Humanity's Last Exam e GPQA Diamond.

🔎 O que são esses exames citados pelo Google? Humanity's Last Exam e GPQA Diamond são testes de alto nível que avaliam o desempenho de inteligências artificiais. O objetivo é medir o conhecimento acadêmico e a capacidade de raciocínio dessas tecnologias.

"Suas respostas são inteligentes, concisas e diretas, funcionando como um ‘verdadeiro parceiro de pensamento", completou a empresa. "Sua alta precisão factual permite resolver problemas complexos em áreas como ciência e matemática", completou.

Gemini 3 está mais visual, segundo o Google — Foto: Google/Divulgação

A big tech também destacou que sua IA está se tornando mais "visual", ou seja, capaz de responder a comandos de forma mais interativa.

Um exemplo citado é o aprendizado: em vez de apenas fornecer links para artigos ou vídeos do YouTube, a IA pode gerar flashcards interativos (cartas) que auxiliam o usuário no estudo.

Outro exemplo citado é que a nova geração da IA pode interpretar e traduzir uma receita escrita em outro idioma e transformá-la em um livro digital, que depois pode ser compartilhado com outras pessoas (veja no gif acima).

Outras coisas que o Gemini 3 pode fazer são:

  • ➗Problemas complexos: consegue resolver problemas complexos em áreas como ciência e matemática.
  • 🤖 Gemini Agente: recurso experimental de agente de IA que pode, por exemplo, organizar automaticamente a caixa de entrada do seu e-mail.
  • 🧳 Planejamento de tarefas: é capaz de criar itinerários de viagem detalhados, gerando uma versão visual que inclui imagens, vídeos e tabelas.
  • 👩‍💻 Google Antigravity: por meio dessa plataforma, os agentes de IA do Gemini podem planejar e executar, de forma autônoma, tarefas de software complexas de ponta a ponta. Eles acessam diretamente o editor, o terminal e o navegador, além de validar seu próprio código.
  • 🔎Modo IA no buscador do Google: inclui na busca a função "thinking", que permite raciocínio mais sofisticado e respostas mais complexas.

Gemini 3, novo modelo de linguagem da IA do Google — Foto: Divulgação/Google

Agente do ChatGPT reserva restaurante, faz compra, mas erra ao insistir demais

Agente do ChatGPT reserva restaurante, faz compra, mas erra ao insistir demais

Data centers de IA podem consumir energia equivalente à de milhões de casas

Data centers de IA podem consumir energia equivalente à de milhões de casas

Leia o artigo inteiro

Do Twitter

Comentários

Aproveite ao máximo as notícias fazendo login
Entrar Registro