O PaliGemma 2 é uma inteligência artificial (IA) desenvolvida pelo Google que interpreta imagens e textos de forma integrada. Sucessor do Gemma 1, a ferramenta agora pode compreender emoções, contextos e interações entre os elementos visuais. Desenvolvedores podem baixá-lo no perfil do Google no Hugging Face ou Kaggle e integrá-lo a seus projetos utilizando a estrutura de preferência. Com suporte a diferentes tamanhos de modelo (3B, 10B e 28B parâmetros), o software pode ser utilizado em diversas tarefas, como geração de legendas para imagens e vídeos, segmentação de elementos visuais e respostas a perguntas complexas. A seguir, descubra tudo sobre o PaliGemma 2 e veja como utilizá-lo.
PaliGemma2: saiba tudo sobre IA do Google capaz de identificar emoções — Foto: Reprodução/EM360.com O PaliGemma 2 é uma IA projetada para interpretar e descrever imagens com precisão. Diferente de outros modelos que somente reconhecem objetos e cenas, o sistema consegue analisar o contexto, identificar possíveis sentimentos expressos por pessoas e criar descrições detalhadas. Em outras palavras, o software consegue associar alguns elementos visuais, como expressões faciais, a conceitos abstratos, como felicidade ou tristeza.
Para isso, a ferramenta combina visão computacional e processamento de linguagem natural. Dessa forma, ela avalia não só os componentes de uma imagem, mas também nuances emocionais presentes nela.
Principais recursos do PaliGemma 2
Entre as inovações trazidas pelo PaliGemma 2, está a habilidade de detectar emoções a partir de expressões faciais e linguagem corporal. A IA também é capaz de criar legendas detalhas para fotos, ilustrações ou pinturas. Além da simples identificação de objetos, a ferramenta descreve sensações que a imagem transmite e o contexto da cena, o que inclui relações e interações entre os elementos. O modelo também consegue identificar textos escritos em imagens, com interpretação de placas, documentos e anotações escritas à mão.
PaliGemma 2 diferencia pratos, tigelas e alimentos em imagem — Foto: Reprodução/Google O modelo também se destaca em tarefas específicas, como interpretação de documentos médicos, como radiografias e tomografias, reconhecimento de fórmulas químicas e até leitura de partituras musicais. Além disso, a IA do Google promete contribuir para a acessibilidade, já que pode auxiliar pessoas com deficiência visual a terem melhor compreensão do conteúdo de imagens. A tecnologia também tem potencial de contribuir para segurança digital, detectando conteúdos sensíveis ou manipulados.
O PaliGemma 2 já está disponível para download em plataformas como Hugging Face e Kaggle, onde desenvolvedores podem baixar modelos e códigos para seus projetos. O modelo é compatível com várias plataformas, como Hugging Face Transformers, Keras, PyTorch, JAX e Gemma.cpp.
É possível usar diferentes bibliotecas para carregar e interagir com o PaliGemma 2, dependendo do ambiente de desenvolvimento utilizado. No Hugging Face, programadores podem carregar o modelo com poucas linhas de código usando o Transformers. Já no Kaggle, desenvolvedores conseguem experimentar a IA diretamente em notebooks prontos para uso.
É possível baixar o PaliGemma 2 em sites como o Hugging Face — Foto: Reprodução/Júlia Silveira Além do download do modelo de IA, o Google também disponibilizou instruções sobre como ajustar o PaliGemma 2 para aplicações específicas. É possível personalizar o modelo para atuar em diversas tarefas, como reconhecer padrões em imagens médicas, gerar descrições para pinturas ou até auxiliar na moderação de conteúdo, identificando imagens manipuladas, deepfakes ou conteúdos sensíveis.
O PaliGemma 2 foi desenvolvido para substituir e aprimorar o Gemma 1, primeiro modelo da família Gemma. A nova versão foi treinada com um conjunto de dados mais diversificado, sendo mais versátil e menos propensa a erros. Além disso, o software aprimorou a habilidade de identificar objetos e cenas, o que faz com que o sistema compreenda contextos mais complexos, como emoções e relações entre elementos visuais.
O modelo atual também pode criar legendas mais detalhadas, captando possíveis significados e interpretações. O PaliGemma 2 ainda demonstrou desempenho superior em tarefas técnicas, nas áreas de medicina, química e arte. A ferramenta foi otimizada para funcionar de maneira mais eficiente em diferentes frameworks, facilitando a implementação em diversos tipos de projeto.
Veja também: DeepSeek x ChatGPT: saiba principais diferenças entre as IAs concorrentes
DeepSeek x ChatGPT: saiba principais diferenças entre as IAs concorrentes

German (DE)
English (US)
Spanish (ES)
French (FR)
Hindi (IN)
Italian (IT)
Portuguese (BR)
Russian (RU)
9 meses atrás
12
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2023/u/2/1Ajl0YSraGSCkxjiEBsA/canva-iphone-horizontal-marca-dagua.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/6/b/i7NBNXS7irBHoALhz6XQ/gemini-generated-image-gkkcaogkkcaogkkc.png)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/r/s/Xbw22USqu2RgNiuoyB1Q/b.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/7/J/fOFqGuTnu1QtSoJi69zg/roteador-ax3000-2-.png)

:strip_icc()/i.s3.glbimg.com/v1/AUTH_59edd422c0c84a879bd37670ae4f538a/internal_photos/bs/2023/l/g/UvNZinRh2puy1SCdeg8w/cb1b14f2-970b-4f5c-a175-75a6c34ef729.jpg)










Comentários
Aproveite ao máximo as notícias fazendo login
Entrar Registro