9 meses atrás 24

Hugging Face: o que é, como funciona e como usar plataforma colaborativa de IA

O Hugging Face é um hub de modelos de inteligência artificial (IA) pré-treinados pela própria comunidade. O serviço funciona como um dos principais repositórios de modelos de IAs de código aberto, e serve como base para alavancar algumas das pesquisas deste ramo. No entanto, apesar de projetado para a comunidade de desenvolvedores, o sucesso recente das inteligências artificiais despertou o interesse de usuários domésticos que buscam maneiras de entrar nesse mercado. A seguir, o TechTudo preparou um guia para explicar o que é o Hugging Face e quais são os primeiros passos para quem tiver curiosidade sobre como usar a plataforma.

 Reprodução/Hugging Face Hugging Face: o que é, como funciona e como usar plataforma colaborativa de IA — Foto: Reprodução/Hugging Face

O que é Hugging Face e como funciona?

Criado por Thomas Wold, Julien Chaumond e Clément Delangue, o Hugging Face foi projetado originalmente para ser um aplicativo web de chatbot. O objetivo principal era para testar os diversos avanços em tecnologias de classificação de texto e processamento de linguagem natural (NLP). Conforme essas tecnologias foram evoluindo, a plataforma rapidamente expandiu seu escopo para também armazenar modelos pré-treinados de Aprendizado de Máquina (Machine Learning) e, eventualmente, servir como repositório de modelos. O sistema é um hub de integração de modelos que roda em servidores remotos por meio de um dos planos de assinatura.

Qualquer um pode abrir o Hugging Face e realizar uma busca pelo tipo de tarefa que deseja executar ou desenvolver com IA. É possível testar milhares de modelos disponíveis até encontrar um próximo do resultado buscado. Em seguida, basta baixar o modelo, treiná-lo localmente ou em servidores próprios, e compartilhar sua versão personalizada do DeepSeek, por exemplo, para que a comunidade contribua sugerindo melhorias no código ou abordagens diferentes para solucionar problemas.

Caso queria disponibilizar uma versão funcional do modelo, basta alugar um servidor no domínio do Hugging Face e escolher uma das configurações de sistemas disponíveis. Entre as opções estão desde apenas um servidor com CPU básico gratuito até versões mais robustas, como infraestruturas NVIDIA de até 1.534 GB de memória com até oito placas L40S, a partir de US$ 23,50 por hora de operação.

 Reprodução/Hugging Face Seção "Spaces" traz diversos tipos de servidores para usuários disponibilizarem seus modelos pré-treinados para testes — Foto: Reprodução/Hugging Face

Principais produtos e bibliotecas

O Hugging Face oferece uma enorme diversidade de produtos para desenvolvimento em IA, com o hub de modelos sendo apenas um deles. A plataforma oferece uma biblioteca gigantesca de transformers, milhares de datasets públicos com dados já preparados para treinar modelos e serviços como o Spaces para compartilhar modelos refinados.

 Reprodução/Hugging Face Hugging Face é provavelmente a maior biblioteca pública de transformadores, modelos e conjuntos de dados abertos para desenvolvimento em IA — Foto: Reprodução/Hugging Face

Transformers (ou transformadores) são arquiteturas de redes neurais que, como o nome já sugere, convertem sequências de entra - os inputs de dados - em sequências de saídas. Graças a mecanismos de autoatenção, os transformers possibilitam que uma rede neural identifique os elementos mais relevantes do dadatset com base nas sequências de entradas, viabilizando desde os sistemas de treinamento às próprias inferências para geração de respostas. Entre os mais famosos estão o TensorFlow, da NVIDIA, GPT, da OpenAI, e o PyTorch, um dos transformadores de código aberto mais utilizados do mercado.

  • Hub de Modelos: essencialmente, é o repositório em nuvem no qual qualquer usuário pode compartilhar seus modelos pré-treinados, o que permite que outros membros da comunidade os baixem, refinem e implementem em suas aplicações, desde que respeitem as devidas licenças de uso aberto. Neste hub, é possível encontrar uma infinidade de versões personalizadas de modelos dos mais diversos tipos, desde os mais básicos feitos apenas para classificação de linguagem natural até modelos de visão computacional voltados para detecção de objetos e geração de imagens.
  • Datasets: são conjuntos de dados multimodais que incluem modelos 3D, sequências temporais, tabelas, imagens, áudios, vídeos, organizados em diferentes formatos para diferentes aplicações de treinamento, como .JSON (JavaScript Object Notation), .CSV, arquivos de texto, pastas de imagens e sons, assim por diante. Graças a enorme biblioteca de datasets do Hugging Face, desenvolvedores podem alimentar modelos de identificação de objetos com milhares de fotos dos mais diversos tipos e treiná-los para saber quando um produto apresenta defeitos.
  • Spaces: é o ambiente colaborativo com servidores remotos para disponibilizar modelos pré-treinados operando gratuitamente para toda a comunidade do Hugging Face. Após refinar um modelo de Stable Diffusion para geração de imagens de pets, o criador do modelo pode implementar uma demo rodando no Spaces optando por um dos planos disponíveis. Como já mencionado, a modalidade gratuita oferece sistemas simples e, consequentemente, mais filas e menos desempenho. Já os planos mais caros executam os modelos em placas NVIDIA poderosas para demonstrar o desempenho real em servidores efetivos.

Ao utilizar a combinação certa entre modelo, datasets e transformadores do Hugging Face, é possível criar um modelo de IA de código aberto para atuar no controle de qualidade automatizado em uma linha de produção de uma fábrica de peças automotivas, por exemplo. Em seguida, basta escolher uma modalidade do Spaces e disponibilizar o modelo rodando para toda a comunidade.

Evidentemente, os modelos disponíveis para teste no Hugging Face são todos experimentais e nem de longe se aproximam de serviços reais rodando em aplicações próprias. Por essa razão, mesmo que seja possível testar um modelo Stable Diffusion 3.5, é inviável utilizar a plataforma para criar imagens com a mesma qualidade do OpenArt.ai ou DreamStudio, mas já permite ter uma noção geral dos modelos, o que auxilia a definir qual escolher para treinar e refinar. Além disso, por conta das licenças de uso aberto, os materiais gerados em plataformas de testes no Hugging Face não podem ser utilizados comercialmente.

Para a maioria dos usuários, o Hugging Face é totalmente gratuito, sendo possível baixar modelos, bibliotecas de transformers, conjuntos de dados, refinar os próprios modelos e compartilhá-los com a comunidade. Contudo, a plataforma disponibiliza um plano Pro com assinatura de US$ 9 mensais para oferecer uma modalidade de uso do spaces com zero GPUs, mas sem custo adicional para rodar modelos próprios em caráter de testes. Além disso, os usuários gratuitos do Hugging Face têm um limite diário de usos de inferência nos modelos disponíveis para testes na plataforma. A conta Pro amplia esse limite.

 Reprodução/Hugging Face Modalidade gratuita permite baixar ou armazenar recursos de IA, mas para disponibilizar instâncias ativas para testes é preciso ser assinante — Foto: Reprodução/Hugging Face

Começar a usar o Hugging Face é extremamente simples, mas é importante reforçar que a plataforma não oferece interfaces e mecanismos facilitados para treinar os próprios modelos. Usuários domésticos sem conhecimento profundo podem acessar o HF apenas para testar os modelos disponibilizados no hub ou baixar os modelos, transformers e datasets do repositório. Todo o processo de treinamento precisa ser realizado em equipamentos próprios ou servidores contratados, como Google Cloud ou AWS. Para baixar recuo HF, siga os seguintes passo:

Baixando recursos do Hugging Face:

  • Passo 1. Abra a página oficial do Hugging Face (https://huggingface.co/) e crie uma conta;
  • Passo 2. Na barra de buscas, digite o tipo de modelo, transformador ou conjunto de dados que deseja testar ou baixar, filtrando pelas categorias disponíveis;
 Reprodução/Hugging Face Procure pelo recurso desejado na barra de buscas, no canto superior esquerdo — Foto: Reprodução/Hugging Face
  • Passo 3. Clique no recurso que deseja baixar e na aba "Arquivos e Versões" e clique no ícone de download em frente ao arquivo necessário. Agora, basta carregar as bibliotecas, modelos e outras ferramentas no ambiente de desenvolvimento de servidor para começar a treinar ou refinar seu modelo.
 Reprodução/Hugging Face Após selecionar modelo, clique na aba "Arquivos e Versões" e baixe todos os recursos necessários para realizar deploy em servidor próprio — Foto: Reprodução/Hugging Face

Testando modelos no Hugging Face:

  • Passo 1. Para interessados em testar modelos, clique na seção Spaces, na barra superior;
 Reprodução/Hugging Face Modelos para testes ficam disponíveis na seção "Spaces" do Hugging Face — Foto: Reprodução/Hugging Face
  • Passo 2. Escolha modelo desejado, insira o prompt e aguarde. É importante lembrar que boa parte dos modelos disponíveis estão em servidores mais simples. A fila para encontrar uma GPU disponível pode demorar alguns minutos, sem contar o tempo de execução da inferência;
 Reprodução/Hugging Face Após selecionar o modelo, basta inserir prompt e aguardar resultado, mas filas podem levar alguns minutos — Foto: Reprodução/Hugging Face

Vale lembrar que os limites de acesso no Spaces para usuários gratuitos não bloqueiam seu uso, mas aumentam esperas na fila, não sendo preciso aguardar 24 horas para poder voltar a testar. Outro detalhe importante é que todas as ferramentas disponibilizadas no Hugging Face são em caráter de testes e os resultados gerados não podem ser utilizados comercialmente.

Veja também: DeepSeek x ChatGPT: saiba principais diferenças entre as IAs concorrentes

 saiba principais diferenças entre as IAs concorrentes

DeepSeek x ChatGPT: saiba principais diferenças entre as IAs concorrentes

Leia o artigo inteiro

Do Twitter

Comentários

Aproveite ao máximo as notícias fazendo login
Entrar Registro