O DeepSeek, modelo de inteligência artificial (IA) chinesa, está entre os apps mais populares do mundo, e ocupa a primeira posição em downloads nos Estados Unidos e Brasil. No entanto, mesmo com a popularidade, o serviço vive uma polêmica em relação à coleta indevida de dados de usuários. Nesta quarta-feira (29), a Wiz, software de segurança em nuvem, divulgou um relatório que informava o vazamento de informações sensíveis causado pela startup. Segundo o documento, a empresa teria deixado um de seus principais bancos de dados exposto na Internet. Ao todo, mais de um milhão de logs do sistema, envios de prompts e tokens de autenticação de API se tornaram públicos.
Ainda em relação à coleta de dados, a Itália decidiu, também na quarta-feira (29), pela suspensão do serviço no país. O modelo de IA desapareceu da Google Play Store e App Store da região, e deve permanecer ausente até a startup dar respostas a órgãos reguladores de Roma. A Irlanda também estuda o caso, e realizou questionamentos acerca do tema. Pensando nisso, o TechTudo explica a política de dados da startup DeepSeek. Confira, a seguir!
DeepSeek: conheça modelo de IA da China que pode superar o ChatGPT
Por que a DeepSeek coleta informações do usuário?
Todo produto digital coleta informações dos usuários, tanto em serviços pagos quanto gratuitos, o que muda é como essas informações são tratadas. A questão é que, no caso das IAs, — e isto vale para todas, não apenas a DeepSeek —, por padrão, muitas informações serão utilizadas para agregar a novos conjuntos de dados para retreinamento e refinamento dos modelos de linguagem, exceto caso haja uma cláusula discriminando o contrário. Por isso, nunca é recomendado utilizar arquivos sensíveis ou sigilosos em prompts de qualquer tipo de IA.
Isto significa que, além de aprender as preferências dos usuários para direcionar melhor propagandas vendendo essas informações a anunciantes, os chatbots podem captar até os padrões de digitação, expressões preferidas e outras nuances apenas por interagir com seres humanos, justamente para aproximar a experiência à de interações com outras pessoas.
Quais dados a DeepSeek coleta?
A lista de informações na documentação da DeepSeek é bastante similar a de outros serviços, como ChatGPT, Gemini e Meta AI, sendo separada em dois tipos de dados: os fornecidos deliberadamente e os coletados de forma automatizada. Entre os dados cedidos voluntariamente estão:
- Informações cadastrais: são dados como nome de usuário, e-mail, endereço, número de telefone, data de nascimento, senha, além de qualquer outra informação preenchida durante o cadastro inicial;
- Interações com o chatbot: todo prompt, conversas, contextos, respostas e outros inputs com o DeepSeek são coletados, armazenados e podem ser utilizados para refinar o treinamento do modelo, inclusive arquivos de áudio e vídeo;
- Dados durante sessões de suporte: caso alguém esteja enfrentando algum problema com o serviço do DeepSeek e precise entrar em contato com o Suporte ao Usuário, as informações dessas conversas também serão coletadas e armazenadas, bem os dados para verificação de identidade, no caso de uma recuperação de conta/senha, por exemplo.
DeepSeek pode coletar e armazenar qualquer interação com a IA — Foto: Gisele Barros/TechTudo Além das informações fornecidas ativamente pelos usuários, o DeepSeek ainda possui ferramentas automatizadas de coleta de dados operando mais no nível de metadados, auxiliando a traçar perfis de uso mais precisos. Segundo os termos de privacidade da DeepSeek, os dados coletados de forma automatizada são:
- Informações Técnicas: incluem dados do(s) dispositivo(s) utilizado(s) para acessar o serviço, como marca, modelo, sistema operacional, idioma, localização, padrões e ritmo de digitação, IP, DNS, e outros protocolos. Relatórios de erro, crashes e outros bugs também entram nessa categoria;
- Informações de Uso: inclui todos os padrões de uso, como utilizar para criar textos, realizar pesquisas, transcrever ou resumir artigos, e assim por diante;
- Cookies: o DeepSeek utiliza cookies e outras tecnologias de rastreamento para coletar informações sobre a atividade do usuário e suas preferências;
- Informações de Pagamento: caso o usuário realize alguma transação na plataforma, ela coleta a ordem de pagamento, históricos de transações, além de eventuais interações com equipes de suporte e pós-venda.
Como o DeepSeek conta com integrações com outras plataformas, como Google, App Store, e outras lojas, os Termos de Privacidade ainda descrevem que a ferramenta coleta as informações direcionadas desses parceiros ao realizar o login vinculando as contas. Além disso, anunciantes, empresas de telemetria de tráfego e outros eventuais parceiros também fornecem os dados de usuários cadastrados.
Contudo, é importante reforçar que tudo isso é padrão para serviços digitais gratuitos, e o ChatGPT, Meta AI, Gemini e outros chatbots fazem o mesmo, salvo pela coleta específica de padrões e ritmo de digitação. A coleta desse tipo de dado é extremamente específica, ao menos em primeira análise, sem um propósito muito claro, além de um eventual treinamento de uma Inteligência Artificial Geral (AGI), mas essa informação não está especificada nos termos de uso.
Como a DeepSeek utiliza os dados de usuários?
Segundo a DeepSeek, essas informações são utilizadas primariamente para melhorar a qualidade do serviço. A ideia é entender em profundidade quais as principais demandas dos usuários e aplicações mais recorrentes do chatbot, para direcionar melhor os recursos em desenvolvimento e suporte. No entanto, a startup se reserva no direito de enviar informações convenientes a terceiros, como anunciantes, instituições de análise de dados, além de, claro, órgãos governamentais em casos de investigações de ações ilícitas cometidas utilizando a IA, direta ou indiretamente.
Um adendo importante é que, quando há o compartilhamento de informações pessoais sensíveis, os dados são compartilhados de forma agregada e anonimizada, impossibilitando a identificação de indivíduos específicos. A exceção é, novamente, em casos de investigações criminais, principalmente de situações nas quais seja identificado o risco iminente à vida do usuário ou de terceiros.

German (DE)
English (US)
Spanish (ES)
French (FR)
Hindi (IN)
Italian (IT)
Portuguese (BR)
Russian (RU)
10 meses atrás
27
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/p/f/gfaVLRQD6lUE3m2Kwuew/1ece32964be68fdaa1bdd12c4f41e55f3a68ff6b66860be05af47d4b53449efb.jpg)

/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2025/C/B/NrCVoHRL2LwYwSaNclBw/000.jpg)
/https://i.s3.glbimg.com/v1/AUTH_08fbf48bc0524877943fe86e43087e7a/internal_photos/bs/2023/2/1/0v9FzuQWKVE0aT0lDAIg/mega-sena.jpg)

:strip_icc()/i.s3.glbimg.com/v1/AUTH_59edd422c0c84a879bd37670ae4f538a/internal_photos/bs/2023/l/g/UvNZinRh2puy1SCdeg8w/cb1b14f2-970b-4f5c-a175-75a6c34ef729.jpg)










Comentários
Aproveite ao máximo as notícias fazendo login
Entrar Registro