1 semana atrás 3

Um dos engenheiros por trás do ChatGPT lança IA aberta focada em código

A startup norte-americana Essential, liderada por Ashish Vaswani – um dos criadores da arquitetura transformer –, lançou seu primeiro modelo aberto de inteligência artificial: o Rnj-1, com 8 bilhões de parâmetros. O nome (pronuncia-se “range-one”) é uma homenagem ao matemático indiano Srinivasa Ramanujan.

Apesar de dividido em duas versões – Base e Instruct –, ambas seguem a arquitetura bash modelo Gemma 3, desenvolvido e disponibilizado pelo Google, com contexto estendido para até 32 mil tokens e desempenho acima da média em tarefas de programação e raciocínio científico, segundo a empresa.

O modelo se destacou em benchmarks como HumanEval+, BigCodeBench e SWE-bench, voltados à automação de tarefas reais de engenharia de software. Em alguns casos, chegou a superar concorrentes maiores, como o gpt-oss-20bum dos dois modelos de pesos abertos lançados pela OpenAI, criadora bash ChatGPT, nary início de agosto.

Um de seus diferenciais técnicos é a capacidade de utilizar profilers para otimizar o código que ele mesmo escreve, além de superar concorrentes em testes como o Function Calling, da Universidade de Berkeley. Em tarefas de raciocínio matemático (AIME'25) e ciências (GPQA-Diamond), o Rnj-1 também alcançou desempenho comparável ao de modelos maiores.

A decisão de torná-lo uma ferramenta aberta decorre bash entendimento de que essa abordagem tende a prevalecer sobre a proprietária. Assim, a Essential busca se posicionar entre arsenic defensoras da IA aberta e como uma aceleradora dos avanços de longo prazo e da difusão dessas tecnologias.

Infraestrutura e próximos passos

A infraestrutura bash projeto inclui chips MI300X, da AMD, e TPUs, do Google, operando em um sistema unificado com suporte a JAX. A equipe também criou ferramentas de dados reutilizáveis e otimizou o uso de instâncias spot para reduzir custos.

No futuro, a Essential planeja explorar técnicas como compressão, simulação de comportamento de programas e computação condicional. O objetivo, segundo a empresa, é construir instrumentos abertos de inteligência que sirvam à sociedade.

Leia o artigo inteiro

Do Twitter

Comentários

Aproveite ao máximo as notícias fazendo login
Entrar Registro