Google aposta em nova técnica para reduzir uso de RAM e p...

Tecnologia chamada TurboQuant promete diminuir consumo de memória em sistemas de IA e aliviar pressão sobre custos globais

Regras de configuração de memória DDR4 e DDR5 baseadas em pares de CPU e chipset - Foto: Reprodução/Kingston Technology

O avanço da inteligência artificial tem provocado efeitos diretos no mercado global de hardware, especialmente na demanda por memória RAM. Nos últimos anos, o crescimento acelerado de modelos de IA levou empresas a ampliar significativamente suas infraestruturas, pressionando preços e reduzindo a disponibilidade de componentes.

Uma nova técnica desenvolvida pelo Google, no entanto, pode representar um ponto de inflexão nesse cenário.

Redução de memória sem perda relevante de desempenho

Diagrama do algoritmo TurboQuant - Foto: Reprodução/ChatGPT (OpenAI)

Batizada de TurboQuant, a solução utiliza um método avançado de quantização que reduz drasticamente a quantidade de memória necessária para operar modelos de inteligência artificial.

Enquanto abordagens tradicionais utilizam precisão de 16 ou 8 bits, a nova técnica consegue operar com apenas 3 bits, mantendo níveis semelhantes de qualidade e desempenho em tarefas práticas.

Essa redução impacta diretamente estruturas críticas como o KV Cache, essencial para o funcionamento de modelos de linguagem.

Google aposta em nova técnica para reduzir uso de RAM e pode impactar preços no mercado

Redução de memória sem perda relevante de desempenho

Impacto direto nos data centers e no mercado

Mais notícias de Ciência e Tecnologia

Possível reflexo nos preços

Tendência de longo prazo

Conclusão

Tags:

Comentários (0)