Circuitos Quânticos Aprimoram IA e Superam Limitações de Memória com Parâmetros Otimizados
Para milhões de pessoas, os chatbots impulsionados por grandes modelos de linguagem tornaram-se uma característica fundamental da vida cotidiana.
Pontos-chave
- Em foco: Para milhões de pessoas, os chatbots impulsionados por grandes modelos de linguagem tornaram-se uma característica fundamental da vida cotidiana
- Detalhe: Cobertura jornalística: verificar documentação técnica primária
- Leitura editorial: reportagem científica; quando possível, confira a fonte primária citada.
Para milhões de pessoas, os chatbots impulsionados por grandes modelos de linguagem (LLMs) tornaram-se uma característica fundamental da vida cotidiana. Esses sistemas de inteligência artificial (IA) crescem rapidamente, mas sua expansão se torna cada vez mais dispendiosa e intensiva em recursos. A capacidade de memória e o número de parâmetros necessários para o funcionamento desses modelos representam um desafio significativo, exigindo soluções inovadoras para permitir seu desenvolvimento contínuo sem custos proibitivos.
Em busca de alternativas, uma equipe de pesquisa liderada por Borja Aizpurua, da Multiverse Computing em San Sebastián, Espanha, explorou a computação quântica. Em uma nova pré-publicação disponível no servidor arXiv, os pesquisadores apresentaram uma abordagem promissora para aprimorar o desempenho dos LLMs. O estudo demonstra como a integração de princípios quânticos pode oferecer uma via para superar as atuais limitações de escala e eficiência dos modelos de linguagem.
A estratégia da equipe difere da prática convencional de simplesmente adicionar um grande número de novos parâmetros clássicos, como os estimados para o GPT-5.5, que pode conter entre dois e cinco trilhões de parâmetros. Em vez disso, eles inseriram pequenos blocos de circuitos quânticos no funcionamento interno de um LLM pré-treinado. O sistema resultante opera de forma híbrida: o LLM original é executado em um computador padrão, enquanto os componentes quânticos são processados no computador quântico supercondutor de 156 qubits da IBM, combinando o melhor de ambos os mundos computacionais.
A eficácia dessa abordagem foi testada em modelos de linguagem existentes. Ao aplicar essa técnica ao Llama 3.1 8B, um modelo de oito bilhões de parâmetros desenvolvido pela Meta, a equipe de Aizpurua alcançou uma redução de 1, 4% na perplexidade. A perplexidade é uma medida crucial que indica a confiabilidade de um modelo ao prever a próxima palavra em uma sequência, e uma redução nesse valor significa uma melhoria na capacidade preditiva e na coerência do modelo.
Além do Llama 3.1 8B, a equipe também testou sua plataforma no SmolLM2, um modelo menor de 135 milhões de parâmetros, escolhido por ser mais fácil de estudar sistematicamente. Embora o SmolLM2 seja um modelo de menor escala, a demonstração de que o aprimoramento quântico pode funcionar em um modelo real e amplamente utilizado, como o Llama 3.1 8B, torna os resultados já promissores. Essas descobertas sugerem um caminho viável para o desenvolvimento de LLMs mais eficientes e poderosos no futuro, aproveitando o potencial da computação quântica para otimizar o uso de recursos.
Fonte original: Phys. org Physics