Custo de inferência deve cair, mas IA continuará cara

Coluna: André Cardozo

Coluna que cobre temas como cloud computing, Inteligência Artificial e outras tendências do mundo da tecnologia. Editada por André Cardozo, jornalista com mais de 20 anos de experiência na cobertura de tecnologia

Custo de inferência deve cair, mas IA continuará cara

Avanço da IA agêntica deve manter gastos com IA em patamares altos

Custo de inferência deve cair, mas IA continuará cara

mais recente relatório do Gartner tem uma notícia boa e uma ruim para empresas que precisam gerir seus custos com IA. A boa é que o custo com inferência (ou seja, com o uso efetivo de soluções de IA) deve despencar. Até 2030, o instituto estima que o custo da inferência pode cair até 90%, devido a modelos de linguagem até 100 vezes mais poderosos do que os atuais. O movimento será impulsionado por hardware mais avançado, aplicações mais sofisticadas e expansão do uso da IA para dispositivos de borda.

A notícia ruim é que, no fim das contas, essa redução de custo não deve fazer diferença nos balanços das empresas. Isso porque o uso de soluções mais sofisticadas de IA, como aplicações de IA agêntica, deve continuar caro. Essas aplicações necessitam de mais tokens para funcionar, e como a inferência deve virar a famosa “carne de vaca”, o diferencial competitivo pode ficar em soluções mais sofisticas, e portanto caras.

Segundo o Gartner, aplicações mais avançadas podem consumir de cinco a 30 vezes mais tokens por tarefa em comparação com soluções generativas tradicionais. Isso significa que, embora o custo por token caia, o custo total por aplicação pode subir. Diante desse cenário, o instituto recomenda que CIOs equilibrem investimentos entre soluções mais simples e iniciativas de ponta. Apostar apenas em inovação avançada pode inflar custos rapidamente, enquanto ficar restrito a casos básicos limita o potencial de geração de valor, observa o instituto.