O iFood ajudou a testar o novo modelo GPT-4.1, lançado oficialmente na semana passada pela OpenAI em sua API. Desde 2024, o iFood faz parte de um grupo “beta testers” que têm a missão de contribuir com o aprimoramento das soluções lançadas pela empresa, antes da disponibilização para o mercado em geral. Isso permitiu avaliar, em primeira mão, os avanços dos modelos em aplicações reais voltadas ao mercado de delivery.
Nova versão do GPT
Dados de dez diferentes projetos da empresa foram analisados para validar os benefícios do GPT-4.1. Os testes envolveram análises qualitativas e o uso de técnicas como LLM-as-a-Judge – uma ferramenta que aplica o mesmo tipo de inteligência artificial dos modelos de linguagem natural para avaliar a qualidade das respostas da nova versão. Foram comparados os retornos dos diferentes modelos em situações reais já comuns no iFood, apontando um incremento de mais de 10% de respostas fornecidas pela ferramenta com qualidade considerada “aceitável” ou “ótima”.
A melhoria em qualidade não significa apenas o aprimoramento dos resultados de cada um dos projetos, como também diminui cenários de alucinações dos modelos, que são os resultados imprecisos ou enganosos. Os aprendizados foram analisados internamente pela equipe do iFood e compartilhados com a OpenAI, ajudando a entender o potencial do novo modelo. “Os resultados mostram um claro ganho de desempenho nos projetos em que o novo modelo foi aplicado”, afirma Thiago Cardoso, diretor sênior de Inteligência Artificial e Dados do iFood.