A Microsoft anunciou nesta semana o lançamento do Maia 200, seu primeiro chip “de verdade” para inferência de aplicações de IA. Em post no blog da empresa, a Microsoft detalha que o chip é baseado em arquitetura de 3 nanômetros e será fabricado pela TSMC.
Como costuma ocorrer nestes casos, a Microsoft diz que seu chip é superior ao dos concorrentes Google e AWS. “O Maia é o chip mais poderoso de qualquer hyperscaler, com três vezes a performance do AWS Trainium3 em 4 teraflops e desempenho superior à sétima geração de TPU do Google em 8 teraflops”, diz o texto.
O Maia 200 é o sucessor do Maia 100, anunciado lá em 2023, mas que nunca chegou a ser realmente oferecido em grande escala para clientes da nuvem Azure (pra quem se interessar, uma comparação bem nerd e detalhada entre os chips pode ser lida aqui). Por sua vez, o Maia 200 foi anunciado já com chips em operação em alguns datacenters da Microsoft nos EUA, e com promessas de oferta em outras regiões.
Como seus rivais AWS e Google, a Microsoft mostra que vai apostar em chips caseiros para baratear o custo do acesso a aplicações de IA e tentar diminuir sua dependência da Nvidia, que domina este mercado.