O Projeto Rainier, considerado um dos maiores clusters de computação de inteligência artificial do mundo, entrou em operação total menos de um ano após ser anunciado. De acordo com a Amazon Web Services (AWS), o sistema representa um marco em sua estratégia de ampliar a infraestrutura de IA em escala global.
A iniciativa foi desenvolvida em parceria com a Anthropic, empresa de pesquisa e segurança em IA, que utiliza o Rainier para treinar e operar o modelo Claude. Segundo informações da AWS, até o fim deste ano, o Claude deverá estar ativo em mais de 1 milhão de chips Trainium2, distribuídos entre tarefas de treinamento e inferência.
Batizado em homenagem ao Monte Rainier, um estratovulcão de 4.392 metros localizado próximo a Seattle, o projeto se estende por múltiplos centros de dados nos Estados Unidos. Com quase meio milhão de chips Trainium2, o cluster oferece uma capacidade computacional cinco vezes maior que a usada pela Anthropic em versões anteriores de seus modelos de IA.
O engenheiro sênior da AWS e arquiteto-chefe do Trainium, Ron Diamant, afirmou que “o Projeto Rainier é um dos empreendimentos mais ambiciosos da AWS até hoje” e destacou que o sistema inaugura uma nova geração de modelos de inteligência artificial.
O Rainier é composto por uma rede de servidores conhecidos como UltraServers Trainium2, que reúnem quatro unidades físicas com 16 chips cada, interligadas por conexões de alta velocidade chamadas NeuronLinks. Essa configuração reduz a latência e acelera o processamento em tarefas complexas. Conectando milhares desses servidores, a AWS criou o UltraCluster — estrutura que forma o núcleo do projeto.
A arquitetura do Rainier inclui também a tecnologia Elastic Fabric Adapter (EFA), que garante comunicação rápida entre servidores e data centers, ampliando a eficiência operacional. De acordo com a empresa, essa combinação de hardware e rede interna otimiza a performance e facilita a escalabilidade do sistema.
Outro diferencial é o controle integral da cadeia tecnológica. A AWS desenvolve desde o chip até o software que coordena os servidores, o que permite identificar falhas e implementar melhorias com rapidez. Essa integração também reduz custos e acelera a evolução dos modelos de aprendizado de máquina.
Em relação à sustentabilidade, a AWS informou que toda a eletricidade usada em suas operações globais — incluindo o Projeto Rainier — foi proveniente de fontes renováveis nos anos de 2023 e 2024. A empresa anunciou investimentos em energia nuclear, armazenamento em baterias e projetos de geração renovável, com a meta de atingir emissões líquidas zero até 2040.
Nos centros de dados ligados ao projeto, estão sendo implantadas soluções para reduzir o consumo de energia mecânica em até 46% e as emissões de carbono no concreto em 35%. Além disso, a AWS informou que suas unidades em Indiana, um dos locais do Rainier, utilizam sistemas de resfriamento baseados em ar externo, minimizando o uso de água durante grande parte do ano.
Segundo dados do Laboratório Nacional Lawrence Berkeley, o consumo médio de água em data centers do setor é de 0,375 litro por quilowatt-hora. A AWS afirma que alcançou uma média de 0,15 litro, resultado 40% melhor que o de 2021.
O Projeto Rainier simboliza, segundo especialistas do setor, uma nova etapa para a computação de alto desempenho. Sua infraestrutura poderá impulsionar avanços em diversas áreas, como pesquisa médica e ciência climática, consolidando a AWS entre os principais protagonistas da era da inteligência artificial em larga escala.