Amazon (NASDAQ:AMZN) Web Services (AWS) ha anunciado la introducción de nuevos servidores para centros de datos equipados con sus propios chips de inteligencia artificial (IA), lo que supone un desafío al dominio de Nvidia (NASDAQ:NVDA) en el sector. Apple Inc (NASDAQ:AAPL). ha sido confirmada como cliente, planeando utilizar estos nuevos chips Trainium2. La unidad de nube de AWS reveló que estos servidores formarán parte de un superordenador masivo, que incorporará cientos de miles de chips. Este anuncio se realizó el martes.
Este superordenador, alimentado por los chips Trainium2 de AWS, será utilizado por la startup de IA Anthropic, que será la primera empresa en utilizar esta tecnología. Anthropic es conocida por crear sistemas de IA fiables e interpretables y aprovechará la potencia de cálculo para mejorar las capacidades de sus modelos de IA.
Benoit Dupin, ejecutivo de Apple, también reconoció que el gigante tecnológico está empleando chips Trainium2, lo que supone una adopción significativa de la nueva oferta de AWS.
Matt Garman, director ejecutivo de AWS, reveló además que la compañía ya está trabajando en Trainium3, la siguiente evolución de su chip de IA, que está previsto que debute el año que viene.
Las nuevas instancias de Amazon Elastic Compute Cloud (Amazon EC2), impulsadas por AWS Trainium2, ya están disponibles de forma general e introducen los Trn2 UltraServers. Estos UltraServers están diseñados para ofrecer un rendimiento y una rentabilidad excepcionales para el entrenamiento y el despliegue de modelos de IA contemporáneos, incluidos los modelos de lenguaje de gran tamaño (LLM) y los modelos de base (FM).
Las instancias Trn2 prometen una mejora del 30-40% en el rendimiento del precio con respecto a las actuales instancias EC2 basadas en GPU y cuentan con 16 chips Trainium2, que proporcionan 20,8 petaflops pico de computación. Esto las hace ideales para manejar cargas de trabajo de IA con miles de millones de parámetros.
Para tareas de IA aún más exigentes, los Trn2 UltraServers ofrecen un nuevo servicio EC2, con 64 chips Trainium2 interconectados para hasta 83,2 petaflops pico de computación. Esta configuración cuadruplica las capacidades de computación, memoria y red de una única instancia, permitiendo el entrenamiento y despliegue de los modelos de IA más grandes del mundo.
El proyecto de colaboración entre AWS y Anthropic, denominado Project Rainier, tiene como objetivo construir un UltraCluster EC2 de Trn2 UltraServers, que se convertirá en el cluster de computación de IA más grande del mundo una vez completado.
AWS también destacó el próximo chip Trainium3, que se fabricará utilizando un nodo de proceso de 3 nanómetros, y que promete cuadruplicar el rendimiento de los actuales Trn2 UltraServers.
El kit de desarrollo de software (SDK) AWS Neuron facilita la optimización de modelos de IA para su ejecución en chips Trainium, soportando marcos populares como JAX y PyTorch, y está integrado con el hub de modelos Hugging Face, que alberga más de 100.000 modelos.
Las instancias de Trn2 están disponibles actualmente en la región de AWS de EE.UU. Este (Ohio), con planes para ampliar la disponibilidad a otras regiones en breve. Mientras tanto, los Trn2 UltraServers se ofrecen en fase de preestreno.
Este artículo fue traducido con la ayuda de inteligencia artificial. Para obtener más información, consulte nuestros Términos de Uso.