El hombre detrás del laboratorio secreto de Amazon para la IA: Kris King y los planes del gigante para democratizar la tecnología y reducir su consumo energético

Por

Detrás de las respuestas instantáneas que ofrece la inteligencia artificial, existe una compleja infraestructura física que desafía los límites actuales de la ingeniería y el consumo energético. En el laboratorio de pruebas de Annapurna Labs en Austin, Texas, se encienden por primera vez y se testean los procesadores que sostendrán la próxima generación de innovación global. Es el lugar donde se moldea el hardware antes de que viaje a los centros de datos de todo el mundo. CNN Chile se convirtió en el primer medio chileno en acceder a estas instalaciones, un recinto blindado al público que hoy se conoce como el “laboratorio secreto de Amazon”, gigante tecnológico que adquirió esta firma hace exactamente 11 años para comenzar su sigilosa carrera en el mercado de los microchips.

En una conversación exclusiva con CNN Chile, Kris King, el director del laboratorio de chips de inteligencia artificial de Amazon Web Services (AWS), nos abre las puertas del lugar donde conviven el cerebro y el músculo de la nube. Tras 11 años liderando este espacio —donde ha visto la evolución del hardware a medida desde el lanzamiento del primer chip de inferencia en 2018—, el especialista desglosa en esta entrevista el funcionamiento de la tecnología de tres nanómetros para mitigar el impacto ambiental de la IA. Además, revela por qué la compañía optó por diseñar sus propios componentes en lugar de comprarlos en el mercado comercial y analiza cómo un mejor rendimiento por precio permitirá que estudiantes, científicos y pequeños emprendedores locales compitan al mismo nivel que las grandes corporaciones.

-Millones de personas hablan con una inteligencia artificial todos los días para diferentes tareas. En palabras simples, ¿qué pasa en este laboratorio y por qué les importa a ellos?

-Sí. Entonces, ¿por qué les importa a ellos? Porque estamos permitiendo que nuestros clientes trabajen en nuestros chips de inferencia y entrenamiento de aprendizaje automático (machine learning). Les estamos dando un mejor rendimiento por precio, entre un 30 y un 40 por ciento mejor que cualquiera de nuestras otras ofertas. Así que esto está reduciendo la energía, reduciendo la potencia y reduciendo el costo, y mejorando nuestro rendimiento. Lo que pasa en este laboratorio que visitaron hoy es el desarrollo de estos chips. Los desarrollamos desde antes de que sean creados en silicio hasta después de que son creados en silicio, hasta ponerlos en marcha y llevarlos a producción, en nuestros centros de datos.

-Kris, Amazon podría simplemente comprar chips como lo hacen muchas de las empresas en el mundo. ¿Por qué decidieron diseñar los propios?

-Ése es un muy buen punto. No se pueden comprar chips comerciales que puedan lograr el rendimiento y el menor costo que hemos alcanzado con el Silicio Personalizado de Trainium. Así que lo que hacemos es optimizar desde el chip hasta el servidor, pasando por el rack y dentro del centro de datos, la red en el centro de datos y el software que corre en los chips. Y eso solo se puede hacer personalizando y diseñando nuestros chips para flujos de trabajo del mundo real. Y eso simplemente no se puede lograr comprando algo comercial.

-Ustedes construyen dos chips muy diferentes aquí: Graviton, que es el cerebro de propósito general de la nube, y Trainium, que es el músculo de la inteligencia artificial. In las máquinas que veremos hoy, trabajan juntos. ¿Puedes explicar cómo se dividen el trabajo?

-Sí, de hecho tengo el chip Trainium aquí conmigo. Lo que vimos hoy fue un servidor que tenía las tres piezas de Silicio Personalizado de Amazon. Y eso es un chip Nitro, Graviton y un chip Trainium 3. Así que tenemos cuatro chips Trainium 3 por servidor, un total de 144 por ultra servidor. Y el chip Graviton está principalmente allí para orquestar todos los flujos de trabajo de entrenamiento. Y nuestros chips Trainium están allí; estos son los caballos de batalla. Estos son los que están realizando el entrenamiento. Tenemos el chip, el chip de computación, y tenemos las memorias HBM en las esquinas. Esto es lo que contiene todos esos datos del modelo de entrenamiento y los distribuye a través de la flota de muchos chips Trainium allá afuera en nuestros centros de datos.

-La inteligencia artificial consume enormes cantidades de electricidad y eso preocupa a la gente en todo el mundo. En Chile también. ¿Qué están haciendo aquí desde estos chips para ayudar a que la IA no se convierta en un problema energético en el futuro?

-Sí, lo que estamos haciendo es diseñar los chips para dar el mejor precio, el mejor rendimiento y a la menor energía que nos sea posible. Hoy discutimos un par de cosas que hemos hecho. Una, pasamos a una tecnología de tres nanómetros, lo que reduce la potencia. Y luego también discutimos cómo cambiamos el diseño del sistema para mejorar la potencia. Así que una de las cosas que discutimos son nuestros reguladores de voltaje y cómo podemos optimizarlos en nuestro sistema para reducir la potencia de todo el ultra servidor.

-Ustedes trabajan con grandes empresas como OpenAI, como Uber. Pero si alguien en Chile, por ejemplo, el dueño de una pequeña empresa está viendo esta entrevista, ¿cómo puede una IA más barata ayudarles a largo plazo en su negocio?

-Hoy vemos que tienes que tener mucha inversión y mucho dinero para utilizar y entrenar tus modelos e incluso para ejecutar flujos de trabajo de inferencia. Queremos abrir esto para todas las empresas, y ni siquiera solo para empresas, sino para individuos, investigadores, estudiantes universitarios. Sentimos que la próxima generación de innovación —de la cual ni siquiera sabemos hoy en día—, sentimos que se va a construir sobre Trainium 3. Y estamos tratando de habilitar eso con nuestro rendimiento por precio entre un 30 y un 40 por ciento mejor.

-En el segundo semestre de año, AWS abrirá su región en Chile, que se llama Santiago. ¿Qué te gustaría que supieran los chilenos sobre las cosas que podrían hacer cuando la región esté abierta? ¿Cuáles serán las mejoras que están relacionadas con el uso de estos chips y estas plataformas en el futuro?

-Bueno, creo que apenas estamos comenzando a ver lo útiles que son estos chips. Tenemos una variedad de clientes. Tomemos, por ejemplo, a Uber y su capacidad para predecir mejor las rutas con su software utilizando chips Trainium. Metagenome está trabajando en la secuenciación genómica y la edición genómica, y en ser capaces de hacer eso mucho más rápido, todo corriendo sobre Trainium 3.

-Hay personas que están preocupadas por la inteligencia artificial y la perspectiva de que tenga cada vez más influencia en sus vidas. Ustedes aquí están construyendo literalmente los chips donde correrá la IA en el futuro. ¿Cuál sería tu mensaje para las personas que están preocupadas en este momento por la IA? ¿Qué tipo de cosas deberían estar haciendo ahora mismo para familiarizarse con la IA, por ejemplo, o aprender algunas cosas respecto al futuro?

-Creo que la IA nos está permitiendo a todos aprender a un ritmo más rápido. Podemos tomar nuestras ideas y llevarlas al siguiente paso porque podemos aprender más rápido, podemos experimentar y podemos construir sobre esas ideas a un ritmo mucho más rápido. Así que eso es lo que animaría a la gente a hacer: úsenla para aprender, úsenla para innovar.

-¿En qué están pensando para los próximos años? ¿Cuáles son las metas de Annapurna Labs pensando, por ejemplo, para el 2030?

-Bueno, nuestra meta va a ser la misma ya sea hoy o en el 2030, y es entregar a nuestros clientes el mejor rendimiento por precio. Cualquiera que sea la tecnología o el chip que estemos desarrollando en el 2030, esa va a ser la meta. No creo que sepamos hoy cuál será la próxima innovación, pero la forma en que trabajamos es que aprendemos de nuestros clientes. Nos asociamos con nuestros clientes e intentamos entregar las cosas que necesitan para ejecutar sus flujos de trabajo mucho más rápido.

Lee también