El cerebro detrás de la IA: Ron Diamant, el experto de Amazon que revela cómo se fabrican los chips que dan vida a ChatGPT y Claude

Por

Cada vez que un usuario en Chile o en cualquier parte del mundo le hace una pregunta a ChatGPT o interactúa con Claude, se activa una maquinaria tecnológica invisible pero colosal a miles de kilómetros de distancia. En el epicentro de esta revolución se encuentra Annapurna Labs, el laboratorio de Amazon en Austin, Texas, donde se diseñan los chips Trainium, el verdadero motor computacional detrás de los modelos de inteligencia artificial más avanzados del planeta.

En una conversación exclusiva con CNN Chile, Ron Diamant, vicepresidente de Amazon Web Services (AWS) y arquitecto principal de Trainium, nos recibe en este reservado santuario de semiconductores. El diálogo empieza entre risas: espontáneamente, Diamant dice que Trainium es “bacán”, para luego contar que conoce el término porque sus mejores amigos son chilenos.

Pero luego, el ingeniero, que se unió a Annapurna Labs dos semanas después de su fundación y se quedó cuando la empresa fue adquirida por Amazon, explica el complejo proceso que ocurre dentro de los chips con cada prompt, aborda el ambicioso plan de la firma por hacer de la IA una tecnología tan masiva y accesible como lo fue la electricidad en su momento, y analiza el impacto de la histórica inversión de $4.000 millones de dólares que Amazon desplegará este año con sus nuevos centros de datos en Santiago.

-Dijiste que Annapurna Labs es la empresa de semiconductores más grande de la que nunca se ha oído hablar. Para los espectadores chilenos que usan ChatGPT o usan Claude todos los días sin saberlo, ¿qué pasa dentro de estos chips cada día cuando alguien le hace una pregunta a la IA?

Cuando interactúas con ChatGPT, escribes tu prompt en la interfaz web y luego hay una solicitud que va a estos chips Trainium. Este procesa la indicación y comienza a generarte palabras una tras otra. Este es un flujo de trabajo muy intensivo en computación, en el cual trabajamos muy duro para optimizar mediante la construcción de chips especializados que puedan realizar eso de manera muy, muy rápida y muy eficiente en costos.

-Te uniste a Annapurna Labs muy poco después de que fuera fundada. Eran una startup que construía tarjetas de red y hoy sus chips ejecutan los modelos de IA más avanzados de todo el mundo. ¿Hubo algún momento en el que pensaras algo como “esto se está saliendo de las manos”, en el buen sentido?

-No diría que pensé que se está saliendo de las manos, pero definitivamente está superando cualquier sueño que haya tenido antes. Y a medida que la oportunidad se hacía más y más grande, estuvimos absolutamente entusiasmados de estar a la altura del desafío y recibirlo con las dos manos. Así que, no habría adivinado hace cinco o diez años que estaríamos haciendo lo que estamos haciendo ahora mismo, pero estamos entusiasmados con ello. No sentimos que se esté saliendo de las manos.

-¿Y por qué Amazon decidió construir sus propios chips, que es algo que realmente muy pocas empresas en el mundo pueden hacer?

Comenzó con una propuesta de uno de nuestros ingenieros distinguidos ahora, un vicepresidente sénior (SVP) e ingeniero distinguido llamado James Hamilton; él vio las proyecciones de las CPU ARM y la inversión en el ecosistema sobre las CPU ARM dentro del espacio móvil. Y tuvo la convicción de que esa inversión crecería hacia CPU basadas en ARM muy eficientes a nivel de centros de datos. Y como resultado, buscaba construir CPU para centros de datos basadas en ARM para los centros de datos de AWS, lo que eventualmente lo llevó a encontrar a Annapurna Labs y finalmente inició la línea de productos Graviton. Y después de eso, repetimos la misma historia de éxito con los chips Trainium.

-Dijiste que el objetivo de Annapurna Labs es hacer que la IA sea más asequible y más democratizada. en un mundo de IA verdaderamente democratizado, ¿qué puede hacer un profesor, un médico o el dueño de una pequeña empresa en Chile que simplemente no pueden hacer hoy?

-Nuestro objetivo es permitir que la mayor parte posible de la sociedad utilice la IA. Y para eso, necesitamos un par de cosas. En primer lugar, siempre queremos hacer que la IA sea más inteligente, más predecible y más segura, de tal manera que la población pueda usarla y confiar en estas tecnologías de IA. Pero también es muy importante para nosotros hacerla eficiente en costos, de modo que incluso tu profesor en cualquier empresa, profesor o estudiante en cualquier empresa del mundo pueda permitirse el lujo de tener acceso a los modelos de IA más avanzados y utilizarlo para la educación, para el aprendizaje, para el asesoramiento médico, para muchos otros casos de uso.

-¿Y qué se interpone todavía en el camino, aun cuando esto ha sido realmente rápido? ¿El costo, el conocimiento, la tecnología?

Creo que en este momento estamos en un buen punto donde cada persona en el mundo puede interactuar con ChatGPT o con los modelos de Claude y hacerlo con un programa de nivel gratuito. Eso es realmente importante. Significa que la gente tiene acceso a esta tecnología. Pero lo que también estamos viendo es que estos modelos se están volviendo, estos modelos de IA se están volviendo más inteligentes y más costosos de ejecutar generación tras generación. Y queremos garantizar el acceso gratuito a la mayor cantidad de personas posible en todo el mundo, lo que significa que necesitamos suministrar la infraestructura que permita ejecutar estos flujos de trabajo más inteligentes y más intensivos en computación al mismo costo o incluso menor. Y en eso es en lo que estamos trabajando.

-Tú has comparado la IA con la electricidad: al principio, es solo como iluminar los hogares, pero luego lo transforma todo. ¿Crees que estamos entrando en una nueva fase de infraestructura tecnológica? Y si es así, ¿en qué momento nos encontramos?

Sí, tengo la gran convicción de que la IA penetrará en muchísimas áreas de nuestras vidas. La comparé con la electricidad porque cuando la descubrimos como humanidad, cuando descubrimos la electricidad, solo vimos el primer caso de uso: cómo iluminar nuestros hogares. Pero con el tiempo, todos vimos que la electricidad penetró en la mayoría de nuestras vidas y las mejoró. Nuestra calidad de vida mejoró. Con la IA, creo que estamos en las etapas iniciales en este momento. Estamos viendo que nos ayuda con recomendaciones, con chatbots, con el estudio de nuevos campos y ahora con aplicaciones de programación. Pero veremos a la IA penetrar en muchísimos campos de nuestras vidas. Y nuevamente, mejorando nuestra calidad de vida y mejorando la tecnología que está disponible para cada ser humano en todo el mundo.

-Construyes máquinas que potencian los modelos de IA más inteligentes del mundo. Mucha gente que nos está viendo teme que la inteligencia artificial se lleve sus trabajos. Desde el hombre que está construyendo los chips detrás de esos modelos, ¿qué les dirías?

-Es una muy buena pregunta. Sí pensamos en estas cosas. Y esa es la razón por la que queremos que la IA sea ampliamente accesible, para que haya una discusión social sobre cómo hacemos progresar esta tecnología. Pero en cualquier caso, creo que proporcionar una infraestructura sólida para ejecutar estos modelos de IA, para permitir que muchas empresas ejecuten estos modelos de IA, simplemente hace que la discusión sea más colaborativa, hace que más personas, en lugar de solo unas pocas empresas, puedan influir en hacia dónde va el panorama de la IA. Y creo profundamente en lo adaptables que somos los humanos. Y si bien algunos trabajos serán desplazados por la IA, otros trabajos se materializarán. Y creo que no es diferente de otras revoluciones tecnológicas que hemos tenido en toda la industria.

-Entre sus clientes hay, por ejemplo, una startup que está haciendo genética para curar enfermedades. ¿Qué usos de la tecnología te entusiasman e inspiran más?

Creo que cada semana o cada mes hablo con un nuevo cliente que logra inspirarme por completo con la forma en que usan nuestros chips. Estoy absolutamente entusiasmado con brindar mejores capacidades educativas a los estudiantes de todo el mundo. Solo pienso en mi hijo que está creciendo ahora mismo y podrá aprender mucho más de lo que yo jamás supe porque tiene acceso a esta tecnología. Y, por supuesto, la empresa que mencioné, Metagenome, que está haciendo edición genética con nuestros chips para curar enfermedades y simplemente resolver problemas reales, problemas reales que la gente en todo el mundo tiene con nuestros chips. Me entusiasma venir a trabajar y construir la próxima generación de Trainiums.

-A finales de este año, AWS abrirá su primera región en Chile con centros de datos en Santiago. Es una inversión de 4.000 millones de dólares. ¿Llegarán a Chile los chips que diseñas aquí en Annapurna Labs? ¿Y qué cambia para un país como el nuestro cuando esta tecnología vive en casa en lugar de a miles de kilómetros de distancia?

-Es increíble que estemos viendo esa colaboración entre Chile y Amazon y esa inversión en la construcción de infraestructura en Chile. Proporciona muchos puestos de trabajo para el mercado chileno, lo cual es muy bueno. Y también permite que las startups en Chile que necesitan acceso a la computación en la nube tengan una latencia mucho menor hacia su infraestructura informática porque es local dentro del país. No sé si los Trainium terminarán allí o no. El tiempo lo dirá y la demanda de los clientes dirá si vamos allí o no. Pero si hay una necesidad del cliente, encontraremos la manera de poner Trainiums allí.

Lee también