Escuchá esta nota
EL DIARIO digital
minutos
Nvidia anunció en la conferencia NeurIPS el lanzamiento de Alpamayo-R1 (AR1), el primer modelo abierto de inteligencia artificial de razonamiento para vehículos autónomos. Este desarrollo representa un avance significativo en la tecnología de conducción autónoma y refuerza la apuesta de la compañía por la apertura y la colaboración en el ámbito de la IA.
Alpamayo-R1 se presenta como el primer modelo abierto de visión, lenguaje y acción (VLA) orientado al razonamiento para la conducción autónoma. De acuerdo con Nvidia, AR1 integra razonamiento de cadena de pensamiento y planificación de rutas, lo que permite a los vehículos analizar escenarios complejos y tomar decisiones con un criterio similar al humano.
El modelo descompone cada situación y evalúa posibles trayectorias, utilizando datos contextuales para seleccionar la ruta más segura. Esta capacidad resulta especialmente relevante en entornos urbanos, donde los vehículos deben gestionar intersecciones con peatones, automóviles estacionados en doble fila o cierres de carriles.

La compañía indicó que el modelo, construido sobre la base de Nvidia Cosmos Reason, puede personalizarse para aplicaciones de investigación no comercial. Además, el entrenamiento adicional mediante aprendizaje por refuerzo ha demostrado mejoras notables en las capacidades de razonamiento de AR1 respecto a su versión original.
Acceso abierto y herramientas para la comunidad investigadora
La estrategia de Nvidia se centra en facilitar el acceso abierto a sus modelos y herramientas. AR1 y un subconjunto de sus datos de entrenamiento están disponibles en plataformas como GitHub y Hugging Face, junto con los conjuntos de datos abiertos de inteligencia artificial física de la empresa.
Los investigadores pueden utilizar el marco AlpaSim para evaluar el rendimiento del modelo. Esta apertura busca fomentar la colaboración y la experimentación en la comunidad global de inteligencia artificial, acelerando el desarrollo de soluciones para la movilidad autónoma.
Más allá de AR1, la plataforma Cosmos de Nvidia ofrece una serie de herramientas para el desarrollo de inteligencia artificial física. Entre ellas se encuentran LidarGen, que genera datos de lidar para simulación de vehículos autónomos; Omniverse NuRec Fixer, orientada a la limpieza de reconstrucciones neuronales; Cosmos Policy, que permite crear reglas de comportamiento para robots; y ProtoMotions3, diseñada para entrenar robots humanoides en entornos simulados realistas.

Expansión digital y aplicaciones
En el ámbito digital, Nvidia ha fortalecido su kit de herramientas Nemotron. Entre las novedades destacan MultiTalker Parakeet, un modelo de reconocimiento automático de voz multihablante, y Sortformer, que realiza diarización de hablantes en tiempo real. Nemotron también incorpora modelos de seguridad basados en razonamiento y conjuntos de datos sintéticos para el aprendizaje por refuerzo y el desarrollo de inteligencia artificial en dominios específicos.
Otras actualizaciones relevantes incluyen Audio Flamingo 3, un modelo de lenguaje de audio capaz de razonar sobre voz, música y sonido, y Minitron-SSM, que comprime modelos híbridos sin pérdida de rendimiento. Además, los investigadores de Nvidia han presentado Jet-Nemotron y Nemotron-Flash, optimizados para una inferencia eficiente y baja latencia en modelos de lenguaje.
El ecosistema de Nvidia ya cuenta con la participación de socios como Voxel51, 1X, Figure AI, Foretellix, Gatik, Oxa, PlusAI y X-Humanoid, quienes están aplicando los modelos base de Cosmos en proyectos de conducción autónoma y robótica. Investigadores de ETH Zurich también han empleado la plataforma Cosmos para la creación de escenas tridimensionales, presentando sus resultados en la misma conferencia NeurIPS.
El compromiso de Nvidia con la apertura de modelos de inteligencia artificial ha recibido el reconocimiento de Artificial Analysis, que ha situado a la familia Nemotron entre las más abiertas del ecosistema de IA. Este posicionamiento refuerza el liderazgo de la compañía en la promoción de herramientas accesibles para investigadores, desarrolladores y empresas dedicadas a la innovación en sistemas autónomos.