entrenamiento de contexto largo

Herramienta de NVIDIA enseña a la IA a pensar como campeones de las matemáticas

Descubre cómo NeMo-RL de NVIDIA utiliza el aprendizaje por refuerzo para entrenar modelos de IA que pueden resolver problemas matemáticos complejos a niveles de campeonato, igualando el rendimiento de O1 de OpenAI.

2025.07.13

Ciencia y Tecnología

entrenamiento de contexto largo

Herramienta de NVIDIA enseña a la IA a pensar como campeones de las matemáticas

通知を許可するには