DeepSeek V3.2 versión oficial lanzada: mejora las capacidades de los agentes e integra pensamiento y razonamiento
Jinse Finance informó que hoy lanzamos simultáneamente dos modelos en versión oficial: DeepSeek-V3.2 y DeepSeek-V3.2-Speciale. DeepSeek-V3.2 es nuestro primer modelo que integra el pensamiento en el uso de herramientas, y admite tanto el modo de pensamiento como el modo sin pensamiento para la utilización de herramientas. Hemos propuesto un método de síntesis de datos de entrenamiento a gran escala para agentes, construyendo una gran cantidad de tareas de aprendizaje reforzado que son "difíciles de responder pero fáciles de verificar" (más de 1800 entornos, más de 85.000 instrucciones complejas), lo que mejora significativamente la capacidad de generalización del modelo. (DeepSeek)
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
El índice Dow Jones cerró con una caída de 94,87 puntos, y tanto el S&P 500 como el Nasdaq también bajaron.
Las tres principales bolsas estadounidenses cerraron con leves bajas; Baidu subió más del 4%.
