DeepSeek V3.2 versión oficial lanzada: mejora las capacidades de los agentes e integra pensamiento y razonamiento

金色财经2025/12/01 11:26

Mostrar el original

Jinse Finance informó que hoy lanzamos simultáneamente dos modelos en versión oficial: DeepSeek-V3.2 y DeepSeek-V3.2-Speciale. DeepSeek-V3.2 es nuestro primer modelo que integra el pensamiento en el uso de herramientas, y admite tanto el modo de pensamiento como el modo sin pensamiento para la utilización de herramientas. Hemos propuesto un método de síntesis de datos de entrenamiento a gran escala para agentes, construyendo una gran cantidad de tareas de aprendizaje reforzado que son "difíciles de responder pero fáciles de verificar" (más de 1800 entornos, más de 85.000 instrucciones complejas), lo que mejora significativamente la capacidad de generalización del modelo. (DeepSeek)

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Haz staking y gana nuevos tokens.

APR de hasta 12%. Gana más airdrop bloqueando más.

¡Bloquea ahora!

También te puede gustar

El índice Dow Jones cerró con una caída de 94,87 puntos, y tanto el S&P 500 como el Nasdaq también bajaron.

Chaincatcher•2025/12/30 21:08

Las tres principales bolsas estadounidenses cerraron con leves bajas; Baidu subió más del 4%.

Chaincatcher•2025/12/30 21:05

La mayoría de los participantes en la reunión de la Reserva Federal: Si la inflación disminuye con el tiempo, será apropiado relajar aún más la política monetaria.

Odaily星球日报•2025/12/30 19:09

Actas de la reunión de la Reserva Federal: los participantes consideran que el saldo de reservas ha descendido a un nivel suficiente.

Chaincatcher•2025/12/30 19:05