Il modello DeepSeek-V3.2-Exp è stato ufficialmente rilasciato e reso open source.
Secondo ChainCatcher, il modello DeepSeek-V3.2-Exp è stato ufficialmente rilasciato e reso open source oggi. Il modello introduce un'architettura di Attention sparsa, che può ridurre efficacemente il consumo di risorse computazionali e migliorare l'efficienza dell'inferenza del modello. Attualmente, il modello è stato ufficialmente lanciato sulla piattaforma Huawei Cloud MaaS (Model as a Service). Per quanto riguarda il modello DeepSeek-V3.2-Exp, Huawei Cloud continua ad adottare la soluzione di parallelismo EP su larga scala, implementando una strategia di parallelismo contestuale adatta a sequenze lunghe basata sulla struttura di Attention sparsa, bilanciando al contempo la latenza e le prestazioni di throughput del modello.
Esclusione di responsabilità: il contenuto di questo articolo riflette esclusivamente l’opinione dell’autore e non rappresenta in alcun modo la piattaforma. Questo articolo non deve essere utilizzato come riferimento per prendere decisioni di investimento.
Ti potrebbe interessare anche
L'indice del dollaro USA è rimasto sostanzialmente invariato il 24, chiudendo a 97,941.
L'oro spot è sceso sotto i 4450 dollari/oncia, in calo dello 0,78% nella giornata.
