DeepSeek V3.2 version officielle publiée : capacités d’Agent renforcées, intégration de la réflexion et du raisonnement
Jinse Finance rapporte qu'aujourd'hui, nous publions simultanément deux modèles en version officielle : DeepSeek-V3.2 et DeepSeek-V3.2-Speciale. DeepSeek-V3.2 est notre premier modèle intégrant la réflexion dans l'utilisation des outils, tout en prenant en charge à la fois le mode réflexion et le mode non-réflexion pour l'appel d'outils. Nous avons proposé une méthode de synthèse de données d'entraînement à grande échelle pour les Agents, construisant un grand nombre de tâches de renforcement « difficiles à résoudre, faciles à vérifier » (plus de 1800 environnements, plus de 85 000 instructions complexes), ce qui a considérablement amélioré la capacité de généralisation du modèle. (DeepSeek)
Avertissement : le contenu de cet article reflète uniquement le point de vue de l'auteur et ne représente en aucun cas la plateforme. Cet article n'est pas destiné à servir de référence pour prendre des décisions d'investissement.
Vous pourriez également aimer
En vogue
PlusLe total des flux nets des ETF Bitcoin au comptant a atteint 224 millions de dollars hier, avec IBIT de BlackRock en tête grâce à un afflux net de 193 millions de dollars.
Un important "bull whale" vient d’ouvrir une position longue SEI d’une valeur de 825 000 dollars, après avoir réalisé un profit de 150 000 dollars sur sa précédente position short BTC.
