Modèles puissants à coût réduit — V3, R1, V4-Pro
Le rapport DeepSeek-V3 décrit un modèle Mixture-of-Experts de 671 milliards de paramètres, avec 37 milliards activés par token et 14,8 trillions de tokens de pré-entraînement. R1 vise le raisonnement par apprentissage par renforcement. Reuters signale ensuite une stratégie de prix agressive, avec une baisse permanente de 75 % sur V4-Pro en 2026.
Traçabilité
Sources utilisées
Chaque source s’ouvre sur le site de son éditeur. IA Radar conserve sa date de publication lorsqu’elle est disponible et sa date de vérification.
- DeepSeek-V3 Technical Report arXiv / DeepSeek authors Publié le 27 décembre 2024
- DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning arXiv / DeepSeek authors Publié le 22 janvier 2025
- China's DeepSeek to make permanent 75% price cut on flagship V4-Pro AI model Reuters Publié le 23 mai 2026