27 décembre 2024 Date de publication publique À surveiller

Modèles puissants à coût réduit — V3, R1, V4-Pro

Le rapport DeepSeek-V3 décrit un modèle Mixture-of-Experts de 671 milliards de paramètres, avec 37 milliards activés par token et 14,8 trillions de tokens de pré-entraînement. R1 vise le raisonnement par apprentissage par renforcement. Reuters signale ensuite une stratégie de prix agressive, avec une baisse permanente de 75 % sur V4-Pro en 2026.

DeepSeek Projets stratégiques

Traçabilité

Sources utilisées

Chaque source s’ouvre sur le site de son éditeur. IA Radar conserve sa date de publication lorsqu’elle est disponible et sa date de vérification.

DeepSeek-V3 Technical Report
arXiv / DeepSeek authors Publié le 27 décembre 2024
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
arXiv / DeepSeek authors Publié le 22 janvier 2025
China's DeepSeek to make permanent 75% price cut on flagship V4-Pro AI model
Reuters Publié le 23 mai 2026