IA Radar Cartographier les IA, leurs intérêts et leurs risques

Modèles puissants à coût réduit — V3, R1, V4-Pro

Le rapport DeepSeek-V3 décrit un modèle Mixture-of-Experts de 671 milliards de paramètres, avec 37 milliards activés par token et 14,8 trillions de tokens de pré-entraînement. R1 vise le raisonnement par apprentissage par renforcement. Reuters signale ensuite une stratégie de prix agressive, avec une baisse permanente de 75 % sur V4-Pro en 2026.

Traçabilité

Sources utilisées

Chaque source s’ouvre sur le site de son éditeur. IA Radar conserve sa date de publication lorsqu’elle est disponible et sa date de vérification.

  1. DeepSeek-V3 Technical Report
    arXiv / DeepSeek authors Publié le 27 décembre 2024
  2. DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning
    arXiv / DeepSeek authors Publié le 22 janvier 2025
  3. China's DeepSeek to make permanent 75% price cut on flagship V4-Pro AI model
    Reuters Publié le 23 mai 2026