DeepSeek déploie V4, son nouveau modèle IA avec un contexte ultra-long d'un million de jetons

DW — 2026-04-24T05:25:38.384+00:00

Résumé

DeepSeek a lancé une préversion de son modèle V4 en deux versions : une édition Pro dotée de 1,6 trillion de paramètres et une édition Flash de 284 milliards de paramètres. Le modèle se distingue par une fenêtre de contexte record d'un million de jetons et des capacités multimodales natives.

Les faits

DeepSeek, l'entreprise chinoise d'intelligence artificielle, a annoncé le lancement d'une préversion de son modèle V4, marquant une nouvelle étape dans sa stratégie de développement de modèles performants et accessibles. Le modèle se décline en deux variantes : une édition Pro disposant d'environ 1,6 trillion de paramètres et une édition Flash plus légère de 284 milliards de paramètres. Cette architecture dual répond à des besoins distincts, permettant aux utilisateurs de choisir entre performance maximale et efficacité computationnelle. La caractéristique majeure de DeepSeek-V4 réside dans sa fenêtre de contexte ultra-long d'un million de jetons, soit environ un million de caractères selon les déclarations de l'entreprise. Cette capacité exceptionnelle permet au modèle de mémoriser et de traiter des volumes de texte considérablement plus importants que la plupart de ses concurrents, ouvrant des perspectives nouvelles pour l'analyse de documents volumineux, la recherche scientifique et les applications nécessitant une compréhension contextuelle profonde. Le lancement de V4 intervient dans un contexte où DeepSeek a déjà établi sa réputation avec ses modèles précédents, notamment DeepSeek-R1, spécialisé dans le raisonnement logique. L'intégration de capacités multimodales natives dans V4 indique une ambition d'offrir une plateforme polyvalente capable de traiter non seulement du texte, mais également d'autres modalités d'information. Cette préversion représente une étape intermédiaire avant le déploiement complet du modèle.

Pourquoi c’est important

Le lancement de DeepSeek-V4 revêt une importance stratégique majeure dans le paysage de l'intelligence artificielle mondiale. Avec une fenêtre de contexte d'un million de jetons, DeepSeek établit un nouveau standard technique qui surpasse les capacités contextuelles de nombreux modèles concurrents, y compris certaines versions de GPT et Claude. Cette avancée consolide la position de la Chine comme acteur majeur dans la course à l'IA générative, particulièrement dans le segment open source où DeepSeek a déjà démontré sa capacité à proposer des solutions performantes à coûts réduits. Cette initiative revêt également une dimension géopolitique et économique significative. En proposant un modèle hautement performant avec des capacités multimodales et une efficacité computationnelle optimisée, DeepSeek renforce la compétition mondiale et remet en question la domination des laboratoires occidentaux. L'architecture à mélange d'experts clairsemé de DeepSeek, qui n'active que les paramètres nécessaires par tâche, offre un avantage économique substantiel en réduisant les coûts d'inférence, rendant l'IA avancée plus accessible aux entreprises et aux chercheurs du monde entier.

Questions fréquentes

Quelle est la différence entre les éditions Pro et Flash de DeepSeek-V4 ?

L'édition Pro dispose de 1,6 trillion de paramètres pour une performance maximale, tandis que l'édition Flash en compte 284 milliards pour une efficacité computationnelle accrue et des coûts d'inférence réduits.

Qu'est-ce qu'une fenêtre de contexte d'un million de jetons ?

Elle permet au modèle de traiter et mémoriser environ un million de caractères de texte simultanément, bien au-delà des capacités de la plupart des modèles concurrents.

DeepSeek-V4 est-il disponible immédiatement ?

Non, il s'agit actuellement d'une préversion. Une version complète de V4 Lite est apparue en mars 2026, le déploiement complet étant prévu ultérieurement.

Quelles sont les capacités multimodales de V4 ?

Le modèle intègre nativement des capacités multimodales, lui permettant de traiter plusieurs types de données au-delà du texte, bien que les détails spécifiques restent à être précisés.

Source

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l'analyse de l'actualité de l'intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.