Deepseek et son impact sur la race mondiale générative de l'IA

Depuis son lancement au public le 20 janvier 2025, le chatbot open-source de la startup chinoise Deepseek a pris d'assaut le monde de la technologie.

En tant qu'application gratuite supérieure par téléchargements dans l'App Apple Store américain depuis le 26 janvier – avec 16 millions de téléchargements d'applications au cours de ses 18 premiers jours (Chatgpt avait 9 millions dans le même délai) – la fonction de recherche de performances et d'accompagnement de Deepseek est au moins à la hauteur avec le chatpt d'Openai pour une fraction du coût.

Son lancement a conduit la société de technologie d'IA basée aux États-Unis, NVIDIA, à la plus grande baisse de la valeur marchande pour une entreprise américaine dans l'historique boursier américain. C'est toute une entrée!

Les analystes et les investisseurs technologiques américains semblent tous craindre que les États-Unis prennent du retard dans la race mondiale générative de l'IA.

Cela peut être justifié compte tenu de la rapidité avec laquelle Deepseek est en mesure de développer R1 et de sortir.

Deepseek utilise l'apprentissage du renforcement, ce qui signifie que le modèle apprend des comportements de raisonnement complexes par le renforcement sans réglage fin supervisé, ce qui lui permet d'économiser des ressources de calcul importantes.

Mais, Deepseek va-t-il vraiment émerger en tant que leader en IA? Et quelles sont les implications pour cette évolution pour l'avenir de la recherche? Plongeons-nous.

Que s'est-il passé depuis le lancement Deepseek?

Alors que les entreprises technologiques américaines ont été humiliées par la vitesse et ont revendiqué la rentabilité de ce lancement, l'arrivée de Deepseek n'a pas été sans controverse.

De nombreuses questions se cachent, allant des violations suspectées de la propriété intellectuelle à la sécurité, de la confidentialité des données, de la censure chinoise et du véritable coût de sa technologie.

Problèmes juridiques pour le droit d'auteur et la protection des données

Openai et Microsoft examinent si Deepseek a utilisé l'API d'Openai pour intégrer leurs modèles d'IA dans les propres modèles de Deepseek.

OpenAI affirme qu'il a des signes de profondeur de distillation des résultats d'Openai pour construire un modèle rival, qui est contre les conditions d'utilisation d'Openai, mais probablement pas contre la loi.

La distillation permet le transfert de connaissances d'un grand modèle pré-formé en un modèle plus petit, ce qui permet au modèle plus petit d'atteindre des performances comparables à la grande tout en réduisant les coûts.

C'est plus qu'un peu ironique étant donné les poursuites contre OpenAI pour ignorer les conditions d'utilisation des autres sites et utiliser leurs données Internet protégées par le droit d'auteur pour former ses systèmes.

Il y a également des questions sur l'endroit où les données utilisateur sont stockées et comment elles sont traitées, étant donné que Deepseek est une startup chinoise.

Pour quiconque gère les informations des clients et les détails de paiement, l'intégration d'un outil comme Deepseek qui stocke les données dans une juridiction étrangère pourrait violer les lois sur la protection des données et exposer des informations sensibles à un accès non autorisé.

Étant donné que Deepseek n'a pas encore fourni ses politiques de confidentialité, les experts de l'industrie et les chercheurs en sécurité conseillent d'utiliser une extrême prudence avec des informations sensibles dans Deepseek.

Broissance de sécurité en profondeur

Wiz Research, une entreprise spécialisée dans la sécurité du cloud, a annoncé qu'elle avait pu pirater Deepseek et exposer les risques de sécurité avec une relative facilité le 29 janvier.

Il a trouvé une base de données accessible au public appartenant à Deepseek, ce qui lui a permis un contrôle complet sur les opérations de base de données et l'accès aux données utilisateur et aux clés API.

Wiz a alerté l'équipe Deepseek et ils ont pris des mesures immédiates pour sécuriser les données. Cependant, on ne sait pas à qui d'autre a accédé ou téléchargé les données avant d'être sécurisée.

Bien qu'il ne soit pas rare que les startups se déplacent rapidement et fassent des erreurs, c'est une erreur particulièrement importante et montre jusqu'à présent le manque de focus de Deepseek sur la cybersécurité.

Concernant la sécurité nationale similaire à Tiktok

Il y a des problèmes de sécurité nationale concernant les politiques de collecte de données de Deepseek qui rappellent les craintes de Tiktok, qui a vu une augmentation similaire de la proéminence mondiale de la société chinoise Bytedance.

Le gouvernement américain a brièvement interdit Tiktok en janvier 2025, qui est venu de préoccupations sur la façon dont l'entreprise collectait des données sur les utilisateurs. Il y avait aussi des craintes que le gouvernement chinois puisse utiliser la plate-forme pour influencer le public aux États-Unis

Quelques incidents au cours des dernières années qui ont initié cette peur, notamment les employés de Tiktok en utilisant les données de localisation de l'application pour suivre les journalistes pour trouver une source d'informations divulguées, et les employés de Tiktok qui ont prévu de suivre des citoyens américains spécifiques.

Alors que Tiktok est actif aux États-Unis en ce moment, son avenir n'est pas confirmé.

Pour des raisons similaires aux préoccupations de Tiktok, un certain nombre de gouvernements du monde, notamment l'Australie et l'Italie, travaillent déjà à interdire profondément les systèmes et les appareils gouvernementaux. Les États-Unis envisagent également une interdiction de Deepseek.

Censure chinoise

Que vous exécutiez Deepseek localement ou dans son application, la censure de Deepseek est présente pour les requêtes jugées sensibles par le gouvernement chinois, selon une enquête filaire.

Cependant, parce que c'est l'open source, il existe des moyens de contourner la censure, mais c'est difficile.

Cela nécessiterait de fonctionner sur vos propres serveurs en utilisant des versions modifiées du code Deepseek accessible au public, ce qui signifie que vous auriez besoin d'accéder à plusieurs GPU très avancés pour exécuter la version la plus puissante de R1.

Questions sur le coût

Beaucoup a été écrit sur le coût de la construction Deepseek. Les premières réclamations de Deepseek étaient qu'il a fallu moins de 6 millions de dollars pour construire en fonction du prix de location des GPU de NVIDIA.

Cependant, un rapport de Semianalysis, une société de recherche et de conseil en semi-conducteurs, a depuis soutenu que les dépenses matérielles de Deepseek étaient supérieures à 500 millions de dollars, ainsi que des coûts de R&D supplémentaires.

Pour le contexte, Openai a perdu environ 5 milliards de dollars en 2024 et prévoit qu'elle perdra plus de 11 milliards de dollars en 2025. Même si Deepseek a coûté 500 millions de dollars ou plus, cela a toujours réduit les coûts par rapport à ce que les principaux concurrents dépensent.

Alors, comment ont-ils réduit les coûts?

Avant que Deepseek n'arrive, les principales technologies de l'IA ont été construites sur des réseaux de neurones, qui sont des systèmes mathématiques qui acquièrent des compétences en analysant d'énormes quantités de données. Cela nécessite de grandes quantités de puissance de calcul.

Les puces informatiques spécialisées appelées unités de traitement graphique (GPU) sont un moyen efficace de faire ce type d'analyse des données. C'est ainsi que le fabricant de puces Nvidia a pris de l'importance (et a également eu une énorme baisse de la valeur marchande de la journée, Deepseek a été lancé).

Les GPU coûtent environ 40 000 $ et nécessitent une électricité considérable, c'est pourquoi les principales technologies d'IA comme le chatppt d'Openai étaient si coûteuses à construire.

L'envoi de données entre les puces peut également nécessiter plus d'énergie que d'exécuter les puces elles-mêmes.

Deepseek a pu réduire les coûts, notamment en utilisant une méthode appelée «mélange d'experts».

Au lieu de créer un réseau neuronal qui a appris les modèles de données sur Internet, ils divisent le système en de nombreux réseaux de neurones et lancé de petits systèmes «experts» associés à un système «généraliste», réduisant la quantité de données nécessaires pour voyager entre les puces GPU.

Les implications d'être open source

Deepseek-R1 est aussi «open-source» que n'importe quel LLM a été jusqu'à présent, ce qui signifie que n'importe qui peut télécharger, utiliser ou modifier son code.

Semblable à Meta's Llama, le code et les explications techniques sont partagés, permettant aux développeurs et aux organisations d'utiliser le modèle pour leurs propres besoins commerciaux, mais les données de formation ne sont pas entièrement divulguées.

Beaucoup croient que Deepseek est un grand pas vers la démocratisation de l'IA, permettant aux petites entreprises et aux développeurs de s'appuyer sur Deepseek-R1 et d'atteindre de plus grands exploits d'IA plus rapidement.

Cela pourrait conduire à plus d'innovation dans des endroits avec un accès plus limité à la technologie nécessaire pour construire des solutions d'IA.

Mais, les critiques craignent que les modèles open-source puissent exposer des vulnérabilités de sécurité qui pourraient être exploitées, ce que nous avons déjà vu lors des premières semaines de Deepseek en public.

Deepseek et l'avenir du référencement

Alors, qu'est-ce que tout cela signifie vraiment pour les professionnels de la recherche? La façon dont je le vois, Deepseek n'est que le prochain chatbot Splashy AI avec des capacités de recherche dans le monde en évolution rapide du référencement.

Il est important de comprendre que si des outils comme Deepseek et Chatgpt utilisent le traitement avancé du langage naturel (NLP) et l'apprentissage automatique, ils fournissent toujours des réponses à de vraies questions que posent de vraies personnes.

Leurs réponses se concentrent fortement sur la compréhension sémantique, la correspondance des informations et l'analyse contextuelle, mais ils répondent finalement au même besoin de base de l'utilisateur.

Bien que nous ayons des années d'expérience dans des tests de tactiques d'optimisation sur des moteurs de recherche plus établis comme Google, nous sommes toujours aux premiers stades de la compréhension de l'optimisation des chatbots d'IA génératifs.

Réflexions finales

Il reste à voir si Deepseek collera et se développera en importance.

De toute évidence, si d'autres gouvernements suivent l'Australie, l'Italie et potentiellement les États-Unis d'interdire Deepseek, cela limiterait son potentiel de croissance.

Et tout comme Deepseek a augmenté rapidement en fournissant un plan pour les autres et en réduisant considérablement les coûts, une nouvelle IA qui évolue le marché pourrait toujours être à nos portes.

Indépendamment de ce qui se passe avec Deepseek, nous sommes au début d'une période d'innovation très rapide dans la technologie de l'IA.

En tant que professionnels du référencement, nous devons être prêts à tester une surtension de nouvelles plates-formes et de rétro-ingénieurs comment ils arrivent à leurs réponses aux requêtes utilisateur.

Plus de ressources: