DeepSeek a-t-elle copié OpenAI ? C’est l’idée suggérée, mercredi 29 janvier, par l’entreprise américaine à propos de la start-up chinoise. DeepSeek a ébranlé tout le secteur de l’intelligence artificielle (IA) en proposant des « grands modèles de langage » qui atteignent des performances comparables à ceux de l’agent conversationnel ChatGPT, mais en nécessitant beaucoup moins de calculs informatiques, et donc d’énergie.

« Nous avons connaissance de – et nous examinons – des indications selon lesquelles DeepSeek pourrait avoir distillé de façon inappropriée nos modèles, et nous partagerons des informations quand nous en saurons plus », a déclaré l’entreprise américaine dans un communiqué. La « distillation » consiste à entraîner un modèle grâce aux réponses données par un autre, comme un élève avec un professeur. Elle est couramment utilisée par la plupart des fabricants, pour créer des versions plus petites – et donc moins coûteuses – d’un gros modèle. Entraîner un modèle avec les réponses de ceux d’OpenAI est toutefois interdit par les conditions d’utilisation de l’entreprise.

« Nous savons que des groupes [en Chine] cherchent activement à utiliser des méthodes, dont la distillation, pour essayer de répliquer les modèles américains avancés, a ajouté OpenAI. Nous prenons des contremesures volontaires et agressives pour protéger notre technologie et allons continuer de travailler étroitement avec le gouvernement pour protéger les modèles les plus puissants qui y sont fabriqués. »

Durcissement de ton

Dans sa déclaration officielle, OpenAI se garde d’accuser directement DeepSeek. Le Financial Times affirme toutefois que l’entreprise de Sam Altman lui a assuré disposer de « preuves » de distillation de la part de l’entreprise chinoise.

Lire le décryptage | Article réservé à nos abonnés La Chine talonne les Américains dans la course à l’intelligence artificielle

Un peu plus tôt, l’agence de presse Bloomberg a rapporté, citant des « sources proches du dossier », que Microsoft, le partenaire d’OpenAI qui héberge ses logiciels, avait repéré à l’automne une activité suspecte sur l’interface par laquelle les entreprises peuvent envoyer des requêtes à ses modèles d’IA. Et qu’un groupe lié à DeepSeek aurait « exfiltré une large quantité de données ».

Il vous reste 44.92% de cet article à lire. La suite est réservée aux abonnés.

Share.
Exit mobile version