Avertissement de Zuckerberg: les modèles d'IA chinois tels que Deepseek sont trop puissants, les entreprises et le gouvernement américains devraient tout faire pour les contenir.
Le modèle d’IA publié par la start-up chinoise DeepSeek a récemment explosé et est aujourd’hui en tête de la liste gratuite de l’App Store iOS d’Apple aux États-Unis, ce qui a rendu jaloux le fondateur de Meta, Zuckerberg, en créant un modèle capable de rivaliser avec ChatGPT et Meta Llana pour moins de 6 millions de dollars. (Synopsis : ChatGPT o3-mini bientôt disponible !) Produit OpenAI long plus : Q1 lance l’outil AI Agents) (supplément de contexte : OpenAI publie une version complète du modèle o1 et une nouvelle solution de souscription ChatGPT Pro, les frais mensuels de 200 $ en valent-ils la peine ?) Le lendemain de Noël de l’année dernière, DeepSeek, un laboratoire d’intelligence artificielle chinois basé à Hangzhou, a lancé DeepSeek-V3, un modèle de langage libre Open Source à grande échelle, qui a choqué le cercle technologique mondial, est devenu un succès du jour au lendemain et est devenu le centre d’intérêt du marché récent. Pourquoi exactement DeepSeek a-t-il suscité la peur parmi les géants de l’IA de la Silicon Valley, Microsoft, Meta et d’autres ? En termes simples, c’est parce qu’il aurait dépensé moins de 6 millions de dollars, en utilisant la puce H800 peu performante de Nvidia, et qu’il n’a fallu que 2 mois pour réussir à créer un DeepSeek-V3 qui égale ou même dépasse le modèle le plus puissant du marché aux États-Unis. DeepSeek ne dépense que 5,6 millions de dollars pour surpasser ChatGPT, modèle Llama Selon CNBC, dans une série de tests de référence tiers, les performances de précision du modèle de DeepSeek sont meilleures que celles de GPT-4o d’OpenAI, de Llama 3.1 de Meta et de Claude Sonnet 3.5 d’Anthropic, selon CNBC. Moins d’un mois plus tard, le 20 janvier, le nouveau modèle d’inférence « DeepSeek-R1 » de DeepSeek a également surpassé le dernier modèle o1 d’OpenAI dans de nombreux tests tiers. Chatbot Arena, un site Web bien connu de classement des systèmes d’IA, montre que « DeepSeek-R1 » se classe troisième sur la liste globale et se classe premier avec le meilleur modèle d’inférence o1 lancé par OpenAI. DeepSeek-V3 se classe huitième au classement général, devançant le modèle Open Source et le modèle le plus rentable parmi les dix premiers. DeepSeek-V3 n’a coûté que moins de 5,6 millions de dollars à construire, par rapport à OpenAI, Google, Microsoft et d’autres entreprises chaque année des milliards, voire des dizaines de milliards de dollars en coûts de formation, on peut dire qu’il a fait un bond en avant en termes de rentabilité, déclenchant une panique parmi les entreprises d’IA de la Silicon Valley. Les valeurs technologiques américaines ont souffert, Huida ayant chuté de plus de 3 % vendredi DeepSeek a également tiré la sonnette d’alarme quant à savoir si le leadership mondial des États-Unis en matière d’IA est rattrapé par la Chine et remet en question les centaines de milliards de dollars que les grandes entreprises technologiques dépensent pour construire des modèles d’IA et des centres de données. Certaines personnes sur le marché ont même attribué la raison de la forte chute de 3,12 % de Huida vendredi à l’explosion de DeepSeek, estimant que DeepSeek pourrait être la plus grande menace pour les actions américaines. Bloomberg a rapporté aujourd’hui que DeepSeek a soulevé des questions sur la domination technologique américaine. Les contrats à terme sur les indices boursiers américains ont fortement chuté dans les premiers échanges asiatiques lundi. Lecture approfondie : OpenAI, SoftBank et Oracle lancent le plus grand plan d’infrastructure d’IA de l’histoire « Projet Stargate » : investir 500 milliards de dollars pour mettre en place un centre de données aux États-Unis DeepSeek a semé la panique au sein de Meta, a averti Zuckerberg : L’écart entre la Chine et les États-Unis en matière d’IA est très faible « Information » a annoncé que les progrès rapides de DeepSeek ont mis l’équipe d’IA de Meta en mode panique et s’inquiétaient du lama phare de Meta La prochaine version du modèle pourrait ne pas être en mesure de rivaliser avec DeepSeek, être à la traîne de la course à l’IA et même rumeur selon laquelle Meta a mis en place 4 chambres de guerre pour étudier le fonctionnement de DeepSeek. Les chercheurs d’autres grandes entreprises d’IA, telles qu’OpenAI, analysent également le modèle DeepSeek dans le but de trouver des informations en termes de rentabilité. Le PDG de Meta, Mark Zuckerberg, a également récemment cité publiquement DeepSeek comme un modèle très avancé, « la course à l’IA est une guerre géopolitique mondiale, et maintenant l’écart entre la Chine et les États-Unis est très faible », et a appelé le gouvernement américain à ne pas se retenir, à soutenir davantage les entreprises américaines et à ne pas prendre la position de leader actuelle pour acquise. Le PDG de Microsoft, Nadella (Satya Nadella), a également été impressionné par le nouveau modèle de DeepSeek, les félicitant d’avoir réalisé de manière très efficace un modèle Open Source, d’avoir effectué des calculs de temps d’inférence et d’avoir une efficacité de supercalcul, « Nous devrions prendre les développements en Chine très, très au sérieux. » Le fondateur de Midjourney a récemment fait l’éloge des excellentes compétences en chinois et en anglais de DeepSeek, et il a tweeté hier : Deepseek a écrasé les modèles occidentaux dans la philosophie et la littérature chinoises anciennes, et sa maîtrise de l’anglais est bien meilleure que mes sources chinoises de première main. J’ai eu l’impression d’un échange intergénérationnel de connaissances littéraires, historiques et philosophiques auquel je n’avais jamais été exposé auparavant, ce qui était assez touchant et justifié. Les laboratoires occidentaux ne se soucient pas de l’entraînement sur les données chinoises (mais les laboratoires chinois forment les deux). Gardez à l’esprit que la Chine a une histoire littéraire de plusieurs milliers d’années de plus que l’Occident (parce que nous avons perdu la plupart de notre littérature romaine/grecque/égyptienne, tandis que la Chine a conservé la sienne). Fondamentalement, notre modèle n’a pas la base littéraire de la pensée occidentale, mais le modèle chinois est intact. Il peut s’agir soit d’un « avantage de données », soit d’un avantage moins évident dans la réalisation de soi spirituelle et philosophique. Il convient de noter que DeepSeek attire également rapidement un grand nombre d’utilisateurs, et son application a dépassé ChatGPT aux États-Unis avec le haut du classement des téléchargements gratuits de l’App Store d’Apple aux États-Unis et en Chine, ce qui est une initiative majeure et est devenu un autre phénomène chinois après Tiktok qui a explosé aux États-Unis. DEEPSEEK DÉPASSE CHATGPT DANS LE CLASSEMENT DE L’APP STORE AUX ÉTATS-UNIS La plateforme d’IA chinoise DeepSeek aurait dépassé ChatGPT d’OpenAI dans le classement de l’App Store d’Apple une semaine seulement après son lancement. Développée par DeepSeek, basée à Hangzhou, la plate-forme offre des raisons avancées...
Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Avertissement de Zuckerberg: les modèles d'IA chinois tels que Deepseek sont trop puissants, les entreprises et le gouvernement américains devraient tout faire pour les contenir.
Le modèle d’IA publié par la start-up chinoise DeepSeek a récemment explosé et est aujourd’hui en tête de la liste gratuite de l’App Store iOS d’Apple aux États-Unis, ce qui a rendu jaloux le fondateur de Meta, Zuckerberg, en créant un modèle capable de rivaliser avec ChatGPT et Meta Llana pour moins de 6 millions de dollars. (Synopsis : ChatGPT o3-mini bientôt disponible !) Produit OpenAI long plus : Q1 lance l’outil AI Agents) (supplément de contexte : OpenAI publie une version complète du modèle o1 et une nouvelle solution de souscription ChatGPT Pro, les frais mensuels de 200 $ en valent-ils la peine ?) Le lendemain de Noël de l’année dernière, DeepSeek, un laboratoire d’intelligence artificielle chinois basé à Hangzhou, a lancé DeepSeek-V3, un modèle de langage libre Open Source à grande échelle, qui a choqué le cercle technologique mondial, est devenu un succès du jour au lendemain et est devenu le centre d’intérêt du marché récent. Pourquoi exactement DeepSeek a-t-il suscité la peur parmi les géants de l’IA de la Silicon Valley, Microsoft, Meta et d’autres ? En termes simples, c’est parce qu’il aurait dépensé moins de 6 millions de dollars, en utilisant la puce H800 peu performante de Nvidia, et qu’il n’a fallu que 2 mois pour réussir à créer un DeepSeek-V3 qui égale ou même dépasse le modèle le plus puissant du marché aux États-Unis. DeepSeek ne dépense que 5,6 millions de dollars pour surpasser ChatGPT, modèle Llama Selon CNBC, dans une série de tests de référence tiers, les performances de précision du modèle de DeepSeek sont meilleures que celles de GPT-4o d’OpenAI, de Llama 3.1 de Meta et de Claude Sonnet 3.5 d’Anthropic, selon CNBC. Moins d’un mois plus tard, le 20 janvier, le nouveau modèle d’inférence « DeepSeek-R1 » de DeepSeek a également surpassé le dernier modèle o1 d’OpenAI dans de nombreux tests tiers. Chatbot Arena, un site Web bien connu de classement des systèmes d’IA, montre que « DeepSeek-R1 » se classe troisième sur la liste globale et se classe premier avec le meilleur modèle d’inférence o1 lancé par OpenAI. DeepSeek-V3 se classe huitième au classement général, devançant le modèle Open Source et le modèle le plus rentable parmi les dix premiers. DeepSeek-V3 n’a coûté que moins de 5,6 millions de dollars à construire, par rapport à OpenAI, Google, Microsoft et d’autres entreprises chaque année des milliards, voire des dizaines de milliards de dollars en coûts de formation, on peut dire qu’il a fait un bond en avant en termes de rentabilité, déclenchant une panique parmi les entreprises d’IA de la Silicon Valley. Les valeurs technologiques américaines ont souffert, Huida ayant chuté de plus de 3 % vendredi DeepSeek a également tiré la sonnette d’alarme quant à savoir si le leadership mondial des États-Unis en matière d’IA est rattrapé par la Chine et remet en question les centaines de milliards de dollars que les grandes entreprises technologiques dépensent pour construire des modèles d’IA et des centres de données. Certaines personnes sur le marché ont même attribué la raison de la forte chute de 3,12 % de Huida vendredi à l’explosion de DeepSeek, estimant que DeepSeek pourrait être la plus grande menace pour les actions américaines. Bloomberg a rapporté aujourd’hui que DeepSeek a soulevé des questions sur la domination technologique américaine. Les contrats à terme sur les indices boursiers américains ont fortement chuté dans les premiers échanges asiatiques lundi. Lecture approfondie : OpenAI, SoftBank et Oracle lancent le plus grand plan d’infrastructure d’IA de l’histoire « Projet Stargate » : investir 500 milliards de dollars pour mettre en place un centre de données aux États-Unis DeepSeek a semé la panique au sein de Meta, a averti Zuckerberg : L’écart entre la Chine et les États-Unis en matière d’IA est très faible « Information » a annoncé que les progrès rapides de DeepSeek ont mis l’équipe d’IA de Meta en mode panique et s’inquiétaient du lama phare de Meta La prochaine version du modèle pourrait ne pas être en mesure de rivaliser avec DeepSeek, être à la traîne de la course à l’IA et même rumeur selon laquelle Meta a mis en place 4 chambres de guerre pour étudier le fonctionnement de DeepSeek. Les chercheurs d’autres grandes entreprises d’IA, telles qu’OpenAI, analysent également le modèle DeepSeek dans le but de trouver des informations en termes de rentabilité. Le PDG de Meta, Mark Zuckerberg, a également récemment cité publiquement DeepSeek comme un modèle très avancé, « la course à l’IA est une guerre géopolitique mondiale, et maintenant l’écart entre la Chine et les États-Unis est très faible », et a appelé le gouvernement américain à ne pas se retenir, à soutenir davantage les entreprises américaines et à ne pas prendre la position de leader actuelle pour acquise. Le PDG de Microsoft, Nadella (Satya Nadella), a également été impressionné par le nouveau modèle de DeepSeek, les félicitant d’avoir réalisé de manière très efficace un modèle Open Source, d’avoir effectué des calculs de temps d’inférence et d’avoir une efficacité de supercalcul, « Nous devrions prendre les développements en Chine très, très au sérieux. » Le fondateur de Midjourney a récemment fait l’éloge des excellentes compétences en chinois et en anglais de DeepSeek, et il a tweeté hier : Deepseek a écrasé les modèles occidentaux dans la philosophie et la littérature chinoises anciennes, et sa maîtrise de l’anglais est bien meilleure que mes sources chinoises de première main. J’ai eu l’impression d’un échange intergénérationnel de connaissances littéraires, historiques et philosophiques auquel je n’avais jamais été exposé auparavant, ce qui était assez touchant et justifié. Les laboratoires occidentaux ne se soucient pas de l’entraînement sur les données chinoises (mais les laboratoires chinois forment les deux). Gardez à l’esprit que la Chine a une histoire littéraire de plusieurs milliers d’années de plus que l’Occident (parce que nous avons perdu la plupart de notre littérature romaine/grecque/égyptienne, tandis que la Chine a conservé la sienne). Fondamentalement, notre modèle n’a pas la base littéraire de la pensée occidentale, mais le modèle chinois est intact. Il peut s’agir soit d’un « avantage de données », soit d’un avantage moins évident dans la réalisation de soi spirituelle et philosophique. Il convient de noter que DeepSeek attire également rapidement un grand nombre d’utilisateurs, et son application a dépassé ChatGPT aux États-Unis avec le haut du classement des téléchargements gratuits de l’App Store d’Apple aux États-Unis et en Chine, ce qui est une initiative majeure et est devenu un autre phénomène chinois après Tiktok qui a explosé aux États-Unis. DEEPSEEK DÉPASSE CHATGPT DANS LE CLASSEMENT DE L’APP STORE AUX ÉTATS-UNIS La plateforme d’IA chinoise DeepSeek aurait dépassé ChatGPT d’OpenAI dans le classement de l’App Store d’Apple une semaine seulement après son lancement. Développée par DeepSeek, basée à Hangzhou, la plate-forme offre des raisons avancées...