由中国新创 DeepSeek 发表的 AI 模型近期爆火,今日登顶美中的苹果 iOS 应用商店免费榜冠军,透过仅花不到 600 万美元的成本打造出能与 ChatGPT 和 Meta Llana 相抗衡的模型,该公司已引起了 Meta 创办人祖克柏的忌惮。 (前情提要:ChatGPT o3-mini 即将发布!OpenAI 产品长加码:Q1 上线 AI Agents 工具 ) (背景补充:OpenAI 发表满血版 o1 模型和新订阅方案 ChatGPT Pro,月费 200 美元值得吗? ) 去年圣诞节隔日,中国一家总部位于杭州的人工智慧实验室深度求索(DeepSeek)推出了一个免费开源大型语言模型 DeepSeek-V3,向全球科技圈抛下震撼弹,一夜爆红,并成为近期市场焦点。 究竟为何 DeepSeek 引起了矽谷 AI 巨头微软、Meta 等公司的忌惮?简单来说,是因为其据称仅花费不到 600 万美元、使用的是 Nvidia 性能较低的 H800 晶片,且仅仅耗时 2 个月就成功打造出性能媲美甚至超越美国市面上最强大模型的 DeepSeek-V3。 DeepSeek 仅花 560 万美元打造超越 ChatGPT、Llama 模型 据 CNBC 报导,在一组第三方基准测试中,DeepSeek 的模型准确度表现,从复杂问题的解决,到数学和编写程式码等方面,皆优于 OpenAI 的 GPT-4o、Meta 的 Llama 3.1 和 Anthropic 的 Claude Sonnet 3.5。 不到 1 个月,1 月 20 日,DeepSeek 最新推出的「DeepSeek-R1」推理模型在许多第三方测试中也优于 OpenAI 最新的 o1 模型。 知名 AI 系统排名网站 Chatbot Arena 显示,「DeepSeek-R1」在整体榜单上排名第三,并与 OpenAI 推出的顶尖推理模型 o1 并列在风格控制类型(StyleCtrl)模型的第一;DeepSeek-V3 则在总榜中排名第八,在开源模型中居冠,还是前十名中性价比最高的模型。 DeepSeek-V3 仅花费不到 560 万美元成本建置 ,相较于 OpenAI 、Google、微软等公司每年动辄数十亿甚至数百亿美元的训练成本,可说是说是在成本效益方面做到了飞跃性的突破,引爆了矽谷 AI 公司恐慌。 美股科技股受挫,辉达周五跌超 3% DeepSeek 同时也敲响了人们的警钟:即美国在 AI 领域的全球领先地位是否正在被中国急起直追,并让人们对大型科技公司在建立 AI 模型和资料中心方面的数千亿美元巨额支出提出质疑。 市场上甚至有人将辉达上周五股价大跌 3.12% 的原因归因于 DeepSeek 的爆红,认为 DeepSeek 对美股可能是最大威胁。彭博今日报导,由于 DeepSeek 引发了人们对美国科技主导地位的质疑。美国股指期货周一亚洲早盘重挫。 延伸阅读:OpenAI、软银、甲骨文启动史上最大 AI 基建计划「Stargate Project」:投资 5000 亿美元在美设资料中心 DeepSeek引发Meta内部恐慌,祖克柏警告:中美 AI 差距非常小 《Information》爆料,DeepSeek 的飞速进展已让 Meta 的 AI 团队陷入恐慌模式,担忧 Meta 旗舰 Llama 模型下一版本可能无法与 DeepSeek 相抗衡,落后于 AI 竞赛中,甚至传出 Meta 已经成立 4 个战情室研究 DeepSeek 的运作方式。OpenAI 等其他顶级 AI 公司的研究人员也正在全力分析 DeepSeek 模型,希望在成本效率方面寻获可借鉴之处。 Meta 执行长祖克柏也在近期公开点名 DeepSeek 是非常先进的模型,「AI 竞赛是一场全球地缘政治的战争,现在中美差距非常小」,并呼吁美国政府别拖后腿,给予美国公司更多支持,别把现在的领先地位当成理所当然的事。 微软执行长纳德拉 (Satya Nadella) 也对 DeepSeek 新模型表示印象深刻,称赞他们真正有效地完成一个开源模型,进行推理时间计算,并且具有超级计算效率,「我们应该非常非常认真地对待中国的事态发展。」 Midjourney 创办人赞 DeepSeek 中英文能力都很强 AI 绘图工具 Midjourney 创办人最近在经实测后也大赞 DeepSeek 的中、英文能力出色,他昨日发推指出: deepseek 在中国古代哲学和文学方面碾压了西方模型,同时对英语的掌握也比我的第一手中文资料强得多。感觉就像跨世代交流我以前从未接触过的文学/历史/哲学知识,这是相当令人感动的,也是有道理的。 西方实验室不关心中国数据的培训(但中国实验室对两者都进行培训)。请记住,中国比西方有几千年的文学史(因为我们失去了大部分罗马/希腊/埃及文学,而中国保留了他们的文学)。 基本上,我们的模型缺乏西方思想的文学基础,但中国的模型却完好无损。这既可能「资料优势」,也可能是精神和哲学自我实现上不太明显的优势。 登顶美中苹果 iOS 免费榜 值得注意的是,DeepSeek 也正迅速吸引大量用户,其应用程式以登顶苹果美国和中国区的应用商店免费下载排行榜,在美区超越了 ChatGPT,这可谓是一大创举,成为继 Tiktok 后另一个在美国爆火的中国现象级应用。 DEEPSEEK OVERTAKES CHATGPT IN APP STORE RANKINGS IN THE U.S. Chinese AI platform DeepSeek has reportedly surpassed OpenAI’s ChatGPT on Apple’s App Store rankings just a week after launch. Developed by Hangzhou-based DeepSeek, the platform offers advanced reasoni...
祖克柏警告:Deepseek等中国AI模型太强,美国企业与政府应全力围堵
由中国新创 DeepSeek 发表的 AI 模型近期爆火,今日登顶美中的苹果 iOS 应用商店免费榜冠军,透过仅花不到 600 万美元的成本打造出能与 ChatGPT 和 Meta Llana 相抗衡的模型,该公司已引起了 Meta 创办人祖克柏的忌惮。 (前情提要:ChatGPT o3-mini 即将发布!OpenAI 产品长加码:Q1 上线 AI Agents 工具 ) (背景补充:OpenAI 发表满血版 o1 模型和新订阅方案 ChatGPT Pro,月费 200 美元值得吗? ) 去年圣诞节隔日,中国一家总部位于杭州的人工智慧实验室深度求索(DeepSeek)推出了一个免费开源大型语言模型 DeepSeek-V3,向全球科技圈抛下震撼弹,一夜爆红,并成为近期市场焦点。 究竟为何 DeepSeek 引起了矽谷 AI 巨头微软、Meta 等公司的忌惮?简单来说,是因为其据称仅花费不到 600 万美元、使用的是 Nvidia 性能较低的 H800 晶片,且仅仅耗时 2 个月就成功打造出性能媲美甚至超越美国市面上最强大模型的 DeepSeek-V3。 DeepSeek 仅花 560 万美元打造超越 ChatGPT、Llama 模型 据 CNBC 报导,在一组第三方基准测试中,DeepSeek 的模型准确度表现,从复杂问题的解决,到数学和编写程式码等方面,皆优于 OpenAI 的 GPT-4o、Meta 的 Llama 3.1 和 Anthropic 的 Claude Sonnet 3.5。 不到 1 个月,1 月 20 日,DeepSeek 最新推出的「DeepSeek-R1」推理模型在许多第三方测试中也优于 OpenAI 最新的 o1 模型。 知名 AI 系统排名网站 Chatbot Arena 显示,「DeepSeek-R1」在整体榜单上排名第三,并与 OpenAI 推出的顶尖推理模型 o1 并列在风格控制类型(StyleCtrl)模型的第一;DeepSeek-V3 则在总榜中排名第八,在开源模型中居冠,还是前十名中性价比最高的模型。 DeepSeek-V3 仅花费不到 560 万美元成本建置 ,相较于 OpenAI 、Google、微软等公司每年动辄数十亿甚至数百亿美元的训练成本,可说是说是在成本效益方面做到了飞跃性的突破,引爆了矽谷 AI 公司恐慌。 美股科技股受挫,辉达周五跌超 3% DeepSeek 同时也敲响了人们的警钟:即美国在 AI 领域的全球领先地位是否正在被中国急起直追,并让人们对大型科技公司在建立 AI 模型和资料中心方面的数千亿美元巨额支出提出质疑。 市场上甚至有人将辉达上周五股价大跌 3.12% 的原因归因于 DeepSeek 的爆红,认为 DeepSeek 对美股可能是最大威胁。彭博今日报导,由于 DeepSeek 引发了人们对美国科技主导地位的质疑。美国股指期货周一亚洲早盘重挫。 延伸阅读:OpenAI、软银、甲骨文启动史上最大 AI 基建计划「Stargate Project」:投资 5000 亿美元在美设资料中心 DeepSeek引发Meta内部恐慌,祖克柏警告:中美 AI 差距非常小 《Information》爆料,DeepSeek 的飞速进展已让 Meta 的 AI 团队陷入恐慌模式,担忧 Meta 旗舰 Llama 模型下一版本可能无法与 DeepSeek 相抗衡,落后于 AI 竞赛中,甚至传出 Meta 已经成立 4 个战情室研究 DeepSeek 的运作方式。OpenAI 等其他顶级 AI 公司的研究人员也正在全力分析 DeepSeek 模型,希望在成本效率方面寻获可借鉴之处。 Meta 执行长祖克柏也在近期公开点名 DeepSeek 是非常先进的模型,「AI 竞赛是一场全球地缘政治的战争,现在中美差距非常小」,并呼吁美国政府别拖后腿,给予美国公司更多支持,别把现在的领先地位当成理所当然的事。 微软执行长纳德拉 (Satya Nadella) 也对 DeepSeek 新模型表示印象深刻,称赞他们真正有效地完成一个开源模型,进行推理时间计算,并且具有超级计算效率,「我们应该非常非常认真地对待中国的事态发展。」 Midjourney 创办人赞 DeepSeek 中英文能力都很强 AI 绘图工具 Midjourney 创办人最近在经实测后也大赞 DeepSeek 的中、英文能力出色,他昨日发推指出: deepseek 在中国古代哲学和文学方面碾压了西方模型,同时对英语的掌握也比我的第一手中文资料强得多。感觉就像跨世代交流我以前从未接触过的文学/历史/哲学知识,这是相当令人感动的,也是有道理的。 西方实验室不关心中国数据的培训(但中国实验室对两者都进行培训)。请记住,中国比西方有几千年的文学史(因为我们失去了大部分罗马/希腊/埃及文学,而中国保留了他们的文学)。 基本上,我们的模型缺乏西方思想的文学基础,但中国的模型却完好无损。这既可能「资料优势」,也可能是精神和哲学自我实现上不太明显的优势。 登顶美中苹果 iOS 免费榜 值得注意的是,DeepSeek 也正迅速吸引大量用户,其应用程式以登顶苹果美国和中国区的应用商店免费下载排行榜,在美区超越了 ChatGPT,这可谓是一大创举,成为继 Tiktok 后另一个在美国爆火的中国现象级应用。 DEEPSEEK OVERTAKES CHATGPT IN APP STORE RANKINGS IN THE U.S. Chinese AI platform DeepSeek has reportedly surpassed OpenAI’s ChatGPT on Apple’s App Store rankings just a week after launch. Developed by Hangzhou-based DeepSeek, the platform offers advanced reasoni...