Zuckerberg uyarısı: Deepseek ve diğer Çin yapay zeka modelleri çok güçlü, ABD şirketleri ve hükümeti tamamen engellemeli

Çinli yapay zeka şirketi DeepSeek'in son zamanlarda piyasada patlama yaptığı bir AI modeli, bugün Apple'ın ABD ve Çin uygulama mağazalarında ücretsiz listesinde birinci sıraya yükseldi. Sadece 6 milyon doların altında bir maliyetle ChatGPT ve Meta Llana ile rekabet edebilecek bir model geliştirdiği iddia edilen şirket, Meta'nın kurucusu Zuckerberg'in endişesini uyandırdı. (Özet: ChatGPT o3-mini yakında yayınlanacak! OpenAI ürün yöneticisi güçlendiriyor: Q1'de AI Agents araçlarını kullanıma sunuyor.) (Arka plan: OpenAI tam sürüm o1 modeli ve yeni abonelik planı ChatGPT Pro'yu duyurdu, aylık 200 dolarlık bir değer mi?) Geçen yılın Noel gününden sonraki gün, Hangzhou merkezli bir yapay zeka laboratuvarı Derinlik'in ücretsiz bir Açık Kaynak büyük dil modeli olan DeepSeek-V3'ü piyasaya sürdü ve küresel teknoloji çevresinde büyük bir etki yarattı, gece boyunca popülerlik kazandı ve son zamanların odak noktası haline geldi. Peki DeepSeek neden Microsoft ve Meta gibi Silikon Vadisi'nin yapay zeka devlerinin korkusunu uyandırdı? Basitçe söylemek gerekirse, iddiaya göre sadece 6 milyon doların altında bir maliyetle, performansı Nvidia'nın daha düşük güçlü H800 yongasını kullanan ve sadece 2 ayda Amerika'daki en güçlü modellere eşit veya üstün performans sergileyen DeepSeek-V3'ü başarıyla oluşturdu. DeepSeek, 560 milyon doların altında bir maliyetle ChatGPT ve Llama modellerini geride bıraktı CNBC'nin raporuna göre, bir dizi üçüncü taraf Benchmark testinde, DeepSeek'in model doğruluğu performansı, karmaşık sorunların çözümünden matematik ve kod yazmaya kadar birçok alanda, OpenAI'nin GPT-4o'sundan, Meta'nın Llama 3.1'inden ve Anthropic'in Claude Sonnet 3.5'inden daha iyi. 1 aydan kısa bir sürede, 20 Ocak'ta, DeepSeek'in en son çıkardığı 'DeepSeek-R1' akıl yürütme modeli, OpenAI'nin en son o1 modelinden bile daha iyi performans sergilediği birçok üçüncü taraf testinde. Ünlü yapay zeka sıralama sitesi Chatbot Arena'ya göre, 'DeepSeek-R1' genel sıralamada üçüncü, OpenAI'nin önde gelen akıl yürütme modeli o1 ile stil kontrolü türündeki modeller arasında birinci sırada; DeepSeek-V3 ise genel sıralamada sekizinci, Açık Kaynak modelleri arasında birinci ve ilk on içinde en iyi fiyat performans oranına sahip model. DeepSeek-V3, 560 milyon doların altında bir maliyetle inşa edildi, OpenAI, Google, Microsoft gibi şirketlerin yıllık milyarlarca dolarlık eğitim maliyetleriyle karşılaştırıldığında, maliyet etkinliği konusunda çığır açtığı söylenebilir ve Silikon Vadisi'ndeki yapay zeka şirketlerinde paniğe yol açtı. Teknoloji hisseleri düştü, Nvidia'nın düşüşü Cuma günü %3'ün üzerine çıktı. DeepSeek aynı zamanda insanların dikkatini çekti: Amerika'nın yapay zeka alanındaki küresel liderliği Çin'in hızla yaklaştığı ve büyük teknoloji şirketlerinin yapay zeka modelleri ve veri merkezleri için yıllarca milyarlarca dolar harcamasını sorgulamaya yöneltti. Piyasada hatta Nvidia'nın Cuma günkü düşüşünün nedeni olarak DeepSeek'in patlaması gösteriliyor, DeepSeek'in ABD hisse senetleri için muhtemelen en büyük tehdit olduğu düşünülüyor. Bloomberg'in bugünkü haberine göre, DeepSeek, insanların Amerika'nın teknoloji liderliği konusundaki şüphelerini artırdı. ABD hisse senedi vadeli işlemleri Pazartesi günü Asya seansında sert düştü. Genişletilmiş Okuma: OpenAI, SoftBank, Oracle tarihindeki en büyük yapay zeka altyapı projesi 'Stargate Project'i başlattı: ABD'de veri merkezleri kurmak için 500 milyar dolarlık yatırım DeepSeek, Meta içinde içsel panik yarattı, Zuckerberg Çin - Amerika yapay zeka farkının çok küçük olduğuna dikkat çekiyor 'Information'ın sızdırdığı bilgilere göre, DeepSeek'in hızlı ilerlemesi Meta'nın yapay zeka ekibini panik moduna soktu, Meta'nın öncü Llama modelinin bir sonraki sürümünün DeepSeek ile rekabet edemeyeceği endişesine düştü, yapay zeka yarışında geride kaldı ve Meta'nın DeepSeek'in işleyişini araştırmak için 4 ayrı savaş odası kurduğu söylentileri dolaşıyor. Diğer önde gelen yapay zeka şirketleri olan OpenAI'nin araştırmacıları da DeepSeek modelini analiz etmek için yoğun çaba harcıyor, maliyet verimliliği konusunda taklit edebilecekleri bir şeyler bulmayı umuyorlar. Meta CEO'su Zuckerberg, son zamanlarda DeepSeek'in çok gelişmiş bir model olduğuna dikkat çekerek, 'Yapay zeka yarışı küresel jeopolitik bir savaş, şu anda Çin ve Amerika arasındaki fark çok az' dedi ve ABD hükümetini geri kalmamaları konusunda uyardı, mevcut liderliği kendiliğinden kabul etmemelerini istedi. Microsoft CEO'su Satya Nadella da DeepSeek'in yeni modeline etkileyici bulduğunu belirtti, Açık Kaynak bir modeli gerçekten etkili bir şekilde gerçekleştirdiklerini, akıl yürütme süresini hesaplama ve süper hesaplama verimliliğine sahip olduklarını söyledi, 'Çin'in gelişmelerini çok ciddiye almamız gerekiyor.' Midjourney'in kurucusu, DeepSeek'in hem Çince hem de İngilizce becerilerinin çok güçlü olduğunu övdü. Midjourney'in kurucusu, DeepSeek'in hem Çin'in antik felsefesi ve edebiyatında hem de İngilizce dilinde çok güçlü olduğunu belirtti, dün yaptığı bir tweet'te, deepseek'in batıdaki modelleri ezdiğini ve aynı zamanda İngilizce'yi çok daha iyi bir şekilde ele aldığını, benim ilk elden Çince veri setimden çok daha iyi olduğunu söylediğini belirtti. Duygusal olarak, bu benim daha önce karşılaşmadığım edebiyat/tarih/felsefe bilgisini aşıladığı için oldukça etkileyici ve mantıklı. Batı laboratuvarları Çin verileriyle ilgilenmiyor (ancak Çin laboratuvarları her ikisini de eğitiyor). Lütfen unutmayın, Çin'in binlerce yıllık edebiyat tarihi var (çünkü çoğu Roma/Yunan/Mısır edebiyatını kaybettik, fakat Çin onların edebiyatını korudu). Temelde, modelimiz batı düşüncesi literatür temeline sahip değil, ancak Çin'in modeli hasar görmemiş durumda. Bu hem 'veri avantajı' olabilir hem de ruhsal ve felsefi özgüven açısından belirgin olmayan bir avantaj olabilir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)