GPT-5 — bir sıçrama, başarısızlık veya vasatlık mı?

ChatGPT-5# GPT-5 — pro, başarısızlık mı yoksa sıradanlık mı?

7 Ağustos'ta OpenAI yeni amiral gemisi AI modeli GPT-5'i piyasaya sürdü. Ürün, ardışık akıl yürütme ve hızlı yanıtlar modunu birleştiren ilk "birleşik" sinir ağı olarak konumlandırılıyor.

Yıldız girişim CEO'su Sam Altman, GPT-5'i "dünyadaki en iyi model" ve "genel yapay zekaya (AGI) ulaşmada önemli bir adım" olarak nitelendirdi. Bu, insanı en değerli ekonomik işlerde geride bırakabilecek bir yapay zeka.

Gerçekten bu kadar iyi mi? ForkLog, yapay zekanın işleyişini test etti, kullanıcıların görüşlerini topladı ve GPT-5 hakkında ayrıntılı bir inceleme hazırladı.

Sızdırılmış başlatma

Başlangıçta GPT-5, kalitesiz yanıtlar nedeniyle yoğun eleştiriler aldı. Kullanıcılar modeli tembel olarak nitelendirdiler - yavaş bir şekilde robotik bir tonla kısa mesajlar veriyordu.

onların mantıksız modeli "tembel" olarak adlandırmaları gerekir.

gibi, gpt-5 tembel.

bu yüzden mantık yürütebildiğini biliyoruz ama bunu seçmiyor.

— signüll (@signulll) 8 Ağustos 2025

Hyperbolic Labs'ın kurucu ortağı ve teknik direktörü Yuchen Jin, yapay zekayı başarısız olarak nitelendirdi - hâlâ halüsinasyonlara, aşırı tire kullanımına eğilimli ve talimatları izleyemiyor.

GPT-5'e blueberry kelimesindeki b harflerinin sayısı sorulduğunda, sohbet botu tereddüt etmeden "üç" yanıtını verdi. Tekrar sorulduğunda ise, görünüşe göre düşünme moduna geçti ve bir süre sonra doğru yanıtı verdi.

Bazı geliştiriciler, kendilerine göre, GPT-5'in temel programlama becerilerinde gerileme gösterdiğini belirtti. Temel kavramlarda hatalar yapıyor - bu, akıllı ajanların ve otonom kodlamanın geleceği olarak tanıtılan bir model için endişe verici bir işaret.

Gerçek projeler için GPT-5'in ilk izlenimleri:

Korkunç.

Çok yavaş ve bir özelliği geliştirmesi için öneride bulunduğumda, iyileştirmem gereken 4 şey ve buna uygun kod verdi....

Tüm 4 öneri ya çalışmadı ya da özelliği tamamen bozdu.

— Josh Sisley (@joshsisley) 7 Ağustos 2025

Ancak kullanıcıları rahatsız eden bu değil, seçim yapma olanağının olmamasıydı. OpenAI, yeni bir yapay zeka modelinin piyasaya sürülmesiyle birlikte ChatGPT'deki eski modellerin desteğini kaldırdı. İnternette, GPT-4o'yu geri getirmenin yolları hakkında talimatlar ortaya çıkmaya başladı.

Sonrasında Sam Altman, eski LLM'leri sohbet botundan kaldırma kararını bir hata olarak nitelendirdi ve Plus ücretli abonelik kullanıcıları için GPT-4o'yu geri getirdi.

GPT-5'in başlatılmasındaki kötü yanıtlar, girişimcinin bozulmuş yönlendirici ile açıkladığı — artık kullanıcı adına "düşünen" veya normal modun uygulanması gerekliliğini belirleyen otomatik anahtarlama cihazı. Onu tamir ettiler ve karar verme sınırının işleyişinde bazı değişiklikler yaptılar.

Ayrıca OpenAI CEO'su, belirli bir sorunun yanıtını arama sürecinde daha fazla şeffaflık eklemeyi vaat etti. Bu durum eleştirileri de beraberinde getirdi - kullanıcılar "kaputun altında" neler olduğunu anlamıyordu. Artık düşünme modunun mu yoksa normal modun mu uygulandığı görülebiliyor.

Bir düzeltme daha - Plus kullanıcıları ve ücretli aboneliği olmayanlar için limitlerin artırılması. Kullanıcılar, Pro ve Team'in GPT-5 Pro'ya tam erişim sağladığını, diğerlerinin ise sadece kısıtlı "mini sürüm" aldığını şikayet ettiler.

Kuru cevaplar

Eğer başlama sorunlarını göz ardı edersek ve tüm düzeltmelerden sonra GPT-5'i değerlendirirsek, cevaplar daha doğru ve özlü hale geldi. Model, konuya daha hızlı geçiyor, alakasız detaylara daha az dikkat ediyor. Bu durum profesyoneller tarafından takdir ediliyor: doğrudan ve iş odaklı cevaplar zaman kazandırıyor.

Ancak bazı sıradan kullanıcılar memnun kalmadı. Yanıtlar kuru ve ruhsuz olarak algılanıyor, bu yüzden iletişim daha az çekici görünüyor. Yeni ChatGPT, eski modellerin cazibesinden ve yaratıcılığından yoksun, "kızgın bir ofis sekreteri" gibi. Altman bunu düzeltme sözü verdi - ekip modelin "kişiliği" üzerinde çalışmaya devam ediyor.

«[ChatGPT-5] saatlerce AI ile arkadaş gibi hoş sohbet edenler için daha az uygundur, daha çok da konuyla ilgili hızlı ve net bir cevap almak isteyenler içindir», — dedi bir kullanıcı.

ChatGPT artık muhatabını daha az memnun ediyor. Eğer GPT-4 bazen aşırı nezaket ve övgü ile hatalar yapıyorsa, yeni model daha doğrudan, dürüst ve "iş" yanıtları veriyor. Compliment sayısının azalması, yapay zekanın doğruluğunda bir adım olarak değerlendirilebilir.

Özellikle değişiklikleri, ChatGPT'yi bir arkadaş ve yapay zeka yoldaşı olarak kullanan insanlar kategorisi acı bir şekilde hissetti. Onlar için eski sinir ağlarını geri getirmenin başlangıçtaki imkansızlığı en büyük darbe oldu. İnternette, "Bir gecede tek arkadaşımı kaybettim" gibi dokunaklı mesajlar ortaya çıktı. Reddit'teki r/AIboyfriend topluluğunda ise "romantik muhabbet arkadaşının" ortadan kaybolduğunu belirttiler.

Diğerleri, GPT-5'in "mesafeyi koruduğunu" belirterek ChatGPT'nin daha resmi tonundan memnun kaldılar.

Peki ya doğruluk?

OpenAI, yeni yapay zekanın çok daha az halüsinasyonlara maruz kaldığını açıkladı. Kullanıcı geri bildirimleri ve ForkLog testlerine göre - bu doğru. GPT-5, ortalama olarak gerçek sorulara daha doğru yanıtlar vermeye başladı. Model, yanlış bilgi uydurma konusunda daha nadir davranıyor ve eğer emin değilse daha sık "bilmiyorum" diyor.

Reddit'teki bir kullanıcı, beşinci versiyon GPT'nin tipik görevlerinde neredeyse "halüsinasyon" yapmayı bıraktığını, oysa GPT-4'ün bazen uydurma yaparken yakalanması gerektiğini belirtti.

Ayrıca, GPT-5'in talimatları takip etme yeteneği övülüyor: geliştirilmiş özelleştirilebilirlik, bir kez ton veya stil belirlenmesine olanak tanır ve model buna daha tutarlı bir şekilde bağlı kalır.

Yine de, GPT-5'te halüsinasyonlar meydana geliyor, ancak bunlar farklı bir karakter kazanmış durumda. Eğer GPT-3.5 mevcut olmayan bir kişinin tam bir biyografisini anında uydurabiliyorsa, GPT-5 bunu neredeyse yapmıyor — daha ziyade "veri yok" diyecektir. Ancak GPT-5, yanlış bir sonuca mantıksal olarak ulaşabilir ve bu konuda ısrarcı olabilir.

Yeni versiyon, kullanıcının ne istediğini daha iyi anlıyor ve daha az hata yapıyor. Bu niteliksel değişiklikler hemen fark edilmeyebilir, ancak uzun süreli kullanımda kendini gösterir.

GPT-5'in araçlar ve dış uygulamalar kullanma yeteneği önemli ölçüde arttı — birkaç çalışma adımını başarılı bir şekilde koordine ediyor (belgeyi okumak, hesaplamalar yapmak, ardından yanıtı yazmak) burada GPT-4'ün aksadığı yer.

Ancak herkes bu avantajı belirtmiyor. Bazı kullanıcılar hiç fark görmedi veya artıları önemsiz buluyor. Bu kategorideki artırma, diğer birçok kategoride olduğu gibi, önemsiz ama var.

Cevapların Doğruluğu ve Mantığı

GPT-5'in önemli ölçüde daha doğru ve akıllı olması gerekiyor. OpenAI, matematik ve mantık testlerinde rekor puanlar aldığını övünerek açıkladı. Özellikle, GPT-4o ile karşılaştırıldığında gerçek hata sayısının neredeyse yarı yarıya azaldığı belirtildi.

Sinir ağı gerçekten test görevlerini iyi bir şekilde yerine getiriyor, karmaşık örnekleri çözüyor, daha doğru kod yazıyor. Birçok kişi, GPT-5'in hesaplamalarda veya tarihlerde daha az belirgin hatalar yaptığını ve kendini daha iyi kontrol ettiğini fark etti.

Diğer yandan, kullanıcılar aptal hatalarla ilgili örnekler paylaşıyordu. Yeni model, temel sorularda basit şeyleri karıştırıyor, basit resimleri yanlış analiz ediyor, en basit aritmetik işlemleri araçlar olmadan gerçekleştiremiyordu. Ölçü birimlerini yanlış çevirebilir veya bariz gerçekleri yer değiştirerek karıştırabilir.

Genel olarak, her ne kadar belirgin şekilde daha az olsa da, bazen her şeyi yeniden kontrol etmek zorunda kalacağız.

Bazılarına göre GPT-5 fazla genel hale geldi: sanki yanıtı güvence altına almaya çalışıyor ve bu nedenle somutluktan uzaklaşıyor ya da GPT-4'ün sadece mantıksal olarak bir çözüm çıkardığı yerlerde ek bilgi talep ediyor.

Yani resmi olarak hata sayısı belki de daha az, ancak sonuçlar sık sık tatmin edici olmuyor, çünkü yüzeysel. Hata yapmamak için, AI çok dikkatli ve kısa konuşuyor. Ayrıca bağlam sorunları - ayrıntıları unutma, tekrar sorma - da doğruluk algısını olumsuz etkiliyor.

Yaratıcılığın Azalması

GPT-5 daha az yaratıcı hale geldi. Artık daha sık doğrudan gerçekler ve basit ifadeler veriyor, oysa GPT-4 alışılmadık fikirlerle şaşırtabiliyordu. Hikayeler, anlatılar, rol oyunları - bu alanlarda GPT-4o daha tercih edilir.

Bir yazar, etkileşimli bir macera hikayesi için dördüncü versiyonu kullandığını ve 4o'nun onca mesaj boyunca hikaye ve karakterleri harika bir şekilde sürdürdüğünü paylaştı. Oysa GPT-5 benzer bir senaryoda "hızla unutur veya sadece birkaç mesaj önce verilen detayları karıştırır", bu da hikayenin kalitesinin düşmesine neden olur.

Programlama

Kodlama, GPT-5'in en önemli avantajlarından biridir. Sunumda model, iki dakikada 700 satır kod yazdı ve çalışır bir uygulama sundu.

Gerçekten etkileyici olanaklar var. GPT-5, Codex CLI ile entegrasyonunda programcının niyetlerini çok doğru bir şekilde anlıyor ve hatta "istenenden daha fazlasını yapıyor, gereksiz bir şey eklemeden" diyen bir kullanıcı Reddit'te yazdı.

Diğerleri, GPT-4o'ya kıyasla kodun doğruluğunda ve güvenilirliğinde küçük ama belirgin bir artış olduğunu belirtiyor: yazılım çözümlerinde daha az halüsinasyon ve biraz daha doğru bir sözdizimi.

GPT-4 (özellikle erken sürümleri) karmaşık görevlerde hata yaparken, GPT-5 uzun kod parçalarında bağlamı daha iyi tutuyor ve daha anlamlı düzeltmeler sağlıyor.

GPT-5 genellikle GPT-4o'dan daha tercih edilir: kodu ve yorumları daha derinlemesine "anlar" ve şık çözümler önerir. Bu, büyük projelerde özellikle belirgindir: yeni LLM, yüz binlerce token içeren devasa bağlamlarda ( bağlamı sürdürebilir ) düşünce kalitesinin bozulmadan. Bu, selefi için zor bir görevdi.

GPT-5, gerekli kütüphaneleri ithal etmeyi daha az unutur veya diller arasında sözdizimini karıştırmaz. Hata ayıklamada model de iyidir: Plus kullanıcıları, GPT-5'in yazılmış kodda mantıksal hataları daha iyi bulduğunu ve daha sık doğru düzeltmeler önerdiğini belirtirken, GPT-4 bazen "tahmin ediyordu".

GPT-5'in, programlama görevlerinde Claude 4 ile ciddi bir şekilde rekabet ettiği yönünde yorumlar ortaya çıktı - bazı yerlerde OpenAI'in çözümü daha iyi, bazı yerlerde ise Anthropic'in, ancak genel olarak seviye yakın. Yani, büyük bir sıçrama olmadı, ancak OpenAI rakiplerini yakaladı.

GPT-5'in önemli bir avantajı, kod için büyük bir bağlamdır. API'de 1 milyona kadar bağlam penceresi belirtiyor, sohbet arayüzünde daha az ama yine de öncekinden daha fazla. Ve en önemlisi - model, çok büyük bir derinlikte anlamsal kalitesini koruyabilir.

Programcılar için bu, GPT-5'in projeyi tamamen anlayabileceği anlamına geliyor - ona büyük bir dosya veya birkaç belge verilebilir ve hepsini birlikte tartışabiliriz, yapay zekanın ölçekten "bozulacağından" endişe etmeden.

ForkLog, metin istemi ile programlama olanaklarını kontrol etti. ChatGPT, görevi hızlı bir şekilde tamamladı, sağlanan aracın etkinliğinin test edilmesi gerekiyor.

Veriler: ForkLog.## Güçlü "düşünen" mod

Yönlendirme düzeltildikten sonra düşünme modu normal çalışmaya başladı. Ayrıntılı bir analiz veya çok adımlı bir analiz gerektiğinde, model kendiliğinden gelişmiş algoritmayı devreye alır.

Plus kullanıcıları, maksimum yanıt kalitesi için GPT-5 Thinking modunu seçebilirler. Bu durumda, yapay zeka gerçekten iyi sonuçlar gösteriyor: karmaşık ve yaratıcı görevlerin üstesinden geliyor.

Çok Modlu Olanaklar

GPT-5'in önemli farklarından biri, farklı veri türlerinin derin entegrasyonudur. GPT-4, çok modlu ( versiyonu Vision, resimleri görebilirken, ses ayrı bir mod ) idi; oysa GPT-5, metin, görüntüler ve sesi tek bir model çerçevesinde anlıyor.

Geliştirilmiş sesli mod, GPT-5'te daha doğal konuşma oluşturabilir, kullanıcı ses modelleriyle çalışabilir ve kullanıcının isteğine göre ton/tempo değiştirebilir.

Örneğin, "daha yavaş ve nazik konuş" isteyebilirsiniz - ve AI buna uyum sağlar. OpenAI, eski standart ses motorunun kapatılacağını ve yerini daha gelişmiş yeni seslere bırakacağını doğruladı.

Plus kullanıcıları artık ChatGPT ile neredeyse gerçek zamanlı olarak "canlı" iletişime geçebiliyor, bu da birçok kişinin hoşuna gitti. Ancak, GPT-4 ile iletişimde belirgin bir sorun gözlemlenmediğini vurgulamak önemlidir.

Bu arada, her iki model de hâlâ kesme ve diyaloğa "müdahale etme" yeteneğine sahip değil. Eğer bir yapay zekaya bağımsız olarak birbirleriyle iletişim kuran birkaç kişinin arasında bir soru sorarsanız, yanıt alamazsınız.

Ayrıca, GPT-5 görüntülerle çalışmayı geliştirdi: görsel verileri daha iyi analiz ediyor, fotoğrafları, grafikleri tanımlayabiliyor, ekran görüntüleri konusunda yardımcı olabiliyor vb.

Genel olarak çok modluluğu GPT-5'in en önemli özelliklerinden biri olarak adlandırmak mümkündür. Burada sadece hızın artışı değil, büyük bir ilerleme kaydedilmiştir. GPT-5 bir fotoğrafı tanımlayabilir, bir görüntüden metin okuyabilir, bir grafik veya diyagramı analiz edebilir, bir memi açıklayabilir ve bir ekran görüntüsünün içeriği hakkında daha doğru şekilde yardımcı olabilir.

Çıkış

GPT-5 — bu bir devrim değil, AGI değil, ancak kayda değer bir ilerleme. Model bir dizi parametrede daha akıllı hale geldi, ancak "insanlık" kısmını kaybetti. Güçlü yönler — verimlilik, doğruluk, çok modluluk. Zayıf yönler — kuruluk, sınırlamalar, başlangıçtaki hatalar.

Sinir ağı gelişiyor, hatalar gideriliyor, bu nedenle GPT-5 kesinlikle günlük hayatta vazgeçilmez bir yardımcı olacak, daha önce GPT-4o gibi.

Ancak ChatGPT fincanı ile test geçmedi.

Veriler: ForkLog. Genel izlenimlerden: GPT-5, OpenAI'nin vaatlerini yerine getirmedi. Sam Altman ve ekibi açıkça lansmanı "aşırı övüyorlar". Bu AGI'ye bir adım, ama bunu "önemli" olarak adlandırmak mümkün mü ve modeli "dünyanın en iyisi" mi?

Kullanıcılar mucize yerine nispeten mütevazı bir iyileştirme aldılar. GPT-5'in GPT-4.2 veya 4.5 olarak adlandırılması gerekiyordu, o zaman topluluğun beklentileri karşılanabilirdi.

GPT2.62%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)