GPT-5 — прорив, провал чи посередність?

! ChatGPT-5# GPT-5 – прорив, провал чи посередність?

7 серпня OpenAI випустила нову флагманську ІІ-модель GPT-5. Продукт позиціонується як перша «уніфікована» нейромережа, що поєднує режим послідовних міркувань та швидких відповідей.

Генеральний директор стартапу Сэм Альтман назвав GPT-5 «кращою моделлю у світі» та «значним кроком» до створення загального штучного інтелекту (AGI), який може перевершити людину у найбільш економічно цінній роботі.

Чи справді вона така хороша? ForkLog протестував роботу нейромережі, зібрав думки користувачів і підготував детальний розбір GPT-5.

Розмитий запуск

Спочатку GPT-5 отримала шквал критики через неякісні відповіді. Користувачі називали модель ледачою — вона повільно видавала короткі повідомлення в роботизованому тоні.

вони просто повинні називати модель без міркування "ледачою."

як, gpt-5 ледачий.

тому ми знаємо, що воно може міркувати, але вибирає цього не робити.

— signüll (@signulll) 8 серпня 2025

Співзасновник і технічний директор Hyperbolic Labs Ючен Джин назвав нейромережу провальною — вона все ще схильна до галюцинацій, надмірного використання тире і не здатна слідувати інструкціям.

В одному з прикладів GPT-5 запитали про те, скільки букв b знаходиться в слові blueberry — чат-бот без роздумів відповів «три». Після повторного запиту він, вочевидь, увійшов у режим міркувань і через деякий час дав правильну відповідь.

Кілька розробників зазначили, що, на їхню думку, GPT-5 демонструє регрес в базових навичках програмування. Вона помиляється в фундаментальних концепціях — тривожний знак для моделі, яка рекламується як майбутнє інтелектуальних агентів та автономного кодування.

Перші враження від GPT-5 для кодування РЕАЛЬНИХ проектів:

Це жахливо.

Це дуже повільно, і коли я попросив його порекомендувати покращення функції, він дав мені 4 речі для покращення & код до цього...

Усі 4 рекомендації або не спрацювали, або повністю зламали функцію.

— Джош Сіслі (@joshsisley) 7 серпня 2025 р.

Однак користувачів обурило навіть не це, а відсутність можливості вибору. OpenAI разом з випуском нової нейромережі прибрала підтримку старих моделей з ChatGPT. У мережі почали з'являтися інструкції, як повернути GPT-4o.

В подальшому Сем Альтман назвав помилкою рішення прибрати старі LLM з чат-бота і повернув GPT-4o для користувачів платної підписки Plus.

Погані відповіді на запуску GPT-5 глава стартапу пояснив зламаним маршрутизатором — тим самим автоперемикачем, який тепер за користувача визначає необхідність застосування «мислячого» або звичайного режиму. Його полагодили, додатково внести деякі зміни в роботу межі прийняття рішень.

Додатково CEO OpenAI пообіцяв додати більше прозорості в процес пошуку відповіді на поставлене питання. Цей момент також викликав критику — користувачі не розуміли, що відбувається «під капотом». Тепер можна бачити, застосовується мислячий режим чи звичайний.

Ще одне виправлення — збільшення лімітів для користувачів Plus і тих, хто не має платної підписки. Юзери скаржилися, що Pro і Team отримують повний доступ до GPT-5 Pro, а інші лише урізану «міні-версію».

Сухі відповіді

Якщо абстрагуватися від проблем на запуску і оцінювати GPT-5 після всіх виправлень, відповіді стали точнішими і лаконічнішими. Модель швидше переходить до суті, менше відволікається на не пов'язані з справою деталі. Це цінують професіонали: прямі і ділові відповіді економлять час.

Однак деякі звичайні користувачі залишилися незадоволені. Відповіді сприймаються сухими і бездушними, через що спілкування здається менш захоплюючим. Новий ChatGPT схожий на «розгніваного офісного секретаря» без шарму і креативності старих моделей. Це Альтман пообіцяв виправити — команда продовжує працювати над «особистістю» моделі.

«[ChatGPT-5] менше підходить тим, хто годинами мило бесідував з ІІ як з другом, і більше — тим, хто хоче швидко отримати чітку відповідь по справі», — зазначив один з користувачів.

ChatGPT тепер менше вгоджує співрозмовнику. Якщо GPT-4 іноді грішила надмірною ввічливістю та похвалою, то нова модель видає більш прямі, чесні та «ділові» відповіді. Зменшення кількості компліментів можна оцінювати як крок вперед у правдивості штучного інтелекту.

Особливо болісно зміни сприйняла категорія людей, яка використовувала ChatGPT як друга та ІІ-компаньона. Для них же первісна відсутність можливості повернути старі нейромережі стала найбільшим ударом. В мережі з'явилися зворушливі повідомлення на кшталт: «Я втратив єдиного друга за одну ніч». У спільноті r/AIboyfriend на Reddit взагалі зазначили, що зник «романтичний співрозмовник».

Інші зраділи більш офіційному тону ChatGPT, зауваживши, що GPT-5 «тримає дистанцію».

А що насчет правдивості?

OpenAI заявила, що новий штучний інтелект набагато менше піддається галюцинаціям. За відгуками користувачів та тестами ForkLog — це правда. GPT-5 став у середньому точніше відповідати на фактичні питання. Модель рідше вигадує неправдиву інформацію і частіше говорить «я не знаю», якщо не впевнена.

Один з користувачів Reddit відзначив, що у нього п'ята версія GPT практично перестала «галюцинувати» на його типових завданнях, тоді як GPT-4 іноді доводилось ловити на вигадці.

Також хвалять здатність GPT-5 дотримуватися інструкцій: покращена налаштовуваність дозволяє задати тон або стиль один раз, і модель більш послідовно його дотримується.

Тим не менш, галюцинації у GPT-5 трапляються, просто вони набули іншого характеру. Якщо GPT-3.5 міг одразу вигадати цілу біографію неіснуючої людини, то GPT-5 такого майже не робить — швидше скаже «немає даних». Але GPT-5 може галюцинувати умозаключення — логічно прийти до невірного висновку і вперто на ньому наполягати.

Нова версія краще розуміє, чого конкретно хоче користувач, і рідше збивається. Ці якісні зміни можуть бути не відразу помітні, але проявляються при тривалому використанні.

У GPT-5 значно виросло вміння користуватися інструментами та зовнішніми додатками — вона успішно координує кілька етапів роботи (читати документ, робити обчислення, а потім писати відповідь) там, де GPT-4 гальмувала.

Однак не всі відзначають цю перевагу. Частина користувачів зовсім не помітила різниці або вважає плюси незначними. Буст у цій категорії, як і в багатьох інших, незначний, але є.

Точність відповідей та логіка

GPT-5 повинна бути суттєво точнішою та розумнішою. OpenAI хвалилася рекордними балами в математиці та логічних тестах. Зокрема, заявлялося про зменшення фактичних помилок майже вдвічі порівняно з GPT-4o.

Нейромережа дійсно добре справляється з тестовими завданнями, вирішує складні приклади, пише більш правильний код. Багато хто помітив, що GPT-5 рідше робить явні промахи в розрахунках або датах, краще перевіряє себе.

З іншого боку, користувачі масово ділилися прикладами дурних помилок. Нова модель плутала елементарні речі в базових питаннях, неправильно аналізувала прості картинки, не могла виконати найпростіші арифметичні дії без інструментів. Вона може неправильно перекласти одиниці вимірювання або переплутати очевидні факти.

В загальному, перепровіряти іноді все ж доведеться, хоч і помітно рідше.

Декому здалося, що GPT-5 стала занадто загальною: вона ніби намагається убезпечити відповідь і тому уникає конкретики або вимагає додаткової інформації там, де GPT-4 просто логічно виводила рішення.

Тобто формально помилок, може, й менше, але висновки нерідко не такі задовільні, оскільки поверхневі. Щоб не помилитися, ІІ говорить дуже обережно і лаконічно. Крім того, проблеми з контекстом — забування деталей, перепитування — також б'ють по сприйняттю точності.

Зниження креативності

GPT-5 стала менш винахідливою. Вона частіше видає прямі факти та прості формулювання, тоді як GPT-4 вміла дивувати нестандартними ідеями. Історії, розповіді, рольові ігри — в цих сферах GPT-4o переважніше.

Один автор поділився, що використовував четверту версію для інтерактивного пригодницького оповідання і 4o чудово тримав сюжет і персонажів протягом десятків повідомлень. GPT-5 ж в аналогічному сценарії «швидко забуває або плутає деталі, надані всього кілька повідомлень назад», через що якість історії руйнується.

Програмування

Кодування — одна з ключових переваг GPT-5. На презентації модель написала 700 рядків коду за дві хвилини і видала готовий додаток.

Можливості дійсно вражають. GPT-5 в інтеграції з Codex CLI дуже точно розуміє наміри програміста і навіть «робить більше, ніж просили, не додаючи зайвого», написав один з користувачів на Reddit.

Інші відзначають невелике, але явне підвищення точності та надійності коду в порівнянні з GPT-4o: менше галюцинацій у програмних рішеннях і трохи більш коректний синтаксис.

В той час як GPT-4 (особливо ранні версії) міг помилятися в складних задачах, GPT-5 краще тримає контекст у довгих фрагментах коду і дає більш змістовні правки.

GPT-5 часто переважніше GPT-4o: вона «розуміє» код і коментарі глибше і пропонує елегантні рішення. Це особливо помітно при великих проектах: нова LLM може підтримувати зв'язність у величезних контекстах (сотні тисяч токенів) без деградації якості міркувань. Це була складна задача для попередника.

GPT-5 рідше забуває імпортувати потрібні бібліотеки або плутає синтаксис між мовами. В налагодженні модель також гарна: Plus-користувачі відзначають, що GPT-5 краще знаходить логічні помилки в уже написаному коді і частіше пропонує коректні виправлення, тоді як GPT-4 іноді «вгадував».

З'явилися відгуки, що GPT-5 гідно конкурує з Claude 4 у програмних задачах — десь краще рішення від OpenAI, десь від Anthropic, але в цілому рівень близький. Тобто різкого стрибка вперед не сталося, але OpenAI наздожнала конкурентів.

Важна перевага GPT-5 — величезний контекст для коду. В API заявлено до 1 млн токенів контекстного вікна, в інтерфейсі чату — менше, але все ж більше попереднього. І головне — модель може зберігати семантичну якість на дуже великій глибині.

Для програмістів це означає, що GPT-5 здатен розуміти проект цілком — можна дати їй величезний файл або кілька документів і обговорювати все разом, не побоюючись, що ШІ «зламається» від масштабу.

ForkLog перевірив можливості програмування за текстовим промптом. ChatGPT впорався з завданням швидко, ефективність наданого інструмента необхідно перевіряти.

! Дані: ForkLog.## Потужний режим мислення

Після виправлення маршрутизації режим міркувань почав працювати нормально. Коли потрібен детальний аналіз або аналіз у кілька кроків, модель сама включає просунутий алгоритм.

Користувачі Plus можуть обрати режим GPT-5 Thinking для максимальної якості відповіді. У такому випадку нейромережа дійсно показує хороші результати: вона справляється зі складними і творчими завданнями.

Багатофункціональні можливості

Однією з важливих відмінностей GPT-5 є глибока інтеграція різних типів даних. Якщо GPT-4 була обмежена мультимодальною (версією Vision, яка вміла бачити картинки, а голос був окремим режимом), то GPT-5 одразу розуміє текст, зображення та мову в рамках єдиної моделі.

Покращений голосовий режим у GPT-5 вміє генерувати мову більш природно, працювати з користувацькими голосовими моделями та змінювати тон/темп за запитом юзера.

Наприклад, можна попросити «говорити повільніше і м'якіше» — і ШІ адаптується. В OpenAI підтвердили, що старий стандартний голосовий двигун буде вимкнено, поступаючись місцем новим, більш просунутим голосам.

Користувачам Plus тепер доступно «живе» спілкування з ChatGPT практично в режимі реального часу, що багатьом сподобалось. Однак важливо підкреслити, що і з GPT-4 помітних проблем у спілкуванні не спостерігалося.

При цьому обидві моделі все ще не вміють перебивати і «втручатися» в діалог. Якщо нейромережам поставити питання, перебуваючи серед кількох людей, які спілкуються між собою незалежно, відповіді не діждешся.

Крім того, GPT-5 покращила роботу з зображеннями: вона краще аналізує візуальні дані, вміє описувати фото, графіки, допомагати по скріншотам тощо.

В цілому мультимодальність можна назвати однією з головних фішок GPT-5. Тут помітний великий крок вперед, а не просто покращення швидкості. GPT-5 може описати фотографію, прочитати текст з зображення, проаналізувати графік або діаграму, пояснити мем, допомогти по змісту скріншота більш точно.

Виведення

GPT-5 — це не революція, не AGI, однак помітний крок уперед. Модель стала розумнішою за рядом параметрів, але втратила частину «людяності». Сильні сторони — ефективність, точність, мультимодальність. Слабкі — сухість, обмеження, баґи на старті.

Нейромережа розвивається, помилки усуваються, тому GPT-5 безумовно стане незамінним помічником на кожен день, яким до цього була GPT-4o.

Однак тест з чашкою ChatGPT так і не пройшов.

Дані: ForkLog.З загальних вражень: GPT-5 не виправдала обіцянок OpenAI. Сем Алтман і його команда явно «перехайпили» запуск. Це крок до AGI, але чи можна його назвати «значним», а саму модель — «найкращою у світі»?

Замість дива користувачі отримали відносно скромне покращення. GPT-5 слід було назвати GPT-4.2 або 4.5, тоді очікування спільноти могли б виправдатися.

GPT2.62%
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити