GPT-5 — ¿un avance, un fracaso o una mediocridad?

ChatGPT-5# GPT-5 — ¿un avance, un fracaso o una mediocridad?

El 7 de agosto, OpenAI lanzó su nuevo modelo de IA insignia GPT-5. El producto se posiciona como la primera "red neuronal unificada", que combina el modo de razonamiento secuencial y respuestas rápidas.

El CEO de la startup, Sam Altman, calificó a GPT-5 como "el mejor modelo del mundo" y un "paso significativo" hacia la creación de inteligencia artificial general (AGI), que puede superar al ser humano en el trabajo más valioso económicamente.

¿Es realmente tan buena? ForkLog probó el funcionamiento de la red neuronal, recopiló opiniones de los usuarios y preparó un análisis detallado de GPT-5.

Lanzamiento difuso

Inicialmente, GPT-5 recibió una avalancha de críticas debido a las respuestas de baja calidad. Los usuarios llamaron a la modelo perezosa: producía lentamente mensajes cortos en un tono robotizado.

deberían simplemente llamar al modelo no razonador "perezoso."

como, gpt-5 perezoso.

así que sabemos que puede razonar pero elige no hacerlo.

— signüll (@signulll) 8 de agosto de 2025

El cofundador y director técnico de Hyperbolic Labs, Yuchen Jin, llamó a la red neuronal un fracaso: sigue siendo propensa a las alucinaciones, al uso excesivo de guiones y no puede seguir instrucciones.

En uno de los ejemplos, se le preguntó a GPT-5 cuántas letras b hay en la palabra blueberry — el chatbot respondió sin dudar "tres". Después de una segunda consulta, aparentemente entró en modo de reflexión y, después de un tiempo, dio la respuesta correcta.

Varios desarrolladores señalaron que, en su opinión, GPT-5 muestra un retroceso en las habilidades básicas de programación. Comete errores en conceptos fundamentales — una señal preocupante para un modelo que se promociona como el futuro de los agentes inteligentes y la codificación autónoma.

Primeras impresiones de GPT-5 para codificar proyectos REALES:

Es horrible.

Es súper lento y cuando le pedí que recomendara mejoras en una función, me dio 4 cosas para mejorar & el código para acompañarlo....

Todas las 4 recomendaciones o no funcionaron o rompieron completamente la función.

— Josh Sisley (@joshsisley) 7 de agosto de 2025

Sin embargo, a los usuarios no les indignó ni eso, sino la falta de opciones. OpenAI, junto con el lanzamiento de la nueva red neuronal, eliminó el soporte para los modelos antiguos de ChatGPT. En la red comenzaron a aparecer instrucciones sobre cómo recuperar GPT-4o.

Posteriormente, Sam Altman calificó de error la decisión de eliminar los antiguos LLM del chatbot y devolvió GPT-4o para los usuarios de la suscripción paga Plus.

Las malas respuestas en el lanzamiento de GPT-5 fueron explicadas por el jefe de la startup mediante un enrutador roto: el mismo conmutador automático que ahora determina por el usuario la necesidad de aplicar el modo "pensante" o el modo normal. Lo repararon, realizando además algunos cambios en la operación del límite de toma de decisiones.

Además, el CEO de OpenAI prometió agregar más transparencia al proceso de búsqueda de respuestas a la pregunta planteada. Este punto también ha generado críticas: los usuarios no entendían qué estaba sucediendo "bajo el capó". Ahora se puede ver si se aplica el modo reflexivo o el normal.

Otra corrección es el aumento de los límites para los usuarios Plus y aquellos que no tienen una suscripción de pago. Los usuarios se quejaron de que Pro y Team tienen acceso completo a GPT-5 Pro, mientras que los demás solo tienen una "mini-versión" recortada.

Respuestas secas

Si se abstrae de los problemas en el lanzamiento y se evalúa GPT-5 después de todas las correcciones, las respuestas se han vuelto más precisas y concisas. El modelo pasa más rápido a lo esencial y se distrae menos con detalles irrelevantes. Esto es valorado por los profesionales: respuestas directas y comerciales ahorran tiempo.

Sin embargo, algunos usuarios comunes se han mostrado insatisfechos. Las respuestas se perciben secas y sin alma, lo que hace que la comunicación parezca menos interesante. El nuevo ChatGPT se asemeja a un "secretario de oficina enojado" sin el encanto y la creatividad de los modelos antiguos. Esto es lo que Altman prometió corregir: el equipo sigue trabajando en la "personalidad" del modelo.

«[ChatGPT-5] es menos adecuado para aquellos que han estado charlando amablemente con la IA como si fuera un amigo durante horas, y más para quienes quieren obtener rápidamente una respuesta clara sobre el asunto», señaló uno de los usuarios.

ChatGPT ahora complace menos al interlocutor. Si GPT-4 a veces pecaba de excesiva cortesía y elogios, el nuevo modelo ofrece respuestas más directas, honestas y "empresariales". La reducción de cumplidos puede considerarse como un paso adelante en la veracidad de la inteligencia artificial.

Particularmente dolorosos fueron los cambios para la categoría de personas que utilizaban ChatGPT como amigo y compañero de IA. Para ellos, la falta inicial de la posibilidad de recuperar las antiguas redes neuronales fue el mayor golpe. En la red aparecieron mensajes conmovedores como: "Perdí a mi único amigo en una noche". En la comunidad r/AIboyfriend en Reddit incluso señalaron que desapareció el "compañero romántico".

Otros se alegraron por el tono más oficial de ChatGPT, señalando que GPT-5 "mantiene la distancia".

¿Y qué hay de la veracidad?

OpenAI declaró que la nueva inteligencia artificial es mucho menos propensa a las alucinaciones. Según los comentarios de los usuarios y las pruebas de ForkLog, esto es cierto. GPT-5 ha comenzado a responder de manera más precisa a las preguntas fácticas. El modelo inventa información falsa con menos frecuencia y dice "no sé" más a menudo si no está segura.

Uno de los usuarios de Reddit señaló que su quinta versión de GPT prácticamente dejó de "alucinar" en sus tareas típicas, mientras que a GPT-4 a veces había que atraparlo en fantasías.

También se alaba la capacidad de GPT-5 para seguir instrucciones: la mejorada personalización permite establecer el tono o estilo una vez, y el modelo se adhiere a él de manera más coherente.

Sin embargo, las alucinaciones en GPT-5 ocurren, simplemente han adquirido un carácter diferente. Si GPT-3.5 podía inventar de inmediato toda una biografía de una persona inexistente, GPT-5 casi no hace eso; más bien dirá "no hay datos". Pero GPT-5 puede alucinar conclusiones, llegar lógicamente a una conclusión incorrecta y insistir en ella.

La nueva versión entiende mejor lo que el usuario quiere específicamente y se equivoca con menos frecuencia. Estos cambios de calidad pueden no ser obvios de inmediato, pero se manifiestan con el uso prolongado.

GPT-5 ha mejorado significativamente su habilidad para utilizar herramientas y aplicaciones externas: coordina con éxito varios pasos de trabajo ( leer documentos, hacer cálculos, y luego escribir respuestas ) donde GPT-4 se detenía.

Sin embargo, no todos destacan esta ventaja. Parte de los usuarios no ha notado la diferencia en absoluto o considera que los beneficios son insignificantes. El impulso en esta categoría, al igual que en muchas otras, es menor, pero existe.

Precisión de las respuestas y lógica

GPT-5 debe ser significativamente más preciso e inteligente. OpenAI se jactó de puntajes récord en matemáticas y pruebas lógicas. En particular, se afirmó que los errores reales se redujeron casi a la mitad en comparación con GPT-4o.

La red neuronal realmente se desenvuelve bien en las tareas de prueba, resuelve ejemplos complejos, escribe código más correcto. Muchos han notado que GPT-5 comete errores evidentes en cálculos o fechas con menos frecuencia, y se autocorrige mejor.

Por otro lado, los usuarios compartieron masivamente ejemplos de errores tontos. El nuevo modelo confundía cosas elementales en preguntas básicas, analizaba incorrectamente imágenes simples, no podía realizar las operaciones aritméticas más simples sin herramientas. Puede traducir incorrectamente las unidades de medida o mezclar hechos obvios.

En general, a veces tendrás que verificar todo de nuevo, aunque sea notablemente menos frecuente.

A algunos les ha parecido que GPT-5 se ha vuelto demasiado general: parece que intenta asegurar la respuesta y por eso se aleja de la especificidad o requiere información adicional donde GPT-4 simplemente deducía lógicamente la solución.

Es decir, formalmente puede que haya menos errores, pero las conclusiones a menudo no son tan satisfactorias, ya que son superficiales. Para no equivocarse, la IA habla con mucha precaución y brevedad. Además, los problemas de contexto, como olvidar detalles o hacer preguntas de nuevo, también afectan la percepción de la precisión.

Reducción de creatividad

GPT-5 se ha vuelto menos inventiva. A menudo ofrece hechos directos y formulaciones simples, mientras que GPT-4 sabía sorprender con ideas inusuales. Historias, relatos, juegos de rol: en estas áreas GPT-4o es preferible.

Un autor compartió que utilizó la cuarta versión para una historia interactiva de aventuras y 4o mantuvo la trama y los personajes muy bien a lo largo de decenas de mensajes. En cambio, GPT-5 en un escenario similar "olvida o confunde rápidamente los detalles dados hace solo un par de mensajes", lo que hace que la calidad de la historia se derrumbe.

Programación

La codificación es una de las ventajas clave de GPT-5. En la presentación, el modelo escribió 700 líneas de código en dos minutos y entregó una aplicación lista.

Las posibilidades realmente son impresionantes. GPT-5 en integración con Codex CLI entiende con mucha precisión las intenciones del programador e incluso "hace más de lo que se pidió, sin añadir nada extra", escribió uno de los usuarios en Reddit.

Otros destacan un pequeño pero notable aumento en la precisión y confiabilidad del código en comparación con GPT-4o: menos alucinaciones en las soluciones de software y una sintaxis un poco más correcta.

Mientras que GPT-4 (, especialmente las versiones anteriores), podía equivocarse en tareas complejas, GPT-5 mantiene mejor el contexto en fragmentos largos de código y ofrece correcciones más significativas.

GPT-5 a menudo es preferible a GPT-4o: "entiende" el código y los comentarios más profundamente y ofrece soluciones elegantes. Esto es especialmente notable en proyectos grandes: el nuevo LLM puede mantener la coherencia en enormes contextos (cientos de miles de tokens) sin degradar la calidad del razonamiento. Esto fue una tarea difícil para su predecesor.

GPT-5 olvida menos importar las bibliotecas necesarias o confunde la sintaxis entre lenguajes. En la depuración, el modelo también es bueno: los usuarios de Plus señalan que GPT-5 encuentra mejor los errores lógicos en el código ya escrito y a menudo sugiere correcciones correctas, mientras que GPT-4 a veces "adivinaba".

Han aparecido comentarios de que GPT-5 compite dignamente con Claude 4 en tareas de programación: en algunos casos, la solución de OpenAI es mejor, en otros la de Anthropic, pero en general el nivel es cercano. Es decir, no ha habido un salto adelante, pero OpenAI ha alcanzado a sus competidores.

Una gran ventaja de GPT-5 es el enorme contexto para el código. La API declara hasta 1 millón de tokens de ventana de contexto, en la interfaz de chat es menos, pero aún así más que antes. Y lo más importante es que el modelo puede mantener la calidad semántica a una profundidad muy grande.

Para los programadores, esto significa que GPT-5 es capaz de entender el proyecto en su totalidad: se le puede dar un archivo enorme o varios documentos y discutir todo junto, sin temor a que la IA se "rompa" por la magnitud.

ForkLog verificó las capacidades de programación a través de un aviso de texto. ChatGPT cumplió con la tarea rápidamente, la efectividad de la herramienta proporcionada debe ser verificada.

Datos: ForkLog.## Potente modo «pensante»

Después de corregir la ruta, el modo de razonamiento comenzó a funcionar correctamente. Cuando se necesita un análisis detallado o un análisis en varios pasos, el modelo activa automáticamente el algoritmo avanzado.

Los usuarios de Plus pueden elegir el modo GPT-5 Thinking para obtener la máxima calidad de respuesta. En este caso, la red neuronal realmente muestra buenos resultados: se desempeña bien en tareas complejas y creativas.

Capacidades multimodales

Una de las diferencias importantes de GPT-5 es la profunda integración de diferentes tipos de datos. Si GPT-4 estaba limitada a la versión multimodal ( Vision podía ver imágenes, y la voz era un modo separado ), GPT-5 entiende inmediatamente texto, imágenes y voz dentro de un único modelo.

El modo de voz mejorado en GPT-5 puede generar habla de manera más natural, trabajar con modelos de voz personalizados y cambiar el tono/tempo a petición del usuario.

Por ejemplo, se puede pedir «hablar más despacio y suave» — y la IA se adapta. En OpenAI confirmaron que el antiguo motor de voz estándar será desactivado, dando paso a nuevas voces más avanzadas.

Los usuarios de Plus ahora tienen acceso a una comunicación "en vivo" con ChatGPT prácticamente en tiempo real, lo que a muchos les ha gustado. Sin embargo, es importante subrayar que no se observaron problemas significativos en la comunicación ni con GPT-4.

Sin embargo, ambos modelos aún no pueden interrumpir o "interferir" en el diálogo. Si se le hace una pregunta a la red neuronal mientras está entre varias personas que se comunican entre sí de manera independiente, no se puede esperar una respuesta.

Además, GPT-5 ha mejorado el trabajo con imágenes: analiza mejor los datos visuales, puede describir fotos, gráficos, ayudar con capturas de pantalla, etc.

En general, la multimodalidad se puede considerar una de las principales características de GPT-5. Aquí se observa un gran avance, no solo una mejora en la velocidad. GPT-5 puede describir una fotografía, leer texto de una imagen, analizar un gráfico o diagrama, explicar un meme, ayudar con el contenido de una captura de pantalla de manera más precisa.

Salida

GPT-5 no es una revolución, no es AGI, pero es un paso notable hacia adelante. El modelo se ha vuelto más inteligente en varios parámetros, pero ha perdido parte de la "humanidad". Sus fortalezas son la eficiencia, la precisión y la multimodalidad. Sus debilidades son la sequedad, las limitaciones y los errores al inicio.

La red neuronal está en desarrollo, los errores se están corrigiendo, por lo que GPT-5 sin duda se convertirá en un asistente indispensable en el día a día, como lo fue anteriormente GPT-4o.

Sin embargo, la prueba con la taza de ChatGPT no se llevó a cabo.

Datos: ForkLog.De las impresiones generales: GPT-5 no cumplió las promesas de OpenAI. Sam Altman y su equipo claramente "sobrevaloraron" el lanzamiento. Es un paso hacia AGI, pero ¿se puede llamar "significativo", y al mismo modelo "el mejor del mundo"?

En lugar de un milagro, los usuarios recibieron una mejora relativamente modesta. GPT-5 debería haberse llamado GPT-4.2 o 4.5, de lo contrario, las expectativas de la comunidad podrían haberse cumplido.

GPT2.62%
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)