Forbes Argentina
Chat GPT 5
Columnistas

GPT-5: Entre la euforia del marketing y la realidad empresarial

Sergio Richter

Share

7 Agosto de 2025 20.47

Tras probar GPT‑5 tanto desde Windsurf como directamente con la suscripción Pro de USD 200, puedo confirmar que estamos ante un paso sólido de producto, más que una demo espectacular. Unifica experiencias, mejora la factualidad y la honestidad, y rinde en coding real. 

En ARC‑AGI‑2, el test que mide la inteligencia artificial general, no lidera y es importante recordarlo cuando alguien pronuncie "AGI" con demasiada soltura. Para las empresas, sí eleva el listón de lo útil y desplegable. En nuestro caso, en Oversoft, nuestra estrategia es clara: adoptar con cabeza fría, explotar lo que acelera negocio y mantener el músculo de evaluación comparativa encendido.

He comprobado personalmente que GPT‑5 integra un sistema de arquitectura unificada con ruteo automático entre un modelo rápido y otro de razonamiento profundo (thinking), decidiendo en tiempo real cuál usar. Es una mejora en usabilidad, aunque menos transparente para evaluar técnicamente. 

En velocidad, las pruebas públicas apuntan a un 30-50% más rápido que GPT‑4; se siente al instante, pero no es un salto cognitivo. En código, sí hay un cambio cualitativo: generación de UIs y backends one‑shot y un developer experience muy superior.

Benchmarks: la prueba de fuego

El ARC‑AGI‑2 deja un dato incómodo: GPT‑5 (High) ≈ 9,9%, frente a Grok‑4 (Thinking) ≈ 15,9%. Grok‑4 rinde mejor en este test de razonamiento general diseñado para ser fácil para humanos y difícil para IA. Esto muestra que "AGI" en marketing no equivale a inteligencia general medida. La ventaja de GPT‑5 aquí es su eficiencia en costo por tarea, relevante para empresas, aunque la capacidad bruta sea menor.

En benchmarks de código como SWE‑Bench, GPT‑5 sí lidera: mejor calidad, mayor profundidad en tareas agentic. Pero conviene recordar que son pruebas orientadas a software, no a razonamiento abstracto.

Sergio Richter
Sergio Richter, Gerente de Inteligencia Artificial en Oversoft

Donde brilla en la empresa

GPT‑5 destaca en automatización agentic y multimodal, con memoria persistente y mejor uso de herramientas (tool‑use). Esto se traduce en pipelines más eficientes, reporting optimizado, soporte al cliente y mejor integración con suites como Copilot y Azure. Además, su disponibilidad masiva —incluyendo versiones gratuitas y de bajo costo— y una base de 700 millones de usuarios semanales consolidan un ecosistema estándar y de adopción masiva.

Como se mencionó anteriormente, la conversación de AGI debe tomarse con cautela: si en el único benchmark de razonamiento general GPT‑5 no lidera, no debemos venderlo como "salto hacia AGI". Segundo, el router opaco dificulta la trazabilidad técnica: gran UX, pero menor auditabilidad para MLOps serios. Tercero, el "Agent Mode" aún tropieza en integraciones profesionales y en aspectos de derechos y licencias. Cuarto, aunque las alucinaciones han bajado, no han desaparecido. Y quinto, la creatividad visual sigue siendo irregular: es mejor ingeniero que artista.

Mi lectura personal

Tras usarlo intensivamente en Windsurf y en el modelo Pro, reafirmo que GPT‑5 es un paso de producto, no un prototipo inflado para demos. Unifica la experiencia de uso, mejora la factualidad y honestidad, y rinde en entornos de desarrollo reales. En ARC‑AGI‑2 no es líder, pero para una empresa sí marca un avance práctico y utilizable hoy.

En Oversoft, la estrategia es clara: adoptar con cabeza fría, explotar lo que acelera negocio y mantener un ciclo constante de evaluación comparativa. Como he dicho antes: "Si liderás transformación, apostá a casos agentic bien delimitados, guardrails y observabilidad, y dejá la palabra 'AGI' para los paneles de conferencias."

* Por Sergio Richter, Gerente de Inteligencia Artificial en Oversoft

10