GPT-4o: Qué es, cómo usarlo y cómo puede ayudarnos en nuestras tareas diarias

OpenAI anunció este lunes en un evento en vivo su último modelo de inteligencia artificial (IA), GPT-4o. Esta versión, que a muchos les ha dado un poco de miedo, tiene capacidades mejoradas de los modelos anteriores, ofrece una experiencia más inteligente y rápida con la que se podrá interactuar de forma más fluida.

¿Qué es ChatGPT-4o?

GPT-4o con la “o” de “omni” (un prefijo que significa que “lo abarca todo”), es un modelo multimodal que puede trabajar con voz, texto e imagen simultáneamente. Puede responder a entradas de audio en un rango de 232 a 320 milisegundos, similar al tiempo de respuesta humana. Esto permite una interacción más fluida y natural con aplicaciones como ChatGPT, que ahora pueden comprender y generar respuestas en tiempo real, ya sea mediante conversaciones habladas o escritas.

Mira Murati, CTO de OpenAI, destacó que GPT-4o proporciona inteligencia al nivel de GPT-4, pero con mejoras significativas en texto, audio y visión. Esto se traduce en una reducción notable en la latencia de las respuestas, lo que hace que la interacción con los modelos sea mucho más fluida.

¿Qué mejoras tiene ChatGPT?

Una de las mejoras más destacadas es la capacidad de ChatGPT para mantener conversaciones habladas en tiempo real. Los usuarios pueden interactuar con el modelo de forma más natural, interrumpiéndolo mientras responde y expresando emociones que el modelo puede captar y reflejar en su respuesta.

Además, GPT-4o ofrece capacidades mejoradas en sus capacidades de visión, lo que permite a ChatGPT analizar imágenes y responder preguntas relacionadas con ellas. Desde que marca de camisa llevas hasta reconocer errores de código de un lenguaje de programación. Esta función amplía aún más las posibilidades de interacción con el modelo.

Otra mejora es la capacidad de GPT-4o para traducir conversaciones en tiempo real, lo que facilita la comunicación multilingüe. Esta función es especialmente útil en situaciones donde los usuarios hablan diferentes idiomas. OpenAI busca que el usuario tenga la facilidad de poder pedir lo que desea directamente al chatbot, todo en lenguaje natural, sin comandos específicos.

¿Cómo usar GPT-4o?

Anteriormente, la disponibilidad del modelo de inteligencia artificial GPT-4o solo estaba desplegada al equipo rojo, un grupo de más de 70 expertos con conocimientos en psicología social, prejuicios y equidad, e información errónea para identificar riesgos. Sin embargo, OpenAI ya ha desplegado GPT-4o de forma gratuita para todos los usuarios con ciertas limitaciones por una cierta cantidad de mensajes de uso en el plan gratuito, pero con hasta 5 veces más mensajes para los usuarios del plan ChatGPT Plus.

¿Qué uso se le pueda dar a GPT-4o?

El modelo GPT-4o muestra que cada vez estamos más cerca de estar en una película de ciencia ficción, debido a la última actualización que OpenAI lanzó en donde muestra que puedes usar la IA para diferentes tareas que antes tardaban horas en realizarse. Comenzando por agregar la función para cargar archivos desde Google Drive y Microsoft OneDrive, así como la característica de accesibilidad “Be My Eyes” para ayudar a personas con problemas visuales a reconocer objetos y navegar en situaciones cotidianas, OpenAI ha agregado más funciones como:

  • Memoria más confiable reduciendo alucinaciones y respuestas especulativas.
  • Capacidad para convertir texto a imágenes de alta calidad.
  • Habilidad para reaccionar a imágenes o videos de forma inmediata.
  • Generar gráficos profesionales y análisis estadísticos en excel u otros programas similares a partir de hojas de cálculo en menos de 30 segundos.
  • Proporcionar traducciones en tiempo real en diversos idiomas.
  • Capacidad para analizar imágenes o videos al instante.
  • Resolver manuscritos no descifrados
  • Convertir texto a fuente
  • Crear archivos STL para un modelo 3D en segundos desde el móvil.
  • Resolver problemas matemáticos.
  • Lectura de pantalla de dispositivos como laptops o PCs en tiempo real.

OpenAI también anunció el lanzamiento de una aplicación de escritorio de ChatGPT, que estará disponible para macOS y más adelante para Windows. Esta aplicación permitirá a los usuarios interactuar con el modelo de una manera más conveniente, incluso durante videollamadas.

El avance de OpenAI con GPT-4, ofrece una experiencia de usuario más inteligente y rápida. Con estas nuevas capacidades, ChatGPT se convierte en un asistente personal digital más sofisticado y útil para una amplia gama de aplicaciones.

Sigue nuestro trabajo en:

Comparte en: