Avances en inteligencia artificial: nuevas versiones de chatGPT y gemini 1.5 pro

La empresa OpenAI, afiliada a Microsoft, ha lanzado su última versión del ChatGPT, conocida como GPT-4o. A su vez, Google, su competidor, ha presentado una nueva iteración de Gemini denominada 1.5 Pro.

Ambas empresas representan avances en inteligencia artificial generativa, cada vez más sofisticadas y adaptadas a las necesidades del usuario.

La IA generativa basada en aprendizaje automático se ha convertido en una piedra angular para varias empresas que compiten por liderar innovaciones. Microsoft destaca con Copilot y Chat GPT, mientras que Google avanza con Gemini, entre otros proyectos menos conocidos pero en ascenso.

En las últimas 24 horas, ambas compañías han lanzado nuevas versiones de sus productos estrella.

Google ha lanzado Gemini 1.5 Pro, especialmente diseñado para aplicaciones que requieren generación de resúmenes, chat, subtitulación de imágenes y vídeos, y extracción de datos de documentos y tablas extensos. Esta versión es compatible con más de 35 idiomas, lo que amplía su accesibilidad global. Se han mejorado aspectos como la generación de código, el razonamiento lógico, la planificación, las conversaciones de múltiples turnos, y la comprensión de audio e imágenes.

Por su parte, OpenAI ha anunciado el lanzamiento del Chat GPT-4o, que representa un avance hacia una interacción persona-computadora más fluida y natural. Este nuevo modelo es capaz de procesar entradas de texto, audio e imagen, y generar salidas en cualquier combinación de estos formatos. Destaca por su rápida velocidad de respuesta, con un tiempo de tan solo 232 milisegundos en situaciones óptimas y un promedio de 320 milisegundos, comparable al tiempo de respuesta humano en una conversación habitual.

Los usuarios pueden elegir entre una lectura o conversación más mecánica o dramática, y el sistema puede interpretar interrupciones como parte de una charla informal. Además, si se activa la cámara, puede detectar emociones faciales y ofrecer actividades como ejercicios de respiración, contar historias o resolver problemas matemáticos, incluso actuar como árbitro en un juego de piedra, papel o tijera, entre otras funciones.

No obstante, aún quedan por resolver cuestiones importantes como los derechos de autor y creación, que requieren compensación por el uso de contenido para entrenar modelos informáticos.

Estas nuevas funcionalidades de los gigantes tecnológicos estarán disponibles sin necesidad de suscripción.

Deja una respuesta

Your email address will not be published.

Últimos artículos de Mundo