Inicio España OpenAI proporciona a los desarrolladores la herramienta para integrar conversaciones naturales en...

OpenAI proporciona a los desarrolladores la herramienta para integrar conversaciones naturales en tiempo real en sus aplicaciones de IA

0

MADRID, 2 (Portaltic/EP)

OpenAI ha facilitado a los desarrolladores nuevas herramientas con las que personalizar sus modelos y crear aplicaciones de inteligencia artificial (IA) que incluyen conversaciones en tiempo real con voz natural e incorporen y mejoren la comprensión de imágenes.

La compañía tecnológica ha celebrado este martes en San Francisco (Estados Unidos) su evento de desarrolladores DevDay 2024, en el que ha anunciado nuevas herramientas para la personalización de sus modelos de IA.

Los desarrolladores pueden acceder a un nuevo proceso de destilación de modelos que se integra en la plataforma de OpenAI para que puedan utilizar los resultados de modelos de mayor capacidad, como o1-preview y GPT-4o, para afinar otros más pequeños y rentables, como GPT-4o mini.

Este proceso se encuentra en una nueva ‘suite’ que permite a los desarrolladores generar conjuntos de datos para destilación, crear y ejecutar evaluaciones personalizadas para medir el rendimiento del modelo en tareas específicas. Ambas herramientas están integradas en la oferta de ajuste de OpenAI.

Los desarrolladores también pueden realizar ajustes en GPT-4o con imágenes, además de con texto, con la nueva herramienta de ajuste fino de visión. De esta forma, pueden incorporar capacidades de comprensión de imágenes para ofrecer funciones de búsqueda visual o de detección de objetos.

‘Prompt Caching’ es una herramienta diseñada para que los desarrolladores ahorren costes y tiempo al permitir guardar en caché el contexto usado de manera frecuente en múltiples llamadas de API. Se aplica automáticamente en las últimas versiones de GPT-4o, GPT-4o mini, o1-preview y o1-mini, y sus versiones optimizadas.

“La API almacena en caché el prefijo más largo de una solicitud que se haya calculado previamente, comenzando con 1024 tokens y aumentando en incrementos de 128 tokens. Si reutilizas solicitudes con prefijos comunes, aplicaremos automáticamente el descuento de almacenamiento en caché de solicitudes sin necesidad de que realices ningún cambio en su integración de API”, explica la compañía en el blog oficial.

Una última novedad anunciada en DevDay es ‘Realtime API’, un recurso con el que los desarrolladores pueden crear experiencias rápidas de conversión de voz a voz en sus aplicaciones. Está actualmente en una fase de beta pública, y es similar al modo de voz avanzado de ChatGPT, admite conversaciones naturales con una de la seis voces predefinidas.


- Te recomendamos -