Conozca a Shepherd AI de Meta, la IA guía que corrige los LLM
Es hora de dar un paso atrás en la cobertura de los avances en IA de Microsoft , para echar un vistazo a uno de los modelos en los que ha estado trabajando su reciente socio, Meta.
La compañía de Facebook también ha estado financiando investigaciones sobre IA por su cuenta, y el resultado es un modelo de IA que puede corregir modelos de lenguaje extenso (LLM) y guiarlos para que brinden las respuestas correctas.
El equipo detrás del proyecto llamó sugestivamente al modelo Shepherd AI , y el modelo está diseñado para abordar los errores que pueden cometer los LLM cuando se les pide que realicen ciertas tareas.
En este trabajo, presentamos Shepherd, un modelo de lenguaje ajustado específicamente para criticar las respuestas del modelo y sugerir mejoras, extendiéndose más allá de las capacidades de un modelo no ajustado para identificar diversos errores y brindar sugerencias para remediarlos. En el centro de nuestro enfoque se encuentra un conjunto de datos de retroalimentación de alta calidad, que seleccionamos a partir de los comentarios de la comunidad y las anotaciones humanas.
Investigación de meta IA, FAIR
Como sabrá, Meta lanzó su LLM, Llama 2, en asociación con Microsoft, hace varias semanas. Llama 2 es un asombroso modelo de código abierto de 70B parámetros que Microsoft y Meta planean comercializar a usuarios y organizaciones para construir sus propias herramientas de IA.
Pero la IA aún no es perfecta. Y muchas de sus soluciones no siempre parecen ser correctas. Shepherd está aquí para abordar estos problemas corrigiéndolos y sugiriendo soluciones, según Meta AI Research.
Shepherd AI es un profesor de IA informal y natural
Todos sabemos que Bing Chat, por ejemplo, suele tener que seguir unos patrones: la herramienta puede ser creativa , pero también puede limitar su creatividad . Cuando se trata de asuntos profesionales, Bing AI también puede asumir una actitud seria.
Sin embargo, parece que Shepherd AI de Meta funciona como un maestro de IA informal para los otros LLM. El modelo, que es considerablemente más pequeño en parámetros 7B, tiene un tono de voz natural e informal al corregir y sugerir soluciones.
Todo esto fue posible gracias a una variedad de fuentes de capacitación, que incluyen:
- Comentarios de la comunidad: Shepherd AI fue capacitado en contenido seleccionado de foros en línea (foros de Reddit, específicamente), lo que permite sus aportes naturales.
- Aporte anotado por humanos: Shepherd AI también fue capacitado en un conjunto de bases de datos públicas seleccionadas, lo que permite sus correcciones organizadas y fácticas.
Shepherd AI es perfectamente capaz de proporcionar una mejor corrección objetiva que ChatGPT, por ejemplo, a pesar de su infraestructura relativamente pequeña. FAIR y Meta AI Research descubrieron que la herramienta de IA brinda mejores resultados que la mayoría de sus alternativas competitivas, con una tasa de ganancias promedio de 53-87 % . Además, Shepherd AI también puede emitir juicios precisos sobre cualquier tipo de contenido generado por LLM.
Por ahora, Shepherd es un modelo de IA novedoso, pero a medida que se realicen más investigaciones, lo más probable es que el modelo se lance en el futuro, como un proyecto de código abierto.
¿Estás emocionado por eso? ¿Lo usarías para corregir tu propio modelo de IA? ¿Qué piensa usted al respecto?
Deja una respuesta