Conheça o Shepherd AI da Meta, o guia AI que corrige LLMs
É hora de dar um passo atrás na cobertura dos avanços da IA da Microsoft , para dar uma olhada em um dos modelos em que seu parceiro recente, a Meta, está trabalhando.
A empresa do Facebook também financiou pesquisas sobre IA por conta própria, e o resultado é um modelo de IA capaz de corrigir grandes modelos de linguagem (LLMs) e orientá-los a fornecer as respostas corretas.
A equipe por trás do projeto sugestivamente chamou o modelo de Shepherd AI , e o modelo foi construído para abordar os erros que os LLMs podem cometer quando solicitados a realizar determinadas tarefas.
Neste trabalho, apresentamos o Shepherd, um modelo de linguagem especificamente sintonizado para criticar as respostas do modelo e sugerir refinamentos, estendendo-se além das capacidades de um modelo desafinado para identificar diversos erros e fornecer sugestões para corrigi-los. No centro de nossa abordagem está um conjunto de dados de feedback de alta qualidade, que selecionamos a partir do feedback da comunidade e anotações humanas.
Pesquisa Meta AI, FAIR
Como você deve saber, a Meta lançou seus LLMs, Llama 2, em parceria com a Microsoft, há várias semanas. O Llama 2 é um impressionante modelo de código-fonte aberto de 70B que a Microsoft e a Meta planejam comercializar para usuários e organizações para construir suas ferramentas internas de IA.
Mas a IA ainda não é perfeita. E muitas de suas soluções nem sempre parecem corretas. Shepherd está aqui para resolver esses problemas, corrigindo-os e sugerindo soluções, de acordo com a Meta AI Research.
Shepherd AI é um professor de IA natural e informal
Todos sabemos que o Bing Chat, por exemplo, tende a seguir alguns padrões: a ferramenta pode ser criativa , mas também pode limitar sua criatividade . Quando se trata de assuntos profissionais, o Bing AI também pode assumir uma atitude séria.
No entanto, parece que o Shepherd AI da Meta funciona como um professor informal de IA para os outros LLMs. O modelo, consideravelmente menor nos parâmetros 7B, tem um tom de voz natural e informal ao corrigir e sugerir soluções.
Tudo isso foi possível graças a uma variedade de fontes de treinamento, incluindo:
- Feedback da comunidade: Shepherd AI foi treinado em conteúdo curado de fóruns online (fóruns do Reddit, especificamente), o que permite suas entradas naturais.
- Entrada anotada por humanos: o Shepherd AI também foi treinado em um conjunto de bancos de dados públicos selecionados, o que permite suas correções organizadas e factuais.
O Shepherd AI é perfeitamente capaz de fornecer uma correção factual melhor do que o ChatGPT, por exemplo, apesar de sua infraestrutura relativamente pequena. FAIR e Meta AI Research descobriram que a ferramenta AI oferece melhores resultados do que a maioria de suas alternativas competitivas, com uma taxa média de vitórias de 53-87% . Além disso, o Shepherd AI também pode fazer julgamentos precisos sobre qualquer tipo de conteúdo gerado pelo LLM.
Por enquanto, o Shepherd é um novo modelo de IA, mas à medida que mais pesquisas são feitas, o modelo provavelmente será lançado no futuro, como um projeto de código aberto.
Você está animado com isso? Você o usaria para corrigir seu próprio modelo de IA? O que você acha disso?
Deixe um comentário