A equipe do WizardLM diz que um modelo de IA de terceiros roubou seu trabalho

A equipe do WizardLM diz que um modelo de IA de terceiros roubou seu trabalho

E sua reputação cresceu tanto que parece que o processo de treinamento do WizardLM foi replicado em um modelo de IA de terceiros, chamado Phind. Mas aqui está o problema: a equipe financiada pela Microsoft por trás do WizardLM afirma que a equipe Phind roubou todo o seu trabalho, sem sequer creditá-los.

Se você se lembra, WizardLM é um modelo de código aberto que pode ser usado para treinar seu próprio modelo de IA. No entanto, as parcerias de IA são a verdadeira força motriz por trás do desenvolvimento de IA, e a equipe WizardLM só quer ser creditada quando seu trabalho for usado para treinar outros modelos de IA.

A empresa por trás do Phind , no entanto, nega ter usado o WizardLM para construir o modelo, embora a equipe do WizardLM tenha evidências que comprovem que seu trabalho foi de fato usado para criar o modelo Phind de terceiros.

WizardLM e Phind: uma primeira rivalidade documentada entre modelos de IA

De acordo com WizardLM :

  • Phind usa um conjunto de dados chamado WizardCoder estilo conduzido a partir do método WizardCoder Evol-Instruct para treinar seu modelo V1 Code Llama.
  • Em seguida, eles continuam a usar métodos de um modelo WizardCoder para treinar seu modelo V2.
  • Eles não reconhecem o uso e afirmam não usar nada do WizardCoder.

Novamente, não usamos o modelo deles. Nosso modelo v1 (lançado antes do WizardCoder) foi treinado em um conjunto de dados estilo WizardCoder que nós mesmos criamos e esta foi a nomenclatura interna do modelo.

Equipe Phind

Algumas pessoas sugeriram que uma parceria ou colaboração entre as duas partes faria mais para promover o desenvolvimento da IA ​​do que discutir sobre isso. A verdade é que o desenvolvimento de IA é principalmente de código aberto, o tempo todo, então os modelos terão padrões de treinamento semelhantes, se não exatos.

No entanto, se o seu modelo de IA for treinado no padrão de treinamento de outro modelo, então é justo dar crédito ao trabalho. Afinal, esta poderá ser a base de uma parceria longa e frutífera.

O que você acha dessa situação?

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *