L’équipe de WizardLM affirme qu’un modèle d’IA tiers a volé son travail

L’équipe de WizardLM affirme qu’un modèle d’IA tiers a volé son travail

Et sa réputation s’est tellement développée qu’il semble que le processus de formation de WizardLM ait été reproduit dans un modèle d’IA tiers, appelé Phind. Mais voici le piège : l’équipe financée par Microsoft derrière WizardLM affirme que l’équipe Phind a volé tout leur travail, sans même les créditer.

Si vous vous en souvenez, WizardLM est un modèle open source qui peut être utilisé pour entraîner votre propre modèle d’IA. Cependant, les partenariats en matière d’IA sont le véritable moteur du développement de l’IA, et l’équipe WizardLM souhaite simplement être créditée lorsque son travail est utilisé pour former d’autres modèles d’IA.

La société derrière Phind nie cependant avoir utilisé WizardLM pour construire le modèle, même si l’équipe WizardLM dispose de preuves prouvant que son travail a effectivement été utilisé pour créer le modèle Phind tiers.

WizardLM et Phind : une première querelle documentée entre modèles d’IA

D’après WizardLM :

  • Phind utilise un ensemble de données nommé WizardCoder, réalisé à partir de la méthode WizardCoder Evol-Instruct pour entraîner son modèle V1 Code Llama.
  • Ensuite, ils continuent à utiliser les méthodes d’un modèle WizardCoder pour entraîner leur modèle V2.
  • Ils ne reconnaissent pas l’utilisation et prétendent ne rien utiliser de WizardCoder.

Encore une fois, nous n’avons pas utilisé leur modèle. Notre modèle v1 (publié avant WizardCoder) a été formé sur un ensemble de données de style WizardCoder que nous avons créé nous-mêmes et c’était la nomenclature interne du modèle.

L’équipe Phind

Certaines personnes ont suggéré qu’un partenariat ou une collaboration entre les deux parties ferait plus pour faire progresser le développement de l’IA que des disputes à ce sujet. La vérité est que le développement de l’IA est principalement open source, en permanence, de sorte que les modèles auront des modèles de formation similaires, voire exacts.

Cependant, si votre modèle d’IA est entraîné sur le modèle d’entraînement d’un autre modèle, il est alors tout à fait juste de créditer le travail. Après tout, cela pourrait être la base d’un partenariat long et fructueux.

Que pensez-vous de cette situation ?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *