El equipo de WizardLM dice que un modelo de IA de terceros les robó el trabajo

El equipo de WizardLM dice que un modelo de IA de terceros les robó el trabajo

Y su reputación ha crecido tanto que parece que el proceso de entrenamiento de WizardLM se ha replicado en un modelo de IA de terceros, llamado Phind. Pero aquí está el truco: el equipo detrás de WizardLM, financiado por Microsoft, afirma que el equipo de Phind robó todo su trabajo, sin siquiera darles crédito.

Si recuerdas, WizardLM es un modelo de código abierto que puedes utilizar para entrenar tu propio modelo de IA. Sin embargo, las asociaciones de IA son la verdadera fuerza impulsora detrás del desarrollo de la IA, y el equipo de WizardLM solo quiere recibir crédito cuando su trabajo se utiliza para entrenar otros modelos de IA.

La empresa detrás de Phind , sin embargo, niega haber utilizado WizardLM para construir el modelo, a pesar de que el equipo de WizardLM tiene pruebas que demuestran que su trabajo se utilizó efectivamente para crear el modelo Phind de terceros.

WizardLM y Phind: una primera disputa documentada entre modelos de IA

Según WizardLM :

  • Phind utiliza un conjunto de datos denominado conjunto de datos estilo WizardCoder realizado a partir del método WizardCoder Evol-Instruct para entrenar su modelo V1 Code Llama.
  • Luego continúan usando métodos de un modelo WizardCoder para entrenar su modelo V2.
  • No reconocen el uso y afirman que no utilizan nada de WizardCoder.

Una vez más, no utilizamos su modelo. Nuestro modelo v1 (lanzado antes de WizardCoder) se entrenó en un conjunto de datos estilo WizardCoder que creamos nosotros mismos y esta fue la nomenclatura interna del modelo.

Equipo Phind

Algunas personas sugirieron que una asociación o colaboración entre las dos partes haría más para avanzar en el desarrollo de la IA que discutir al respecto. La verdad es que el desarrollo de la IA es mayoritariamente de código abierto todo el tiempo, por lo que los modelos tendrán patrones de entrenamiento similares, si no exactos.

Sin embargo, si su modelo de IA está entrenado con el patrón de entrenamiento de otro modelo, entonces es justo darle crédito al trabajo. Al fin y al cabo, esta podría ser la base de una asociación larga y fructífera.

¿Qué opinas de esta situación?

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *