WizardLM 팀은 타사 AI 모델이 작업을 훔쳤다고 말합니다.

WizardLM 팀은 타사 AI 모델이 작업을 훔쳤다고 말합니다.

그리고 그 명성이 너무 높아져서 WizardLM의 교육 프로세스가 Phind라는 타사 AI 모델에 복제된 것 같습니다. 하지만 여기에 문제가 있습니다. WizardLM 뒤에 있는 Microsoft 자금 지원 팀은 Phind 팀이 자신의 작업을 인정하지도 않은 채 모든 작업을 훔쳤다고 주장합니다.

기억하신다면 WizardLM은 자체 AI 모델을 훈련하는 데 사용할 수 있는 오픈 소스 모델입니다. 그러나 AI 파트너십은 AI 개발의 진정한 원동력이며 WizardLM 팀은 자신의 작업이 다른 AI 모델을 훈련하는 데 사용될 때 인정받기를 원합니다.

그러나 Phind 뒤에 있는 회사는 WizardLM 팀이 그들의 작업이 실제로 타사 Phind 모델을 만드는 데 사용되었다는 증거를 가지고 있음에도 불구하고 WizardLM을 사용하여 모델을 구축했다는 사실을 부인합니다.

WizardLM과 Phind: AI 모델 간의 최초의 문서화된 불화

WizardLM에 따르면 :

  • Phind는 WizardCoder Evol-Instruct 메서드에서 수행된 WizardCoder 스타일 데이터 세트라는 데이터를 사용하여 V1 Code Llama 모델을 교육합니다.
  • 그런 다음 WizardCoder 모델의 방법을 계속 사용하여 V2 모델을 교육합니다.
  • 그들은 사용법을 인정하지 않으며 WizardCoder에서 아무것도 사용하지 않는다고 주장합니다.

다시 말하지만, 우리는 그들의 모델을 사용하지 않았습니다. WizardCoder 이전에 출시된 v1 모델은 우리가 직접 만든 WizardCoder 스타일 데이터세트로 훈련되었으며 이것이 모델의 내부 명명법이었습니다.

핀드 팀

어떤 사람들은 AI 개발에 대해 논쟁을 벌이기보다 두 당사자 간의 파트너십이나 협력이 AI 개발을 발전시키는 데 더 많은 도움이 될 것이라고 제안했습니다. 사실 AI 개발은 항상 대부분 오픈 소스이므로 모델은 정확한 훈련 패턴은 아니더라도 유사할 것입니다.

그러나 AI 모델이 다른 모델의 훈련 패턴으로 훈련된 경우 작업에 대한 공로를 인정하는 것이 공정합니다. 결국 이는 길고 유익한 파트너십의 기초가 될 수 있습니다.

이 상황에 대해 어떻게 생각하시나요?

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다