Hugging Face의 AI 코드 생성기 Starcoder 2는 대부분의 최신 GPU에서 실행됩니다.
알아야 할 사항
- Hugging Face는 Service Now 및 Nvidia와 협력하여 StarCoder 2를 출시했습니다.
- AI 기반 코드 생성기는 Service Now, Hugging Face 및 Nvidia에서 훈련한 세 가지 변형(매개변수 크기가 다름)으로 제공되며, 그 중 처음 두 개는 대부분의 최신 소비자 GPU에서 실행됩니다.
- StarCoder 2는 품질 저하 없이 신속하게 애플리케이션을 구축하려는 개발자를 위해 설계된 가장 효율적인 AI 코드 생성기로 보고되었습니다.
AI 기반 코드 생성기는 개발자들로부터 많은 관심을 받고 있습니다. Amazon의 CodeWhisperer 및 GitHub Copilot과 같은 대부분의 도구는 완벽과는 거리가 멀지만 대안에 대한 수요는 날로 증가하고 있습니다. 다행스럽게도 Hugging Face는 Service Now 및 Nvidia와 협력하여 최신 GPU에서 실행하는 데 문제가 없는 오픈 소스 코드 생성기인 StarCoder의 최신 버전을 통해 문제를 해결하기 위해 왔습니다. 여기에 대해 알아야 할 모든 것이 있습니다.
스타코더 2란?
AI 스타트업 Hugging Face가 처음 개발한 Starcoder 2는 다음 세 가지 변형으로 제공되는 코드용 대규모 언어 모델 제품군입니다.
- Service Now로 훈련된 StarCoder2-3B 모델(30억 개의 매개변수 포함)
- Hugging Face로 훈련된 StarCoder2-7B 모델(70억 개의 매개변수 포함)
- Nvidia에서 훈련한 StarCoder2-15B 모델(150억 개의 매개변수 포함)
세 가지 모델 모두 첫 번째 반복보다 7배 더 큰 새로운 코드 데이터세트인 The Stack V2에서 프로그래밍 언어와 프로그램 소스 코드에 대한 토론을 이해하는 고급 기술을 사용하여 교육되었습니다.
그러나 대부분의 최신 소비자 GPU에서는 처음 두 가지 변형만 실행할 수 있습니다. 그 이유 중 하나는 둘 다 17개 프로그래밍 언어에 대해 교육을 받은 반면 Starcoder2-15B는 600개 이상의 프로그래밍 언어(Nvidia에서)에 대해 교육을 받았기 때문일 수 있습니다.
그럼에도 불구하고 (Service Now로 훈련된) 가장 작은 모델이라도 이전 반복의 최고 모델보다 낫지는 않더라도 동일합니다.
StarCoder 2는 다른 AI 코드 생성기와 어떻게 비교됩니까?
대부분의 AI 코드 생성기와 마찬가지로 StarCoder 2는 코드 라인을 완성하고, 코드 비트를 요약하고, 메시지가 표시되면 불러오기 위한 제안을 제공합니다. 보고에 따르면 이는 훨씬 더 효율적이며 성능 측면에서도 다른 코드 생성기에 비해 우위를 점합니다.
또한 StarCoder 2는 로컬에 배포되고 개발자의 소스 코드를 학습하며 앱과 챗봇을 만드는 데 사용할 수 있기까지 몇 시간도 걸리지 않는다고 합니다. 또한 다른 것보다 훨씬 더 윤리적인 AI 코드 생성기로 간주됩니다. 주로 Software Heritage에서 라이선스를 받은 데이터에 대해 교육을 받았기 때문입니다.
주목해야 할 한 가지 중요한 주의 사항은 StarCoder 2의 라이선스인 BigCode Open RAIL-M 1.0이 개발자가 원하는 만큼 자유롭게 코드 생성기를 완전히 개방적으로 사용할 수 없도록 허용하지 않기 때문에 개발자에게 자체적인 과제를 안겨줄 수 있다는 것입니다. EU AI법과 같은 법률 및 규정을 준수하기 위해 특정 제한 사항이 구현되었습니다.
답글 남기기