Hugging Face 的 AI 代碼產生器 Starcoder 2 將在大多數現代 GPU 上運行
要知道什麼
- Hugging Face 與 Service Now 和 Nvidia 合作發布了 StarCoder 2。
- 由 AI 驅動的程式碼產生器具有三種變體(具有不同的參數大小),由 Service Now、Hugging Face 和 Nvidia 訓練,其中前兩種將在大多數現代消費級 GPU 上運行。
- 據報道,StarCoder 2 是最高效的 AI 程式碼產生器,專為想要快速建置應用程式且不犧牲品質的開發人員而設計。
基於人工智慧的程式碼產生器受到了開發人員的廣泛關注。儘管大多數此類工具遠非完美,例如 Amazon 的 CodeWhisperer 和 GitHub Copilot,但對其替代品的需求卻與日俱增。幸運的是,Hugging Face 與 Service Now 和 Nvidia 合作,透過其最新版本的 StarCoder 來拯救世界,StarCoder 是一款開源程式碼產生器,現代 GPU 運作起來沒有問題。這就是您需要了解的全部內容。
什麼是 StarCoder 2
Starcoder 2 最初由人工智慧新創公司 Hugging Face 開發,是一個大型程式語言模型系列,具有以下三種變體:
- 由 Service Now 訓練的 StarCoder2-3B 模型(具有 30 億個參數)。
- Hugging Face 訓練的 StarCoder2-7B 模型(具有 70 億個參數)。
- 由 Nvidia 訓練的 StarCoder2-15B 模型(具有 150 億個參數)。
所有三個模型均在 Stack V2 上進行訓練,這是一個新的程式碼資料集,比第一次迭代大七倍,具有先進的技術來理解程式語言和圍繞程式原始碼的討論。
然而,只有前兩個變體能夠在大多數現代消費級 GPU 上運行。造成這種情況的部分原因可能是因為它們都接受了 17 種程式語言的培訓,而 Starcoder2-15B 則接受了 600 多種程式語言(由 Nvidia 提供)的培訓。
儘管如此,即使是最小的模型(由 Service Now 訓練)也與上一次迭代的最佳模型一樣好,甚至更好。
StarCoder 2 與其他 AI 代碼產生器相比如何
與大多數 AI 程式碼產生器一樣,StarCoder 2 將提供完成程式碼行、總結程式碼片段的建議,並在出現提示時將其提取出來。據報道,它的效率也更高,並且在性能方面也比其他程式碼產生器更具優勢。
此外,據說 StarCoder 2 只需幾個小時即可在本地部署,學習開發人員的源代碼,並可用於創建應用程式和聊天機器人。它也被認為是比其他一些更道德的人工智慧程式碼產生器,主要是因為它是根據 Software Heritage 許可的資料進行訓練的。
需要注意的一個重要警告是,StarCoder 2 的授權 BigCode Open RAIL-M 1.0 可能會給開發人員帶來一系列挑戰,因為它不允許完全開放地自由使用程式碼產生器。為了確保遵守法律法規,例如《歐盟人工智慧法案》,已經實施了某些限制。
發佈留言