微軟新的編碼LLM將在GPT 4之後推出

微軟新的編碼LLM將在GPT 4之後推出

微軟在人工智能開發方面確實邁出了一大步。上個月,人工智能在微軟 Build 大會上佔據了最前沿,這家總部位於雷德蒙德的科技公司甚至宣布Copilot 將登陸 Windows 11。作為本機內置應用程序,滿足您所需的一切,

AI 也將通過其 Recap Ai 工具引入 Microsoft Teams 。微軟的許多其他工具都將使用人工智能,包括 Microsoft Fabric。

但微軟似乎也在資助人工智能研究。就在最近,這家科技巨頭宣布Orca 13B 將開源。LongMem是人工智能研究中的另一個優點:它是無限上下文長度的答案。

現在,人工智能研究又迎來了另一個重大突破,當然,這個突破來自微軟。據報導,新的 1.3B 參數模型編碼 LLM(稱為 phi-1)在僅 4 天的訓練中就超越了 GPT 3.5。

什麼是 phi-1?它如何優於 GPT?

Phi-1是一種新的 1.3B 參數代碼語言模型

此外,儘管與現有模型相比,訓練的令牌要少得多,但 phi-1 仍然具有很大的潛力。

作為語言模型,HumanEval 的改進是 phi-1 最大的成就。調整後,phi-1 成功執行了微調數據集中未包含的任務。這意味著模型適應並改進了微調過程。

最值得注意的是,phi-1 重新組織並鞏固了預訓練期間獲得的知識,儘管這些知識一開始並沒有明確存在。

簡而言之,phi-1 不僅在訓練中學習,而且還自行擴展知識。它在各個層面上都超越了 GPT 3.5,小模型戰勝 GPT 4 等大模型只是時間問題。

您對這個新的人工智能模型有何看法?您認為人工智能研究將走向何方?請務必在下面的評論部分告訴我們您的意見。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *