Microsoft Kosmos-2:人工智能如何與世界互動

Microsoft Kosmos-2:人工智能如何與世界互動

微軟最近投入了大量預算來資助人工智能研究。Orca 13B由微軟組建並資助的一組研究人員構建後,向公眾開源。

LongMem是微軟希望在 AI 模型中實現無限上下文長度的目標。它也是由這家總部位於雷德蒙德的科技巨頭資助的研究產品。

Phi-1是一種新的編碼語言模型,能夠自行學習和發展知識。微軟資助了這項研究。

看來“體現型人工智能”是人工智能開發的下一個目標。但微軟可能會通過另一項人工智能研究找到答案。這次是關於Kosmos-2 的,這是一個新的 AI 模型,為 Implementing AI 奠定了基礎。

微軟的 Kosmos-2 是 Implementing AI 原型

也許這是您第一次聽說“體現人工智能”。嗯,這個名字本身就很有啟發性。那麼您可能會問,什麼是“體現人工智能”?

體現型人工智能是人工智能的一個領域,專注於開發具有物理身體並能夠以有意義的方式與世界交互的智能體。

換句話說,如果人工智能有身體並且會移動,那麼它就可以從中學習並做出反應並形成答案,並進行相應的交互。如果您認為我們進入了科幻小說領域,請堅持到底。人工智能總是應該成為物理的。

根據這項研究,Kosmos-2 是一種語言模型,能夠實現感知對象描述(例如邊界框)並將文本紮根於視覺世界的新功能。研究人員將引用表達式表示為 Markdown 中的鏈接,即“文本範圍”,其中對象描述是位置標記的序列。

他們與多模態語料庫一起構建了大規模的基礎圖像文本對數據(稱為 GrIT)來訓練模型。除了集成 Kosmos-2 中 MLLM 的現有功能外,該模型還將接地功能集成到應用中。

您對 Microsoft Kosmos 2 有何看法?人工智能是否有實體形態好不好?請在下面的評論部分告訴我們。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *