Microsoft Kosmos-2: hoe AI kan interageren met de wereld
Microsoft heeft de laatste tijd veel geld gestoken in het financieren van AI-onderzoek. Orca 13B is open source voor het publiek nadat een team van onderzoekers, samengesteld en gefinancierd door Microsoft, het heeft gebouwd.
LongMem is de hoop van Microsoft op onbeperkte contextlengte in AI-modellen. En het is ook een product van onderzoek dat wordt gefinancierd door de in Redmond gevestigde technologiegigant.
Phi-1 , een nieuw taalmodel voor coderen, is in staat zelfstandig kennis te leren en te ontwikkelen. Microsoft financierde het onderzoek ervoor.
En het lijkt erop dat Embodiment AI de volgende zoektocht is in AI-ontwikkeling. Maar Microsoft heeft misschien wel het antwoord met een ander onderzoek naar AI. Deze keer gaat het over Kosmos-2 , een nieuw AI-model dat de basis legt voor Embodiment AI.
Microsoft’s Kosmos-2 is het prototype van Embodiment AI
Misschien is dit de eerste keer dat u over Embodiment AI hoort. Nou, de naam is op zich al behoorlijk suggestief. Dus wat is Embodiment AI, vraag je je misschien af?
Uitvoeringsvorm AI is een gebied van kunstmatige intelligentie dat zich richt op de ontwikkeling van intelligente agenten die een fysiek lichaam hebben en op een zinvolle manier met de wereld kunnen communiceren.
Met andere woorden, als AI een lichaam zou hebben en zou bewegen, dan zou het hiervan kunnen leren en kunnen reageren en antwoorden kunnen vormen, en dienovereenkomstig kunnen communiceren. En als je denkt dat we sciencefiction-territorium betreden, houd stand. AI moest altijd fysiek worden.
Volgens het onderzoek is Kosmos-2 een taalmodel dat nieuwe mogelijkheden biedt voor het waarnemen van objectbeschrijvingen (bijv. begrenzingskaders) en het aarden van tekst in de visuele wereld. De onderzoekers vertegenwoordigden verwijzende uitdrukkingen als links in Markdown, dat wil zeggen “tekstbereik”, waarbij objectbeschrijvingen reeksen locatietokens zijn.
Samen met multimodale corpora construeerden ze grootschalige gegevens van geaarde beeld-tekstparen (GrIT genoemd) om het model te trainen. Naast de integratie van de bestaande mogelijkheden van MLLM’s in Kosmos-2, integreert het model ook de aardingsmogelijkheden in applicaties.
Wat vind je van Microsoft Kosmos 2? Zou het goed zijn als AI een fysieke vorm heeft of niet? Laat het ons weten in de comments hieronder.
Geef een reactie