Microsoft desidera che gli utenti interagiscano con elementi, come persone e oggetti, mentre guardano contenuti video
Microsoft ha recentemente depositato un brevetto che descrive una tecnologia in grado di consentire alle persone di rilevare, identificare e interagire con precisione con elementi, come persone e oggetti, durante la visione di contenuti video.
Il brevetto, chiamato Detecting Prominence of Objects in Video Information , descrive in dettaglio come questa tecnologia verrebbe utilizzata per facilitare lo shopping interattivo, ma anche il tracciamento e l’identificazione, in un sistema che sicuramente farebbe venire i brividi lungo la schiena.
La tecnologia brevettata, che potete leggere integralmente qui , funziona in questo modo:
- Esiste un sistema di elaborazione dei video che utilizza macchine per trovare e seguire le persone che compaiono nei video.
- Il sistema attribuisce quindi un punteggio a ciascuna persona in base alla sua importanza nei video, per creare un elenco di punteggi.
- Il punteggio di una persona mostra quanto può interessare agli spettatori. Ad esempio, il punteggio di una persona mostra, in parte, quanto appare nei video.
- Il sistema fornisce i punteggi in base alle informazioni specifiche di ciascuna persona. Il sistema ricava queste informazioni sommando caratteristiche che appartengono a una determinata persona.
La tecnologia potrebbe essere utilizzata in una varietà di applicazioni. Potrebbe essere utilizzato per rintracciare un determinato prodotto, ad esempio un maglione indossato da un personaggio di un film, consentendo effettivamente all’utente di identificarlo e salvare le informazioni per un uso successivo, come puoi vedere nell’immagine qui sotto.
Tuttavia, può anche essere utilizzato per rilevare e identificare con precisione persone, sia pubbliche che private, accedendo a un database e cercando volti simili.
Un componente di rilevamento dei volti determina le identità delle persone che appaiono nelle informazioni video riconoscendo i loro volti. Ad esempio, in alcune implementazioni, il componente di rilevamento dei volti determina se qualcuno degli individui che compaiono nelle informazioni video è stato precedentemente identificato come persone pubbliche, come celebrità o politici.
Uno degli aspetti più inquietanti di questo strumento sarebbe la sua capacità di catturare le emozioni di ogni volto, utilizzando contenuti audio e video per mettere insieme una mappa delle emozioni espresse dai soggetti del video.
Il componente di rilevamento delle emozioni rileva le emozioni di interesse determinando se le informazioni audio contengono suoni predeterminati indicativi di tali emozioni.
In quanto tale, la tecnologia potrebbe essere utilizzata da vari soggetti, dalle imprese e società agli utenti abituali, e/o anche dai dipartimenti di polizia, per inserire prodotti e persone nei contenuti video e successivamente rilevare e identificare tali prodotti e persone, utilizzando la stessa tecnologia. .
Microsoft ha depositato numerosi brevetti, come quello che descrive una tecnologia che renderebbe iperrealistiche le riunioni di Teams , ma non molti vedono la luce.
Tuttavia, poiché le piattaforme di streaming video stanno prendendo piede e i contenuti video sono la forma predominante di media, con piattaforme come TikTok, Instagram e altri, una tecnologia come questa rappresenterebbe sicuramente un punto di svolta e potrebbe rivoluzionare il modo in cui consumare contenuti video.
Ma è abbastanza inquietante.
Lascia un commento