GPTZero è accurato? Può rilevare la chat GPT? Ecco cosa hanno rivelato i nostri test

GPTZero è accurato? Può rilevare la chat GPT? Ecco cosa hanno rivelato i nostri test

ChatGPT ha preso d’assalto il mondo da quando ha fatto notizia nel novembre 2022. Le persone hanno iniziato a usarlo nella loro routine quotidiana in quanto può essere di grande aiuto per ottenere risposte logiche alle tue domande sulle cose intorno a te. Con la sua crescente popolarità, lo strumento ha ispirato modelli linguistici più ampi, anche da Google e Meta, che possono essere ugualmente motivo di preoccupazione in quanto entusiasmanti.

Nei mesi trascorsi dal suo lancio, ci sono stati diversi casi in cui gli studenti hanno abusato di ChatGPT per creare saggi e inviare compiti, poiché lo strumento può generare contenuti completi con un semplice prompt. Per contrastare l’uso improprio dei contenuti generati dall’intelligenza artificiale, ora c’è un nuovo strumento: GPTZero che gli educatori e i giornalisti possono utilizzare per verificare se un pezzo di scrittura è stato creato utilizzando l’intelligenza artificiale o meno.

In questo post, spiegheremo cos’è GPTZero, come puoi usarlo e fino a che punto puoi fidarti di esso per rilevare e distinguere in modo affidabile un articolo umano dal contenuto generato dall’intelligenza artificiale.

Cos’è GPTZero?

Sviluppato dallo studente della Princeton University Edward Tian, ​​GPTZero è un software che utilizza l’analisi statistica per rilevare se un testo è stato scritto da un essere umano o è stato copiato da un generatore di contenuti AI come ChatGPT. Lo strumento è stato progettato per aiutare le persone nell’istruzione, nel giornalismo e in altri settori a combattere il plagio dell’IA e sapere quando stanno visualizzando testi generati da modelli di linguaggio di grandi dimensioni (LLM), uno dei quali è ChatGPT.

Con la crescente popolarità di strumenti come ChatGPT, molte persone hanno abusato del contenuto scritto generato dai servizi di intelligenza artificiale e lo hanno passato come proprio. GPTZero promette di rendere trasparente l’uso dell’IA rilevando la complessità dei testi con due fattori principali: perplessità e raffica.

Perplessità : si riferisce alla misura della casualità del testo di input che GPTZero confronterà con l’aspetto del testo di un modello linguistico. Più alto è questo punteggio, maggiori sono le possibilità che il testo sia stato scritto da un essere umano e non da una macchina.

Burstiness – si riferisce alle distribuzioni di testi in un testo. Mentre il testo generato dall’intelligenza artificiale ha lunghezze uniformi ovunque, quelli scritti da esseri umani possono includere sia frasi lunghe che brevi con schemi fluidi. Più alto è il punteggio Burstiness di un testo, più è probabile che sia stato scritto da un essere umano.

Oltre a determinare se il testo che hai copiato nello strumento è stato scritto da AI o umani, GPTZero può anche rilevare parti del testo che potrebbero essere state generate utilizzando un LLM. Se un articolo è stato scritto utilizzando sia l’intelligenza artificiale che il lavoro umano, lo strumento evidenzierà le parti che ritiene possano essere create utilizzando l’intelligenza artificiale. In alcuni casi, GPTZero può anche determinare che il testo di input è “più probabilmente scritto da persone” ma include “frasi con poche perplessità” in modo da poterle migliorare.

Come puoi utilizzare GPTZero?

Sebbene tu possa richiedere un account per utilizzare ChatGPT, utilizzare GPTZero è abbastanza semplice in quanto non è necessario un account o un abbonamento per verificare se un testo è stato scritto da AI. Ciò significa che non devi condividere le tue informazioni personali, come il tuo indirizzo e-mail o il numero di telefono, per iniziare a utilizzare il servizio. Tutto ciò di cui hai bisogno per usare GPTZero sono:

  • Un dispositivo come un computer o un telefono in grado di connettersi a Internet
  • Una connessione Internet attiva
  • Un browser Web per avviare il sito Web GPTZero

Dopo aver risolto questi requisiti, avvia GPTZero su un browser web su uno qualsiasi dei tuoi dispositivi. Lo stiamo usando su Firefox su un Mac in questo caso, ma puoi usare qualsiasi browser su qualsiasi computer o telefono.

Quando GPTZero si carica, scorri verso il basso fino alla sezione Provalo . Nella casella di testo visibile sotto di essa, copia e incolla il testo che vuoi verificare per plagio AI. Il testo che incolli qui dovrebbe essere lungo almeno 250 caratteri affinché il rilevatore lo analizzi.

Puoi anche controllare i testi di un documento che hai sul tuo dispositivo per il coinvolgimento dell’IA facendo clic su Sfoglia sotto la casella di testo. Da lì, puoi caricare un file attraverso questi formati supportati: PDF, DOCX e TXT per consentire a GPTZero di analizzarlo.

Dopo aver inserito un testo che desideri controllare, fai clic su Ottieni risultati .

GPTZero controllerà istantaneamente il testo che hai condiviso e ne determinerà i risultati. Otterrai il risultato di seguito che ti farà sapere se il testo è stato scritto da un essere umano o è stato generato dall’intelligenza artificiale.

In base al testo inserito, potresti ottenere uno dei seguenti risultati:

  • È probabile che il tuo testo sia scritto interamente da un essere umano.
  • È probabile che il tuo testo sia stato scritto interamente da Al.
  • Il tuo testo è molto probabilmente scritto da persone ma ci sono alcune frasi con poche perplessità.
  • Il tuo testo può includere parti scritte da Al.

Vedrai maggiori dettagli sui risultati mentre scorri verso il basso. Se GPTZero rileva un coinvolgimento dell’IA nel tuo testo, la parte che lo strumento ha determinato come scritta dall’IA verrà evidenziata in giallo.

Quando scorri ulteriormente, vedrai un’analisi dettagliata del testo di input con le sue misurazioni di perplessità e raffica nella sezione “Statistiche”. Queste misure saranno indicate in numeri e vedrai come va in un grafico a barre. Più basso è il punteggio di un testo in entrambi i valori di Perplessità e Burstiness, maggiore è la possibilità che sia stato scritto con l’aiuto di un generatore di contenuti AI.

Alla fine della sezione Statistiche, GPTZero mostrerà anche la frase con la maggiore perplessità e il suo punteggio individuale. Ciò non significa necessariamente che questa parte del testo sia stata scritta da esseri umani, ma è un indicatore del fatto che questa parte ha la minima possibilità di essere scritta utilizzando l’intelligenza artificiale.

GPTZero è accurato?

Versione TL; DR : nel nostro tempo limitato di test del software, siamo stati in grado di dedurre che GPTZero determina con precisione i testi generati da ChatGPT quasi sempre. E quando si tratta di controllare testi scritti da umani, è lì che si incontra un posto di blocco.

Sebbene GPTZero sia in grado di rilevare facilmente i contenuti generati dall’IA, contrassegna anche i contenuti scritti da persone come “scritti dall’IA” anche quando non lo sono. Questo supera lo scopo di utilizzare questo strumento per verificare la presenza di contenuti generati dall’intelligenza artificiale poiché GPTZero può anche contrassegnare falsi positivi quando il risultato effettivo è negativo.

Versione completa : Per verificare se GPTZero è in grado di determinare se un testo è generato dall’intelligenza artificiale o scritto da esseri umani, lo usiamo noi stessi. Prima di rivelare quanto sia accurato lo strumento, devi prima capire come lo abbiamo testato in modo da avere un’idea generale di come funziona il servizio.

Come abbiamo testato GPTZero

Per mettere alla prova a fondo GPTZero, abbiamo utilizzato i testi dei nostri articoli esistenti su Nerdschalk.com e copiato diverse sezioni di testi da questi articoli come l’introduzione e le guide. All’interno di GPTZero, abbiamo incollato gli estratti copiati da quegli articoli e li abbiamo controllati per il coinvolgimento dell’IA.

Insieme ai testi scritti dall’uomo (i nostri contenuti), volevamo anche verificare se GPTZero rileva i testi generati tramite l’intelligenza artificiale. Per questo, abbiamo utilizzato ChatGPT e l’abbiamo utilizzato per creare introduzioni e guide per gli stessi argomenti che abbiamo copiato i testi da Nerdschalk.

Per darti un esempio, abbiamo chiesto a ChatGPT di crearci un’introduzione per questo post: Come separare le celle in Google Documenti.

Quando il servizio ha generato una risposta alla nostra domanda, abbiamo copiato il testo scritto da AI e lo abbiamo incollato nella casella di testo di GPTZero per verificarne la legittimità.

Allo stesso modo, abbiamo copiato l’introduzione dal nostro post e l’abbiamo verificata su GPTZero per il coinvolgimento dell’IA.

Per assicurarci di poter determinare la coerenza dei risultati di GPTZero, lo abbiamo testato con almeno 10 estratti di testi ciascuno dai nostri post e quelli che abbiamo chiesto a ChatGPT di creare sullo stesso argomento dei nostri post. Questo è ciò che abbiamo trovato.

GPTZero rileva i testi scritti da ChatGPT?

Per uno strumento progettato per rilevare testi scritti utilizzando AI, GPTZero fa davvero un ottimo lavoro nel riconoscere i testi creati utilizzando ChatGPT. Ogni volta che abbiamo copiato il contenuto che abbiamo chiesto a ChatGPT di creare, GPTZero è stato in grado di accertare con precisione che probabilmente era stato scritto con l’aiuto dell’intelligenza artificiale.

Per il testo creato da ChatGPT, GPTZero determinerebbe che l’intero testo è stato scritto dall’intelligenza artificiale o include parti del testo che hanno avuto il coinvolgimento dell’IA. Per aiutarti a capire come ha trovato i testi scritti da AI, GPTZero ti mostrerà i punteggi Perplexity e Burstiness alla fine di ogni risultato.

Per i testi generati dall’intelligenza artificiale, il software ha costantemente rivelato valori di perplessità bassi per indicare che erano più facili da prevedere, cosa che nel caso di un essere umano sarebbe difficile poiché la propria conoscenza lessicale sarà diversa dalle altre e quindi i testi potrebbero sembrare un po’ più casuali. Lo stesso valeva anche per la determinazione del valore Burstiness in quanto i testi generati da ChatGPT avevano un punteggio inferiore, indicando così che le frasi utilizzate erano più uniformi in termini di lunghezza.

Lo strumento isolerebbe anche porzioni di testo che ritiene abbiano la più alta probabilità di essere generate tramite l’intelligenza artificiale. Guarda questo screenshot, ad esempio:

Anche se questa è ancora una piccola scala di esempio, potremmo concludere che GPTZero se la cava abbastanza bene nel contrassegnare i contenuti generati da ChatGPT come scritti da AI.

GPTZero rileva i testi scritti da persone?

Ora, qui è dove incontriamo un posto di blocco. Mentre GPTZero è stato in grado di determinare facilmente che i testi di ChatGPT sono scritti da AI, ha fatto la stessa cosa anche per i testi che abbiamo copiato dai nostri articoli originali di Nerdschalk. Poiché abbiamo utilizzato testi dello stesso argomento che abbiamo chiesto a ChatGPT di creare, GPTZero è stato in grado di rilevare correttamente solo che il testo specifico è stato scritto da un essere umano due volte in dieci tentativi.

In entrambi i casi “riusciti”, abbiamo ottenuto risultati diversi su quanto del testo GPTZero pensa sia stato scritto da noi. Ad esempio, quando abbiamo controllato questo estratto dal nostro post originale, il software ha mostrato un risultato accurato dicendo che probabilmente questo testo è stato scritto interamente da un essere umano.

Tuttavia, quando abbiamo fatto scorrere per verificare i punteggi di Perplessità e Burstiness, i valori (42,5 e 13,4) mostrati erano inferiori a quelli del testo generato da ChatGPT (che erano 46 e 20,8). Ciò significa che anche i parametri utilizzati per determinare il coinvolgimento dell’IA di un testo erano incoerenti, sebbene il risultato fosse accurato in questo caso.

Un altro caso in cui GPTZero ha avuto ragione è stato quando abbiamo copiato parti di testo da questo post di Nerdschalk. A differenza del caso precedente, sebbene lo strumento sia stato in grado di concludere che è stato scritto da un essere umano, ha trovato frasi all’interno dell’estratto con valori di perplessità inferiori. Ha persino evidenziato le frasi che pensava fossero state scritte da AI quando l’intero testo era stato originariamente scritto da noi.

Quando abbiamo confrontato le statistiche di questo testo con il precedente, GPTZero ha mostrato un punteggio di Perplessità simile di 40,2 con un valore di Burstiness leggermente superiore di 17,9.

Per quanto riguarda gli altri risultati, il software ha erroneamente contrassegnato 8 porzioni di testo su 10 che abbiamo scritto come quelle generate dall’intelligenza artificiale. Ad esempio, un’introduzione di questo post originale è stata mostrata come “probabilmente scritta interamente da AI”…

mentre un’altra parte dello stesso post ha rivelato un risultato leggermente diverso come questo:

… il che crea confusione poiché lo stesso estratto ha ottenuto i punteggi di perplessità e raffica più alti di 76,3 e 59,3, più alti di qualsiasi altro testo che abbiamo inviato su GPTZero.

Ciò significa che GPTZero, essendo nella sua fase iniziale, non è in grado di rilevare testi scritti da esseri umani con la stessa precisione con cui rileva i contenuti generati tramite l’intelligenza artificiale.

Quanto è accurato GPTZero?

Durante i nostri approfonditi test del software, siamo giunti alla conclusione che i risultati di GPTZero fossero accettabili nella migliore delle ipotesi, a causa dell’incoerenza dello strumento nel rilevare testi scritti da esseri umani. Nonostante sia stato in grado di leggere e rilevare i contenuti generati da ChatGPT come scritti dall’intelligenza artificiale, l’incapacità del software di riconoscere brevi frasi e testi scritti da esseri umani lo rende uno strumento inaffidabile per educatori o giornalisti per verificare la presenza di plagio di intelligenza artificiale.

Poiché lo scopo di tale strumento è aiutare le persone ad affrontare l’uso non etico della generazione di contenuti AI, GPTZero non può essere utilizzato con un’affidabilità del 100%. Questo non vuol dire che non ci sia spazio per miglioramenti, poiché il riconoscimento dei testi può raggiungere un potenziale più elevato in quanto il software aggiunge più dati da altri modelli linguistici di grandi dimensioni (LLM) per migliorare l’accuratezza del riconoscimento. Per ora, però, puoi usare GPTZero con un pizzico di sale e la tua capacità di distinguere le parole scritte da umani e da una macchina.

Questo è tutto ciò che devi sapere sull’accuratezza di GPTZero.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *