Come utilizzare OpenAI Whisper su PC Windows

2023/05/30

OpenAI Whisper trasformerà la tua voce in testo sui dispositivi Windows 11/10. Poiché questo programma è in fase di sviluppo da parte di OpenAI , dovrebbe essere chiaro che l’intelligenza artificiale è al centro di ciò che può fare. E se ChatGPT è qualcosa su cui basarsi, puoi fidarti che la tecnologia AI che alimenta Whisper è di prim’ordine.

Inoltre, dobbiamo dire che Whisper è perfetto per coloro che vogliono convertire la voce in testo ma hanno pochi fondi. Questo perché l’applicazione basata sull’intelligenza artificiale può essere scaricata e utilizzata gratuitamente.

Quali sono alcuni degli aspetti negativi di Whisper?

L’installazione è probabilmente l’unica parte che non piacerà alla maggior parte degli utenti. Questo perché non è semplice. Richiede un processo più lungo di quello che è considerato normale e questo potrebbe essere un problema per gli utenti inesperti.

Inoltre, le GPU AMD non sono supportate. Questo perché quelle GPU non supportano CUDA, uno strumento creato da NVIDIA ed è considerato una piattaforma di elaborazione parallela e un modello di programmazione.

Così com’è, CUDA supporta solo GPU NVIDIA e l’alternativa più vicina ad esso dal punto di vista di AMD, sono Radeon Compute Platform e OpenCL. Sospettiamo che OpenAI supporterà tali piattaforme in futuro, quindi per ora bisogna aspettare.

Tuttavia, dobbiamo sottolineare che CUDA è più maturo rispetto ad altri, quindi questo potrebbe essere il motivo principale per cui OpenAI ha deciso di rinunciare per il momento a OpenCL e Radeon Compute Platform.

Come scaricare e installare OpenAIs Whisper su Windows 11/10

L’installazione e l’utilizzo di Whisper su un computer richiede l’uso di PowerShell e l’installazione di strumenti chiave come Python, ecc. I passaggi coinvolti sono:

Scarica e installa Python
Scaricare e installare PIP
Scarica e installa Chocolatey
Scarica e installa FFMPEG
Scarica e installa Whisper
Converti l’audio in testo con Whisper

1] Scarica e installa Python

Se non lo hai già fatto, visita il sito Web ufficiale di Python , quindi scarica e installa l’applicazione.

Tieni presente che Python non ha un’interfaccia utente, quindi tutto viene eseguito tramite la riga di comando.

2] Scarica e installa PIP

Ecco il punto, se stai usando Python 2.7.9 o versioni successive, PIP è installato per impostazione predefinita. Questo perché PIP è integrato nel programma di installazione di Python, quindi suggeriamo di scaricare l’ultima versione perché le versioni precedenti non saranno supportate per sempre.

3] Scarica e installa Chocolatey

Infine, devi dedicare del tempo a scaricare il pacchetto Chocolatey sul tuo computer.

Per fare ciò, apri PowerShell sul tuo computer come amministratore .

Dobbiamo assicurarci che Get-ExecutionPolicy non sia limitato, quindi esegui il seguente comando e premi il tasto Invio.

Get-ExecutionPolicy

Se vedi Limitato, esegui:

Set-ExecutionPolicy AllSigned

Set-ExecutionPolicy Bypass -Scope Process

Se tutto va secondo i piani, vedrai il seguente messaggio:

Assicurati di premere il tasto Invio subito dopo aver incollato per eseguire il comando. La politica di esecuzione ti aiuta a proteggerti da script di cui non ti fidi. La modifica dei criteri di esecuzione potrebbe esporre l’utente ai rischi per la sicurezza descritti nell’argomento della guida sui criteri di esecuzione all’indirizzo https:/go.microsoft.com/fwlink/?LinkID=135170.

Digita Y per sì, quindi fai clic sul tasto Invio per rendere ufficiali le modifiche.

Ora devi incollare il seguente comando in PowerShell e, come al solito, premere il tasto Invio:

Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

Aspetta pazientemente che Chocolatey sia installato sul tuo computer.

4] Scarica e installa FFMPEG

Il passo successivo, quindi, è scaricare e installare FFMPEG . Questo può essere fatto solo se Chocolatey è installato. Inoltre, l’installazione deve essere eseguita tramite lo strumento PowerShell.

Copia e incolla il seguente comando in PowerShell e seleziona Invio:

choco install ffmpeg

Devi anche installare la versione Python di FFMPEG tramite questo comando:

pip3 install python-ffmpeg

5] Scarica e installa Whisper

Infine, usa il seguente comando per ottenere Whisper sul tuo computer:

pip3 install git+https://github.com/openai/whisper.git

Ora tutto dovrebbe muoversi nella giusta direzione, quindi congratulati con te stesso.

6] Converti l’audio in testo con Whisper

Con tutto installato e pronto per l’uso, è giunto il momento di trascrivere. Poiché non esiste una GUI , il prompt dei comandi è il tuo unico amico.

Ora, prima di iniziare, devi registrare un file audio, oppure prepararne uno già salvato sul tuo computer.

Quindi diciamo, ad esempio, di avere un file audio chiamato TWCAudio.mp3 , memorizzato in una cartella chiamata TWCThings .

La prima cosa da fare qui è cambiare la directory usando questo comando:

cd C:\TWCThings

Esegui lo strumento Whisper sul file con questo comando:

whisper --model base --language gr --task translate TWCAudio.mp3

Torna alla cartella e cerca un file di testo. All’interno di quel file c’è l’audio tradotto in forma di testo.

Puoi eseguire Whisper localmente?

Sì, è possibile eseguire Whisper localmente sul tuo personal computer o da una piattaforma cloud che supporta l’esecuzione di questa applicazione di riconoscimento vocale open source.

Whisper AI può essere utilizzato offline?

Lo strumento Whisper AI supporta l’utilizzo offline, ma funzionerà meglio su un computer potente e veloce. Un computer più debole costringerà l’utente ad attendere molto tempo per la trascrizione dei file, e tutto dipende dalla lunghezza della registrazione audio.