Intelligenza artificiale

Arriva OpenAI o1, il nuovo modello di IA pensante

OpenAI o1 è in grado di ragionare su matematica e scienza, testare diverse strategie e identificare errori mentre affronta compiti complessi. Ma è lento e costoso

di Stefano Silvestri 13 Settembre 2024 08:27

financialounge - ChatGPT intelligenza artificiale Open AI

I chatbot come ChatGPT di OpenAI e Gemini di Google a volte hanno difficoltà con semplici problemi matematici. Il codice che generano spesso presenta errori o è incompleto. Di tanto in tanto, inventano anche le risposte. Ieri sera, però OpenAI ha presentato una nuova versione di ChatGPT che potrebbe risolvere questi difetti. L'azienda di Sam Altman ha infatti dichiarato che il suo chatbot, basato sulla nuova tecnologia di intelligenza artificiale chiamata OpenAI o1, è in grado di "ragionare" su compiti che riguardano la matematica, la programmazione e le scienze.

SI PRENDE IL SUO TEMPO

"Con i modelli precedenti come ChatGPT, fai una domanda e loro rispondono immediatamente", dichiara Jakub Pachocki, capo scienziato di OpenAI. "Questo modello invece si prende il suo tempo. Può riflettere sul problema, in inglese, cercando di scomporlo e di considerare diversi approcci per fornire la risposta migliore".

Durante una dimostrazione, il dottor Pachocki e Szymon Sidor, un esperto tecnico di OpenAI, hanno mostrato il chatbot mentre risolveva un acrostico, un tipo di puzzle più complesso di un normale cruciverba. Il chatbot ha anche risposto a una domanda di chimica a livello di dottorato e diagnosticato una malattia basandosi su un rapporto dettagliato sui sintomi e sulla storia clinica di un paziente.

NUOVA TECNOLOGIA

La nuova tecnologia fa parte di un più ampio sforzo volto a sviluppare un'intelligenza artificiale in grado di ragionare su compiti complessi e di risolvere problemi in modo accurato e logico, attraverso una serie di passaggi discreti, ciascuno dei quali si basa sul precedente. In modo simile a come ragioniamo noi umani, insomma.

Queste tecnologie potrebbero rivelarsi particolarmente utili per i programmatori che utilizzano sistemi di intelligenza artificiale per scrivere codice. E anche aiutare i fisici a generare formule matematiche complesse e a supportare i ricercatori nel campo della sanità nei loro esperimenti.

APPRENDIMENTO PER RINFORZO

Con il debutto di ChatGPT a fine 2022, OpenAI ha dimostrato che le macchine potevano gestire richieste in modo più simile agli esseri umani, rispondere a domande, scrivere tesine e persino generare codice informatico. Le risposte, però, erano talvolta imprecise.

ChatGPT ha imparato le sue capacità analizzando enormi quantità di testo prelevato da Internet, inclusi articoli di Wikipedia, libri e registri di chat. Identificando modelli in tutto quel testo, ha imparato a generarne altro in autonomia.

Il dottor Pachocki, il signor Sidor e i loro colleghi hanno costruito il nuovo sistema di OpenAI utilizzando un processo chiamato apprendimento per rinforzo. Attraverso questo processo, che può durare settimane o mesi, un sistema può imparare comportamenti attraverso tentativi ed errori.

Ad esempio, affrontando vari problemi matematici, può imparare quali metodi portano alla risposta giusta e quali no. Se ripete questo processo su un numero enormemente elevato di problemi, può identificare degli schemi.

MA NON È PERFETTO

Nessuno però s’illuda: il sistema non è necessariamente in grado di ragionare come un essere umano. E può ancora commettere errori o fornire allucinazioni. “Non sarà perfetto," ha detto il dott. Sidor. "Ma si può contare sul fatto che lavorerà più duramente ed è molto più probabile che produca la risposta corretta".

OpenAI dichiara che o1 ha ottenuto risultati migliori rispetto alle versioni precedenti in alcuni test standardizzati, esami progettati per valutare le capacità, le conoscenze o le competenze di individui o sistemi in modo uniforme e oggettivo.

Nell'esame di qualificazione per le Olimpiadi Internazionali di Matematica, la principale competizione matematica per studenti delle scuole superiori americane, il modello precedente ha ottenuto il 13%. OpenAI o1 avrebbe invece ottenuto l'83%.

OpenAI ha inoltre affermato che o1 ha raggiunto l'89° percentile dei partecipanti nel round di sfide di programmazione online Codeforces, superando il sistema AlphaCode 2 di DeepMind.

I PROBLEMI

L'accesso alla nuova tecnologia sarà possibile inizialmente per i privati e le aziende abbonati ai servizi ChatGPT Plus e ChatGPT Teams. OpenAI sta inoltre fornendo la tecnologia a sviluppatori di software e aziende, che stanno costruendo le proprie applicazioni di intelligenza artificiale.

Tuttavia, OpenAI o1 è piuttosto costoso. Nell'API di ChatGPT, o1-preview costa 15 dollari per 1 milione di token in ingresso e 60 dollari per 1 milione di token in uscita, un prezzo triplo rispetto a GPT-4o per i token in ingresso e quadruplo per quelli in uscita. I token, lo ricordiamo, sono frammenti di dati grezzi; 1 milione corrisponde a circa 750.000 parole.

Alla luce di quanto scritto, OpenAI o1 rappresenta un significativo passo avanti nel campo dell'intelligenza artificiale, migliorando nettamente le capacità di ragionamento rispetto a GPT-4o e dimostrandosi particolarmente adatto per compiti complessi come la programmazione, l'analisi dati e la risoluzione di problemi scientifici.

Ma è un modello costoso per gli sviluppatori e lento per gli utenti generici, che non vogliono certo attendere tra i 10 e i 20 secondi per avere una risposta. Fattori, questi, che paiono posizionarlo maggiormente come uno strumento per professionisti e aziende.

Trending