DeepSeek, Operator e agenti: le ultime novità sulle AI

Il 2025 inizia con il botto per il progresso delle intelligenze artificiali generative, con importanti novità che stanno ridefinendo il settore e aprendo nuovi scenari. Dalla Cina arriva DeepSeek, un modello che ha sorpreso per la sua efficienza e per il suo approccio open source, mentre OpenAI prova a stupire (ma non ci riesce del tutto) con il lancio di Operator, un agente capace di interagire direttamente con il web. Inoltre, il CEO di OpenAI, Sam Altman, ha annunciato l’arrivo imminente del modello O3-mini, e si parla sempre più del 2025 come l’anno degli agenti AI, destinati a interagire con il mondo reale in modi mai visti prima. Scopriamo insieme tutti i dettagli.

DeepSeek: l’AI cinese che sta cambiando le regole del gioco

DeepSeek ha catturato l’attenzione mondiale grazie a un approccio rivoluzionario al suo addestramento. A differenza dei grandi modelli occidentali che utilizzano enormi quantità di risorse hardware e miliardi di dollari di investimenti, DeepSeek è stato addestrato con risorse molto più contenute.

AI + SEOZoom = Successo!
Tutta la potenza dell’Intelligenza Artificiale guidata dagli algoritmi e dai dati di SEOZoom
Registrazione

DeepSeek è una startup con sede in Cina, il cui azionista di controllo è Liang Wenfeng, co-fondatore di un fondo di investimenti ed ex trader. Aveva iniziato a sfruttare l’intelligenza artificiale per fare investimenti in borsa, ed è proprio da qui che nasce la sua storia. L’intenzione iniziale era quella di acquisire hardware per poter creare un sistema efficiente per addestrare un modello da usare nei mercati azionari. L’idea non è stata un successo, e quindi l’azienda ha cambiato target, andando ad assumere decine di menti giovani e brillanti (a basso costo rispetto al mercato occidentale) e creare qualcosa di innovativo.

Le caratteristiche di DeepSeek: addestramento leggero, ma efficiente

È stato quindi rilasciato dapprima il modello V3 con 671 miliardi di parametri e addestrato in solo 2 mesi al costo irrisorio (rispetto alle big tech) di poco più di 5 milioni di dollari.
C’è però da considerare che il costo delle GPU di cui erano già in possesso è costata sicuramente svariate decine o centinaia di migliaia di dollari e che i dati per l’addestramento sono frutto di una estrazione di dati sintetici presi da OpenAI.
Dopo pochi giorni ha rilasciato il modello R1 che sfida direttamente nelle classifiche dei migliori modelli di linguaggio grazie al suo motore di “ragionamento”. In pratica, così come fa il modello O1 di OpenAI, si prende del tempo per “pensare” prima di fornire la risposta. C’è da precisare che non pensa veramente in maniera tradizionale, ma non fa altro che generare del testo prima della risposta (visibile in chiaro), in cui si vede il modello discutere internamente con se stesso per provare a formulare delle ipotesi.

Esempio di risposta di DeepSeek

Inoltre Deepseek si è distinta nella qualità del suo lavoro anche per l’efficienza dell’utilizzo della memoria. A differenza dei suoi competitor più gettonati, utilizza solo piccole porzioni alla volta del suo cervello, per ottimizzare i tempi di risposta che sono davvero molto rapidi. Questo dimostra che non sempre è necessaria una potenza computazionale estrema per ottenere risultati sorprendenti.

Questa notizia ha avuto ripercussioni significative sul mercato: i principali titoli legati all’hardware per l’AI, come quelli di produttori di GPU, hanno subito un crollo in borsa. Questo perché DeepSeek rappresenta un segnale chiaro che il settore potrebbe non dipendere più tanto da hardware costosi per addestrare modelli avanzati.

Ma la qualità?

Se ne parla tanto proprio perché attualmente riesce a competere con i modelli più famosi a costi estremamente ridotti.

Guardando la classifica di LMArena dei migliori LLM si può notare che i due modelli citati occupano già due posizioni nella top 10.

Tabella di confronto AI su LMarena

Io ho fatto dei confronti e la qualità su alcuni aspetti è quasi alla pari di ChatGPT. Ho notato delle carenze sulla parte di sviluppo software, ma sulla generazione di testi produce degli output di alta qualità.

Il modello produce comunque tante allucinazioni quando non conosce l’informazione, ma grazie alla parte di reasoning viene in parte arginato il problema anche se le risposte possono essere un po’ lente (talvolta superiori al minuto su problemi più complessi)

Per chi ha già costruito un software utilizzando OpenAI tramite l’utilizzo delle sue API potrà ridurre sensibilmente i costi semplicemente cambiato la chiave API, poiché DeepSeek utilizza praticamente la stessa sintassi.

Open source e accessibile a tutti

Un altro elemento importante di DeepSeek è la sua filosofia open source. Il modello è stato rilasciato con licenza MIT, una delle più libere in assoluto, che permette a chiunque di utilizzarlo e modificarlo senza particolari vincoli. Oltre ai pesi del modello – che rappresentano i dati numerici che l’AI utilizza per funzionare e che consentono di eseguire il modello in locale – è stato pubblicato anche un paper scientifico dettagliato. Questo documento descrive passo dopo passo il processo di addestramento, rendendo DeepSeek replicabile da qualsiasi sviluppatore interessato. Qui nel nostro team siamo riusciti a lanciare una versione ridotta di DeepSeek R1 con un computer di prestazioni comuni.

I dubbi

Non sono solo i miei ma di tanti.

Parliamo in primo luogo della privacy. Se utilizziamo il modello ospitato da loro ci troviamo sicuramente di fronte a delle regolamentazioni sulla privacy sicuramente meno rassicuranti di quelle che ci sono in Unione Europea. Bisogna capire se fidarsi a inserire dati sensibili nelle mani dei cinesi. Però c’è da dire che utilizzando la versione Open Source ospitata in locale il problema non sussisterebbe in quanto i dati non lascerebbero mai il nostro computer.

Un altro punto da discutere è la censura cinese.

Esempio di censura di DeepSeek: nessuna informazione su piazza Tienanmen

Come si può notare in questa immagine, il team diventa molto tutelativo nei confronti del governo cinese.

Chi conosce la storia saprà bene dei tragici fatti di Piazza Tienanmen, che sono disponibili in qualsiasi fonte storica occidentale, ma che in Cina è ancora ben secretato per la popolazione. Anche OpenAI opera dei divieti su ciò che ChatGPT può e non può dire, ma più che censura si parla di rendere il modello restio a dare informazioni pericolose o destinate ad adulti. In questo caso con DeepSeek si crea un precedente importante su cui ragionare. Non ritengo corretto che una compagnia che rilascia un prodotto del genere possa influenzare con i suoi bias cosa sia giusto o meno mostrare all’utente. Per dovere di cronaca però aggiungo che questo tipo di censura è presente solo sull’interfaccia raggiungibile dal sito ufficiale ovvero https://chat.deepseek.com/ mentre tramite accesso API o scaricando il modello open source il modello non rifiuta le risposte scomode.

 

OpenAI lancia Operator: l’agente AI che usa il web al posto tuo

Operator è il nuovo agente AI di OpenAI, progettato per automatizzare attività online interagendo direttamente con il browser. A differenza dei classici modelli di generazione testuale, Operator può navigare su internet, compilare moduli, cliccare pulsanti e persino fare acquisti in autonomia. Questo lo rende uno strumento perfetto per semplificare compiti ripetitivi e migliorare l’efficienza.

Al momento, Operator è disponibile solo negli Stati Uniti per gli utenti del piano ChatGPT Pro, che costa 200 dollari al mese. Sebbene il prezzo sia ancora elevato per molti, questo rappresenta un passo fondamentale verso l’integrazione pratica delle AI nella vita quotidiana.

Che cos’è Operator e come funziona

Il cuore tecnologico di Operator è il modello avanzato CUA (Computer-Using Agent), capace di riconoscere le interfacce grafiche dei siti web e di interagire con esse. Questo sistema utilizza un apprendimento rinforzato per migliorare la precisione delle sue azioni, chiedendo conferma all’utente prima di completare attività critiche, come un acquisto o l’invio di un’e-mail.

Un altro punto di forza è la personalizzazione: gli utenti possono creare flussi di lavoro su misura per siti specifici o attività ricorrenti, rendendo Operator uno strumento altamente versatile. OpenAI ha anche previsto dei meccanismi di controllo per garantire che l’agente AI rimanga sicuro e affidabile.

I potenziali rischi e le alternative

Nonostante le sue potenzialità, Operator è ancora in una fase sperimentale e può commettere errori, come affermato dalla stessa OpenAI (e dalle testimonianze di chi lo ha usato sembra ancora essere ben lontano da un utilizzo in produzione).

L’utilizzo di strumento di questo tipo solleva interrogativi sui rischi di affidare compiti importanti a un’AI, soprattutto in contesti delicati come acquisti online o compilazioni di dati sensibili. OpenAI dichiara che nel momento che stiamo inserendo dati sensibili il suo sistema “chiude gli occhi” e non guarda ciò che stiamo scrivendo. Ma potremmo fidarci?

Per chi cerca alternative, esistono già soluzioni simili, come i sistemi di browser-use un progetto open source disponibile su GitHub e computer-use sviluppato da Anthropic dove ho già realizzato un video al riguardo. Questi strumenti mostrano come il mercato stia rapidamente evolvendo verso un futuro in cui gli agenti AI non saranno più semplici assistenti, ma veri e propri intermediari tra l’uomo e il mondo reale.

L’annuncio di Sam Altman: arriva O3-mini

I modelli della serie O (o1, o1-mini, o3, o3-mini) di OpenAI rappresentano una nuova generazione di intelligenze artificiali focalizzate sul ragionamento avanzato. A differenza dei precedenti modelli GPT, progettati principalmente per la generazione di testo, i modelli “O” sono stati sviluppati per affrontare problemi complessi che richiedono un’analisi logica approfondita e una capacità di suddividere le questioni in passaggi sequenziali.

Il modello o3 è l’ultimo e più avanzato della serie, introdotto da OpenAI a dicembre 2024 nell’ultimo dei 12 giorni di novità prenatalizie. Una delle sue principali innovazioni è l’uso dell’apprendimento per rinforzo, che consente al modello di “pensare” prima di generare risposte. Questo approccio, definito da OpenAI come “catena di pensiero privata”, permette a o3 di pianificare e ragionare attraverso una serie di passaggi intermedi per risolvere problemi complessi.

Le prestazioni di o3 sono notevolmente superiori rispetto al suo predecessore, o1. Ad esempio, ha raggiunto un punteggio dell’87,7% nel benchmark GPQA Diamond, che include domande scientifiche di livello esperto non disponibili pubblicamente online. Inoltre, nel benchmark SWE-bench Verified, che valuta la capacità di risolvere problemi reali su GitHub, o3 ha ottenuto un punteggio del 71,7%, rispetto al 48,9% di o1.

Altman scrive su X

 

Il CEO di OpenAI, Sam Altman, ha recentemente annunciato su X che il modello o3-mini, una versione più leggera e veloce di o3, sarà presto disponibile al pubblico. In un post su X (precedentemente Twitter), Altman ha dichiarato: “Grandi notizie: il livello gratuito di ChatGPT riceverà o3-mini! (e il livello Plus avrà un ampio utilizzo di o3-mini)”.

Questa mossa mira a rendere le avanzate capacità di ragionamento di o3 accessibili a un pubblico più ampio, offrendo agli utenti gratuiti l’opportunità di sperimentare le potenzialità di questo nuovo modello.

Il 2025: l’anno degli agenti AI

Il 2025 è previsto come l’anno per l’ascesa degli agenti di intelligenza artificiale, sistemi autonomi progettati per eseguire compiti complessi senza la necessità di supervisione umana costante. Questi agenti rappresentano un’evoluzione rispetto ai tradizionali chatbot, poiché possono gestire flussi di lavoro articolati, prendere decisioni autonome e interagire con vari sistemi in modo proattivo. Secondo un’analisi del Financial Times, gli investitori stanno concentrando l’attenzione su prodotti aziendali basati su agenti AI, ritenuti altamente lucrativi nonostante la loro apparente semplicità.

Registrazione
Unisci SEO e AI
Combina intelligenza artificiale e strategia SEO per creare contenuti autentici, originali e competitivi

Non si parlerà più solo di generatori di testo con capacità prima inimmaginabili, ma di software automatizzati capaci di prenotare viaggi, fare acquisti, compilare moduli e molto altro. Questo salto evolutivo potrebbe cambiare radicalmente il nostro rapporto con la tecnologia, rendendo le AI strumenti indispensabili nella vita quotidiana così come qualche anno fa gli smartphone sono entrati in maniera dirompente nelle nostre tasche.

Impatto sul mondo del lavoro

L’integrazione degli agenti AI potrebbe comportare dei cambiamenti nel mondo del lavoro. Da un lato, l’automazione di compiti ripetitivi libererà i lavoratori da azioni noiose, permettendo loro di concentrarsi su attività più creative e strategiche. Dall’altro, c’è il rischio di una riduzione dei posti di lavoro in ruoli tradizionali. Diversi studi avvertono che l’automazione tramite AI potrebbe aumentare le disuguaglianze nel mondo del lavoro, a meno che il governo non fornisca supporto adeguato alle piccole imprese e ai lavoratori.

Per mitigare questi effetti, bisognerà investire nella riqualificazione della forza lavoro e promuovere una collaborazione equa tra umani e macchine, ma queste riflessioni le lasciamo a chi di competenza.

7 giorni di Prova Gratuita

Aumenta la tua visibilità online con SEOZoom!
TOP