Dai fuochi d'artificio festivi ai fuochi d'artificio dell'intelligenza artificiale

Mentre i fuochi d'artificio illuminano il cielo sopra Pechino, le grandi aziende tecnologiche cinesi sfruttano il Capodanno cinese per lanciare un'ondata di nuovi modelli di intelligenza artificiale. Quella che sembrava una comoda leadership per Silicon Valley si sta rapidamente trasformando in una corsa testa a testa.

Le aziende cinesi stanno presentando sistemi avanzati per IA generativa, video, immagini e codice — spesso open source e sorprendentemente efficienti dal punto di vista energetico. Persino Sam Altman, CEO di OpenAI, ha definito i progressi cinesi "remarkable".

Le celebrazioni del Capodanno cinese non riguardano più soltanto danze dei draghi e lanterne rosse. Durante i grandi spettacoli nel paese, robot umanoidi si sono mossi in sincronia con ballerini umani, simbolo tangibile delle ambizioni tecnologiche della Cina.

Mentre gli Stati Uniti puntano su enormi data center e chip potentissimi, i player cinesi sono costretti a concentrarsi sull'efficienza. A causa del divieto americano di esportazione di chip avanzati per l'IA, devono ottenere di più con meno potenza di calcolo.

Le restrizioni americane sui chip spingono le aziende cinesi a ottimizzare in modo estremo, producendo modelli IA più efficienti e comunque competitivi.

Ne emerge un contrasto interessante: da un lato i costosi e energivori LLM americani, dall'altro modelli cinesi sempre più efficienti, spesso eseguibili in locale.

L'open source come arma strategica

Una differenza significativa rispetto a molti modelli americani è che gran parte dei sistemi IA cinesi viene rilasciata come open source o come modelli cosiddetti "open-weight".

Open source: codice completo e architettura del modello sono pubblicamente disponibili
Open-weight: i pesi addestrati sono accessibili, ma il codice e i dati di training restano parzialmente chiusi

In entrambi i casi, un'organizzazione può scaricare il modello ed eseguirlo in locale, sui propri server o anche su un desktop ad alte prestazioni. Questo elimina i costi di abbonamento, riduce il traffico dati e garantisce un controllo più diretto sui dati interni.

Eseguire un modello in locale significa che nessun dato sensibile viene inviato ai server di Google, OpenAI o a data center in Cina: il controllo resta completamente nelle proprie mani.

In questo modo, i modelli cinesi si posizionano come un'alternativa concreta per le organizzazioni che trattano segreti aziendali, dati personali o documenti riservati.

Generazione video: Seedance 2.0 fa tremare Hollywood

Nel campo della generazione video con IA, un nome spicca su tutti: Seedance 2.0 di ByteDance, l'azienda che ha creato TikTok. Questo modello genera video iperrealistici a partire da brevi prompt testuali, con risultati che ricordano produzioni cinematografiche di alto budget.

Seedance 2.0 non è open source né open-weight, ma le sue demo hanno circolato a velocità fulminea sui social media. Questo ha immediatamente sollevato un problema: grandi studios come Disney, Paramount e Netflix accusano ByteDance di violazione del diritto d'autore, sostenendo che i dati di addestramento si basino eccessivamente su materiale cinematografico protetto.

La controversia rispecchia i dibattiti già in corso attorno a modelli americani come Sora di OpenAI. Chiunque partecipi alla corsa all'IA video deve confrontarsi con questioni legate ai diritti, al riutilizzo di materiale visivo e alla tutela dei creativi.

Alibaba, Zhipu e Moonshot: i nuovi pesi massimi

Qwen3.5 di Alibaba: un unico modello per testo, immagini e video

Alibaba ha presentato Qwen3.5, un modello vision-language capace di gestire testo, immagini e video in circa 200 lingue. Il sistema può operare come agente multimodale: legge moduli, naviga siti web ed esegue operazioni digitali che normalmente richiedono intervento umano.

Qwen3.5 è disponibile con licenza aperta e scaricabile tramite GitHub. Gli sviluppatori possono personalizzarlo, eseguire fine-tuning o integrarlo nei propri software, senza dipendere da API esterne.

GLM-5 di Zhipu AI: più efficiente grazie all'attenzione selettiva

Zhipu AI ha introdotto GLM-5, un modello progettato per l'intelligenza agentiva e il ragionamento a più fasi. La tecnologia alla base di GLM-5 utilizza la DeepSeek Sparse Attention (DSA): invece di analizzare tutte le parole contemporaneamente, il modello impara a concentrarsi solo sulle parti più rilevanti dell'input.

Questo approccio riduce il consumo di potenza di calcolo e memoria, abbassando significativamente i costi di inferenza. Un dettaglio notevole: GLM-5 è stato addestrato interamente su chip Huawei Ascend, senza ricorrere a GPU americane. Zhipu dimostra così che è possibile sviluppare IA di alto livello con un ecosistema hardware completamente cinese.

DeepSeek V4: addestramento più economico, prestazioni di vertice

DeepSeek aveva già fatto parlare di sé con la versione V3, che nei benchmark si avvicinava a ChatGPT pur richiedendo costi di addestramento molto inferiori. La prossima V4, secondo fonti negli Stati Uniti, dovrebbe fare ancora meglio, in particolare in ambito di programmazione e analisi complessa.

La testata specializzata The Information ha riferito che DeepSeek V4 supera in alcuni test i modelli di Anthropic (Claude) e OpenAI (serie GPT). Con questo passo avanti, l'azienda si colloca ai vertici assoluti dell'IA generativa mondiale.

Kimi K2.5 di Moonshot AI: un team di specialisti in un unico modello

Moonshot AI ha lanciato a fine gennaio Kimi K2.5, un modello basato su un'architettura mixture of experts (MoE), simile ad alcune varianti di Google Gemini. Invece di un'unica grande rete che deve gestire tutto, Kimi K2.5 è composto da più sottoreti specializzate, ciascuna dedicata a un compito specifico come codice, matematica o scrittura creativa.

Per ogni prompt, il sistema attiva solo gli esperti pertinenti, limitando il carico computazionale. In questo modo, un modello relativamente grande riesce a funzionare in modo fluido anche su hardware meno potente.

Perché il divario con Silicon Valley si sta riducendo rapidamente

Modelli americani come ChatGPT e Gemini ottengono ancora punteggi leggermente superiori nei benchmark ufficiali. Ma la differenza si assottiglia ogni trimestre. Test indipendenti dimostrano che gli LLM e i modelli multimodali cinesi raggiungono prestazioni quasi equivalenti — e a volte superiori — nei compiti fondamentali come traduzione, programmazione, ragionamento e sintesi.

Aspetto	Modelli USA	Modelli cinesi
Benchmark linguaggio e logica	Punteggi leggermente più alti	Piccolo distacco, in rapida riduzione
Disponibilità	Principalmente via API cloud	Molti eseguibili in locale
Licenze	Prevalentemente chiuse	Molti open source / open-weight
Efficienza	Grandi data center, costi elevati	Focus su risparmio e ottimizzazione

Per le aziende internazionali queste differenze contano sempre di più. Una banca, un ospedale o uno studio legale spesso non vuole che documenti riservati transitino su un cloud esterno, per quanto dichiarato sicuro. I modelli eseguibili in locale diventano quindi particolarmente attraenti.

La combinazione di prestazioni solide, licenze aperte e possibilità di utilizzo locale potrebbe rendere i modelli IA cinesi strumenti standard a livello globale in breve tempo.

Cosa significa tutto questo per le aziende europee?

Le organizzazioni si trovano di fronte a una nuova scelta strategica: continuare ad affidarsi ai modelli cloud americani, oppure costruire stack IA propri usando come base modelli open source — eventualmente cinesi?

Nella pratica si stanno già diffondendo soluzioni ibride:

Modelli cloud americani per il contatto con i clienti, il marketing e le attività generiche
Modelli open source eseguiti in locale per documenti interni sensibili
Modelli specializzati (ad esempio per video o codice) scelti di volta in volta in base al progetto

Il ruolo dei fornitori di IA si sta quindi trasformando: non più un'unica "chatbot magica", bensì un ecosistema di modelli diversi che operano in parallelo, ciascuno con i propri punti di forza e di debolezza.

Concetti chiave e rischi: cosa deve considerare un'organizzazione

I modelli open source offrono maggiore libertà, ma richiedono anche una maggiore responsabilità. Chi esegue un modello in locale deve occuparsi direttamente di:

gestione degli accessi e registrazione delle attività
filtraggio degli output indesiderati
conformità con la normativa sulla privacy, come il GDPR

Author

Camilla Ferragni

Camilla Boniardi è una content creator e autrice italiana, conosciuta per i suoi contenuti ironici e autentici legati alla vita quotidiana. Nei suoi materiali condivide riflessioni, piccoli lifehack pratici ed emotivi, oltre a consigli su relazioni, routine e benessere. Il suo stile spontaneo e diretto la rende particolarmente vicina al pubblico.