AI e robotica nel 2026: Meta dilemma, novità CES, mattoncini Lego intelligenti e world models #34
👉 Ascolta su Spotify
👉 Guarda su YouTube
👉 Segui su LinkedIn
Introduzione e Trend della Robotica
Stefano Maestri
Ciao a tutti e bentornati nella prima puntata normale del 2026 dopo la puntata che abbiamo fatto sulle nostre palle di cristallo, senza probabilmente azzeccarci, ma sarà interessante lo stesso andare a vederci a fine anno.
Alessio Soldano
Beh, già buona se ne abbiamo presa un paio, dai.
Stefano Maestri
Dopo torniamo su quelle cose lì, non tanto sulle previsioni, ma su quelli che sono più i trend che cominciano a evidenziarsi già e che probabilmente ci accompagneranno. Non dico tutto l’anno perché qua tutto cambia alla velocità della luce, ma nei primi mesi di sicuro. Ne nomino solo uno, tanto per fare la marchetta: la robotica. Mercoledì pomeriggio è uscita un’intervista con Simone di Somma, che proprio di robotica si occupa con una startup in Italia; a me è piaciuto molto parlargli e riascoltarmi, quindi se non l’avete ancora fatto ascoltatela perché la trovo carina.
Meta acquisisce Manus: Agenti AI e il mercato Cinese
Stefano Maestri
Partiamo con le news e non possiamo non partire da Meta. Non per parlare male di Llama 4 — se volete, sempre volentieri — ma perché hanno argomenti nuovi. Soldi vecchi? Perché Meta ha piazzato lì altri due bei billion per comprarsi un’azienda che si chiama Manus, diventata famosissima un anno fa, poco meno, all’inizio del ‘25, in quanto tra i primi a fare agenti AI in senso generico. Ormai la parola “agente AI” è diventata sinonimo di agente di coding. Quando uno parla di agenti tendenzialmente si parla di agenti in generale, A2A, NCP e tutte queste belle cose, però l’applicazione che sta andando per la maggiore è quella di coding. Invece Manus aveva fatto già all’inizio dell’anno scorso, basato su Claude come modello, degli agenti generici. Classico esempio: “prenotami la vacanza e fai tutto da solo”. Oppure, durante l’anno, hanno aggiunto varie funzioni, tra cui “fammi le slide partendo da una ricerca approfondita” o “fammi l’analisi di mercato”. Quello che si fa con i grandi modelli dei grandi vendor, direte voi; se lo fate con Gemini o ChatGPT fate uguale, ma è perché di fatto Gemini, ChatGPT e tutti questi sono ormai degli agenti, sono molto più che un modello. Lo stesso dicasi per Claude e gli altri. Meta ha detto: “Ma io gli agenti non ce li ho, e come faccio? Beh, lo compro”. Ci sono tanti risvolti in questa cosa. Intanto è un’azienda cinese, quotata non ricordo se a Hong Kong o Singapore, ma è un’azienda cinese a tutti gli effetti. E questo in sé è un pochino una notizia: che una grande Big Tech americana faccia un’acquisizione in un’azienda cinese. Non ho ancora visto lo “Zio Donaldo” pronunciarsi su questa cosa; avrà qualcosa da dire?
Alessio Soldano
Gliela devono spiegare prima, però.
Stefano Maestri
Gliela devono spiegare, dici? Sì, d’accordo. Però è interessante di per sé questo: una Big Tech americana che compra un’azienda cinese quotata. La seconda cosa che mi balza all’occhio è che cambia ulteriormente la strategia di Meta. Meta è partita dicendo “facciamo i modelli open source” e poi li ha fatti; ha fatto Small Model interessanti e modelli grandi fino a Llama 3. Poi c’è stato questo flop di Llama 4. Intanto ha preso un sacco di talenti, ha acquisito il 51% di Scale AI giusto per prendersi i talenti principali — che, ricordate, metteva a posto i dati per il training — e adesso gli agenti e gli occhiali. Qual è la strategia? Sembrano un po’, se mi passate il termine, la Google del 2010-2020 che sparava nel mucchio: facevano mille cose, avevano i soldi per farle e chi se ne frega se andavano male. Mentre invece adesso in Google una strategia ben concreta comincia a vedersi; c’è un pensiero che lega insieme tutte le iniziative intorno all’AI. Meta ce l’ha questo pensiero secondo voi?
La Strategia di Zuckerberg e il “Gossip” su Yann LeCun
Alessio Soldano
Magari non è chiaro a noi.
Stefano Maestri
Esatto, magari no. Infatti è una domanda aperta a voi e agli ascoltatori. Io non ho capito ancora qual è il progetto di lungo termine. Forse non l’ha capito neanche Yann LeCun, che se n’è andato sbattendo la porta.
Paolo Antinori
Io sono un po’ influenzato nel mio giudizio da un articolo che ho letto, un’intervista a Yann LeCun, in cui non spendeva parole super positive per Meta e si toglieva qualche sassolino dalle scarpe raccontando qualche gossip. Arriva da lui, quindi dovrebbe essere credibile, e raccontava qualcosa che non era ben noto: a quanto pare il flop di Llama 4 è dovuto al fatto che qualcuno ha clamorosamente barato e raccontato delle frottole a tutti quanti. I benchmark non erano così buoni come sono stati proiettati. L’aneddoto che racconta Yann è che quando Mark Zuckerberg se n’è accorto si è incazzato come una biscia e ha deciso che non si fidava più del team e delle persone coinvolte, quindi ha tracciato una linea e ha deciso di ricominciare da capo. LeCun non era coinvolto direttamente perché non lavorava su quelle cose, però ce le racconta come fatti accaduti, e non è incompatibile con l’andirivieni di talenti che si è visto. In questo momento potrebbe non esserci una strategia perché non c’è uno stratega, ma c’è soltanto l’owner che cerca di tenere in piedi qualcosa lui stesso, magari riconoscendo di non essere la persona più esperta in questo contesto.
Stefano Maestri
Mi fa un po’ ridere Zuckerberg che non si fida più di questi. Immagino che gli abbiano raccontato frottole perché sentivano una leggerissima pressione da parte sua a consegnare qualcosa. È un po’ come negli interrogatori della CIA: dopo cinque giorni senza mangiare, pur di dire qualcosa, ti do una bugia.
Paolo Antinori
Può essere, non so giudicare quell’aspetto. Però questo era un punto. L’altro punto riguardava sempre LeCun e qui andiamo più nel gossip: gli si chiedeva un commento sulla persona che ha rimpiazzato il suo ruolo in Meta, una persona di origini asiatiche, molto giovane, Wong si chiama. Dall’alto dei suoi 65 anni LeCun diceva: “Sì, è molto bravo, impara molto in fretta, ha 25 anni e farà gli errori che fanno quelli di 25 anni”. Voleva essere riconoscente dei meriti dell’individuo ma sottolineare come forse si sentano fortunati nel mettere in mano un’iniziativa così ampia a qualcuno con relativamente poca esperienza, specialmente nella ricerca. LeCun poneva il contrasto tra un profilo che arriva dalla ricerca e uno che non ci arriva. Spendia un po’ di “shade”, lanciava delle frecciate. Quindi tutto quello che succede in Meta può darsi sia in una fase transitoria, il passaggio da un’era geologica a un’altra, e ci vorrà un po’ prima che le cose convergano. La mia opinione su Manus, al di là della strategia, è che il mondo è diventato più largo: non si guarda più solo alla Silicon Valley o Israele per le startup, ma l’innovazione in Cina viene tenuta in conto non solo per quello che fanno ma per l’idea di mettersi in affari con loro. L’implicazione non banale sono i legami con il governo e i vincoli sulla privacy. È un terreno spinoso, e il fatto che qualcuno ci butti una valangata di soldi nonostante le spine indica l’inizio di un cambiamento epocale.
L’Esperienza Utente e Meta AI su WhatsApp
Alessio Soldano
Secondo me c’è anche l’aspetto del “se non li possiamo vincere, compriamoli”.
Stefano Maestri
È vero. Però il governo cinese ti permette di comprarli, diversamente dalla narrativa vista finora. Rispetto ai due blocchi America-Russia dagli anni ‘80, non sarebbe stato possibile. C’è una bella intervista di Lex Fridman a un’esperta di economia cinese che spiegava come la filosofia di mercato cinese sia quella di eccellere; la politica c’entra, ma l’interesse è l’eccellenza. Guardando l’aspetto tecnico, Meta era debole nell’esperienza utente, nella parte agentica sopra il modello. Gemini, ChatGPT, Claude ormai sono agenti: cercano, fanno immagini. Meta quella roba lì non ce l’ha e aveva bisogno di qualcosa per un’integrazione profonda con i prodotti. Zuckerberg è tormentato dal fatto che Instagram sia pieno di video e immagini generate da altri; avrebbe voluto generarle lui e guadagnarci lui.
Alessio Soldano
Facendo il caso dell’utente medio, quanti di voi usano l’IA dentro WhatsApp, nonostante sia stata una delle prime ad arrivare sui cellulari?
Stefano Maestri
Sai che la Gen Z sta cominciando ad usarla? Io non lo pensavo, ma me l’ha spiegato mia figlia mostrandomi una chat organizzativa per l’ultimo dell’anno. Si può aggiungere l’IA di Meta a un gruppo, menzionarla e chiederle di dire cose; risponde in modo divertente. A loro piace dire “manda a quel paese Tizio” e l’IA si rifiuta con giri di parole o dice “fallo tu”. Questo li diverte e la usano più di quanto mi aspettassi. Non per cose serie — se devono fare i compiti vanno su ChatGPT o Gemini — ma per il cazzeggio, che forse è l’unica cosa che interessa davvero a Meta perché trattiene gli utenti.
IPO Cinesi e il Futuro dell’Open Source
Paolo Antinori
Dovremmo avere una grafica per la rubrica “Boomers contro Gen Z”.
Stefano Maestri
Giusto. L’altro punto di vista è quello economico: c’è una corsa delle società cinesi a quotarsi, a fare le IPO. Zhipu AI è partita l’8 gennaio ed è annunciata anche MiniMax. Entrambe si quotano a Hong Kong. È particolare che società così strategiche, che immaginiamo legate al governo, non vedano l’ora di fare una IPO per raccogliere contante e magari fare una exit.
Alessio Soldano
Come vedete questa cosa sulle implicazioni per i modelli open source? Se i player grossi tipo GLM se ne escono così?
Stefano Maestri
Pare che il principale acquirente dell’IPO di Zhipu sarà Alibaba, che ha una storia di open source, quindi magari la mantengono. Come diceva Serena Sensini in un’intervista di novembre, ci si aspetta che l’open source nella seconda metà degli anni ‘20 parli cinese. Se la cultura è eccellere, il modo migliore per farlo contro i denari infiniti americani è andare open source. Secondo me restano open, se devo scommettere due euro.
Smart Glasses e l’Innovator’s Dilemma
Stefano Maestri
Intanto Meta non ci dà ancora gli occhiali con il monitor in Europa. Dicono che la lista d’attesa americana è troppo lunga e non stanno dietro alla produzione. Buon per loro se vendono, ma c’è il rischio dell’Innovator’s Dilemma: innovo per primo, vado forte, ma rischio di non coprire il mercato perché ho corso troppo. In questi giorni c’è il CES (Consumer Electronics Show) a Las Vegas. Lì è pieno di occhiali. ASUS ne ha uno pronto, fatto con Android XR, la versione di Google. Apple, quando lanciò l’iPhone, fu capace di coprire il mercato. Se Meta non riesce a starci dietro e arrivano prima i multivendor su Android con occhiali di buona qualità, rischia grosso, anche se ha dietro Luxottica.
Robotica al CES e i LEGO Smart Bricks
Paolo Antinori
La cosa che più mi ha entusiasmato del CES è Roborock, che ha presentato un robot che sale le scale.
Stefano Maestri
Sai che sono stati comprati loro? Quelli di Roomba erano in difficoltà finanziarie e sono stati acquisiti dall’azienda cinese che produceva i loro robot. È un corto circuito al contrario: l’azienda produttrice compra il brand.
Paolo Antinori
Il robot cinese che sale le scale fa ridere: è la solita padella a cui hanno messo una gambetta con cui si spinge sopra, tutto zoppo, però sale. Invece, parliamo di LEGO e dei mattoncini elettronici. Sono pezzi 2x4 in cui hanno messo un chip e dei sensori di luce, movimento, suono e accelerometro. Li hanno abbinati a pezzi con tag NFC che abilitano interazioni in pezzi smart, come le mini-figures. LEGO è nella robotica da anni con Mindstorms, set costosissimi; questi dovrebbero essere più accessibili e interattivi. Se avvicini Darth Vader e Luke Skywalker, Vader respira e a Luke si accende la spada. Aggiunge una dimensione multimediale al gioco.
Alessio Soldano
Mio figlio ha qualcosa di simile con LEGO Super Mario. Il problema è che queste cose sono attivabili spesso solo tramite l’app sul tablet del genitore, che diventa un collo di bottiglia. Hanno dei piccoli schermi che rappresentano il sentimento del personaggio.
Paolo Antinori
Questi nuovi sono più programmabili, puoi far partire la marcia imperiale se il personaggio si siede. La critica che ho sentito è che questa feature “snatura” il LEGO, che nasce per la creatività costruttiva immediata. Toglie la possibilità di inventare la propria storia obbligandoti a certi schemi. Però mi piace la modalità “tinkering”: spero si possano customizzare i suoni e le reazioni. Confido negli hacker che scioglieranno la plastica per caricarci sopra quello che vogliono.
Stefano Maestri
La critica del “pezzo speciale” che impedisce la creatività c’è da quando LEGO è passata dai mattoncini standard ai set specifici. L’hanno recepita quando i cloni cinesi compatibili, che continuavano a fare pezzi standard a poco prezzo, hanno iniziato a vendere più di loro.
Alessio Soldano
Settimana scorsa ho montato una Williams di Nigel Mansell, un LEGO per adulti. Nel manuale si vantano di aver fatto quasi tutto con pezzi standard; ad esempio, il contenitore del liquido delle sospensioni è fatto con una testa di un omino LEGO. Comunque, LEGO ci sta insegnando fin da bambini ad avere familiarità con l’idea di programmare un oggetto.
Stefano Maestri
Io ho il braccio robotico S101 ma mi mancava un pezzo. Me ne hanno mandati due uguali e ne mancava uno fondamentale. Fortunatamente si può stampare in 3D; un amico di mia figlia mi sta aiutando. Sto pensando se comprarla la stampante 3D, perché tra dogana e tutto ho pagato il braccio uno sproposito.
Rumor OpenAI: La Penna Smart di Johnny Ive
Stefano Maestri
Passiamo ai rumors. Pare che il dispositivo fisico di OpenAI disegnato da Johnny Ive sia una penna. Uno strumento di scrittura “old style”. Dovrebbe essere una penna da taschino, ma le camicie di oggi non hanno più il taschino perché le penne non si usano più. Forse torneranno di moda. L’idea è che nel cappuccio ci sia un microfono che registra tutto e ne fa la sintesi. Usi l’IA con la voce e lei ti risponde tramite cuffie. Dovrebbe leggere anche le gesture: scrivendo nell’aria o sul tavolo, è come se scrivessi all’IA. Johnny Ive ci ha abituato a innovare dove nessuno credeva inizialmente, come con l’iPhone.
Paolo Antinori
Sapere che riescono a mettere tutta quella tecnologia nell’ingombro di una penna è interessante. Magari qualcuno userà quella tecnologia per applicazioni più pratiche.
Stefano Maestri
È un companion del telefono, non è tutto lì dentro. Comunque OpenAI sta puntando tutto sulla voce come interfaccia privilegiata. A dicembre hanno assunto ricercatori strapagati esperti di text-to-speech.
Trend del 2026: World Models e Continual Learning
Stefano Maestri
Consolidiamo i trend per i primi mesi del 2026. Il primo sono i World Models. Yann LeCun ha lasciato Meta per fondare una startup su questo; Demis Hassabis di DeepMind ci punta tantissimo. È il “cervello” dei robot: insegnare a un modello come ci si muove nel mondo dandogli un’esperienza diversa dalle parole. Per arrivare all’AGI (Intelligenza Artificiale Generale) non bastano i libri; serve l’esperienza del “se tocchi una cosa che scotta, scotta”. Demis ha parlato di un avatar dentro “Genie”, il loro World Model, dove l’avatar esplora e condiziona il mondo prodotto, creando un loop di apprendimento promettente.
Alessio Soldano
E poi c’è il Continual Learning.
Stefano Maestri
Esatto, imparare durante la vita. Oggi i modelli hanno fasi di training e inferenza separate. Il training assomiglia all’imprinting biologico, ma gli esseri intelligenti imparano dall’esperienza quotidiana. Dal punto di vista della ricerca, è ciò che si sta spingendo di più. Poi c’è l’Orchestrazione: se il 2025 è stato l’anno degli agenti, il 2026 sarà dei sistemi multi-agente. Lo vediamo già nel coding con Claude, Google Antigravity e Cursor, che coordinano diversi sub-agenti per dividere il lavoro. Infine il Refinement: un miglioramento continuo dei modelli in fase di inferenza attraverso tecniche come il “Deep Thinking” di Gemini o i loop di refinement.
Coding: GLM 4.7 e la Tecnica RALPH
Stefano Maestri
Sto provando molto GLM 4.7 per il coding. A livello di qualità e velocità è quasi indistinguibile da Claude Sonnet. Claude Opus e Gemini sono forse ancora superiori, ma per il prezzo — 9 dollari a trimestre — GLM è imbattibile per chi vuole sperimentare o per gli studenti.
Paolo Antinori
Ho letto di una tecnica chiamata RALPH, un omaggio a Ralph Winchester dei Simpson. È fondamentalmente “brute forcing”: siccome i modelli a volte dicono di aver fatto una cosa grossa ma si dimenticano dei pezzi, RALPH fa un loop infinito chiedendo lo stesso identico prompt senza cambiare nulla. Sembra il fallimento dell’ingegneria, ma i risultati arrivano sulla distanza. Cloud Code l’ha implementata come comando, usando degli hook di stop e timeout. Sono curioso di vedere se la centesima volta è meglio della prima o se il modello cannibalizza se stesso.
Generazione Immagini: Qwen e i Layer
Stefano Maestri
Qwen, per la generazione di immagini, ha fatto un salto significativo: ora genera immagini con i layer editabili, un po’ come file di Photoshop.
Alessio Soldano
Migliora la consistenza tra una generazione e l’altra e ha un realismo spinto. Avere i layer permette a un grafico di gestire le modifiche facilmente. Se devi editare un testo in un’immagine di copertina, non devi cancellare tutto a mano ma lavori sul livello testo. È un passo avanti enorme per la collaborazione uomo-macchina. Nel momento in cui puoi ragionare per layer, hai degli agenti che lavorano su pezzi specifici dell’immagine.
Stefano Maestri
Questo si collega al discorso delle “skills” introdotte da Anthropic, rese standard aperto. Ma ne parleremo un’altra volta perché meritano spazio. Diteci cosa vi interessa di più, così possiamo orientare le prossime puntate. Mettete le stelline su Spotify e ditelo agli amici. Ci vediamo la settimana prossima con un ospite speciale. A presto!