File consolidato con TUTTI i deliverable del drop nuovo episodio. Generato da
podcast-promov4.1 il 2026-04-30. Identifier campaign:ep50_drop
| Campo | Valore |
|---|---|
| Titolo | L’AI che non dorme: da DeepSeek V4 ad Hermes Agent |
| Format | numerato |
| Episode number | 50 |
| Drop date | 2026-05-02 13:00 Europe/Rome |
| YouTube ID | qKl4Vkb6BMw -> https://www.youtube.com/watch?v=qKl4Vkb6BMw |
| Spotify Episode ID | 5PYjqRH2j4dI6zhHyW08Fb -> https://open.spotify.com/episode/5PYjqRH2j4dI6zhHyW08Fb |
| Apple URL | null (da aggiungere post-publish Apple RSS, T+4-24h) |
| Thumbnail path | /assets/images/episodes/ep50.png |
| Jekyll post path | _posts/2026-05-02-ai-non-dorme-deepseek-v4-hermes-agent.md |
| Newsletter | codiceartificiale (modalita’ bullet) |
L'AI che non dorme: da DeepSeek V4 ad Hermes Agent
50 caratteri (limite 60). Pattern numerato: hook-first (“L’AI che non dorme”) seguito da specifica tecnica (“DeepSeek V4 ad Hermes Agent”). Keyword tech in zona utile (DeepSeek V4 al char 24).
Da registrare in coda all’episodio (3-4 take) e montare in apertura. Sigla max 3 sec.
(0s) Roo Code chiude dicendo: "gli IDE non sono il futuro".
(5s) Mentre i cinesi rilasciano tre modelli open weight nuovi
e DeepSeek V4 taglia il 78% di compute sulla KV cache.
(12s) Ti raccontiamo cosa cambia davvero per chi scrive codice oggi,
e perche' Hermes Agent mi gestisce mail e calendario mentre dormo.
(22s) Siamo Stefano, Paolo e Alessio, puntata 50 di Risorse Artificiali.
(28s) Andiamo.
(0s) Tre modelli cinesi open weight in una settimana.
DeepSeek V4 in testa, un milione di token di contesto.
(5s) E una nuova attention che taglia il 78% di compute sulla KV cache.
(12s) Sanfilippo lo fa girare su un Mac mini, Roo Code chiude
dicendo "gli IDE sono finiti", e Hermes Agent mi gestisce
le mail mentre dormo.
(22s) Siamo Stefano, Paolo e Alessio, puntata 50 di Risorse Artificiali.
(28s) Andiamo.
Regole: zero saluti nei primi 5s, autopromozione a fine video, sigla max 3s.
Da incollare in YT Studio > Dettagli > Descrizione (timestamps in formato HH:MM, primo capitolo a 00:00).
00:00 Settimana cinese: DeepSeek V4, Kimi K2.6, MiMo V2.5
04:15 Token efficiency, adaptive thinking e Hassabis sui context window
10:47 DeepSeek V4: 1.6T MoE e quantizzazione mista di Sanfilippo
14:20 Dalla ricerca pura all'ingegneria del software
17:33 Z.AI post-mortem: bug async cache e fix in SGLang
25:07 Sliding window, CSA e HCA: 78% meno compute sulla KV cache
33:30 Gemini Flash, distillation e FP4 quantization aware
41:53 Jensen vs Dwarkesh e Vision Banana di DeepMind
51:32 Robotica, hackathon e Stefano Gatti relaunch
58:25 Roo Code chiude e Lince.sh: il futuro post-IDE
1:04:55 Hermes Agent: GLM-5.1, mail e calendario in autonomia
11 capitoli su ~75 min, media ~6:50 per chapter.
⚠️ Se monti l’hook 30s del cap. 2 in apertura (prima del contenuto attuale), tutti i timestamp shiftano di ~+30s. Aggiusta al paste in YT Studio.
DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Hermes Agent gira in autonomia su un vecchio PC mentre dormo. Settimana densa di modelli cinesi open weight, ottimizzazione architetturale e agenti che non si fermano mai.
In questa puntata: DeepSeek V4 Pro e Flash con un milione di token di contesto, Kimi K2.6 e MiMo V2.5 usciti nello stesso slot, e l'analisi di Salvatore Sanfilippo che fa girare V4 Flash su un Mac mini con quantizzazione mista Q2/Q8. Poi il post-mortem di Z.AI sul bug async cache di GLM-5 (con PR contributiva a SGLang), Vision Banana di Google DeepMind che usa la generazione immagini come interfaccia universale per i task di vision, e il keynote rotto di Jensen Huang nell'intervista con Dwarkesh Patel. Chiude la puntata il deep-dive di Stefano su Hermes Agent, l'alternativa open di Nous Research a Claude Code, che gira con GLM-5.1 e gestisce mail, calendario e paper di Arxiv in autonomia.
Aggiungiamo le interviste a Demis Hassabis (DeepMind) e Andrej Karpathy sull'efficienza dei modelli e sulla strada verso l'AGI, e i 40 miliardi che Google sta investendo in Anthropic.
🎙️ Capitoli:
00:00 Settimana cinese: DeepSeek V4, Kimi K2.6, MiMo V2.5
04:15 Token efficiency, adaptive thinking e Hassabis sui context window
10:47 DeepSeek V4: 1.6T MoE e quantizzazione mista di Sanfilippo
14:20 Dalla ricerca pura all'ingegneria del software
17:33 Z.AI post-mortem: bug async cache e fix in SGLang
25:07 Sliding window, CSA e HCA: 78% meno compute sulla KV cache
33:30 Gemini Flash, distillation e FP4 quantization aware
41:53 Jensen vs Dwarkesh e Vision Banana di DeepMind
51:32 Robotica, hackathon e Stefano Gatti relaunch
58:25 Roo Code chiude e Lince.sh: il futuro post-IDE
1:04:55 Hermes Agent: GLM-5.1, mail e calendario in autonomia
🔗 Link e risorse:
- Hermes Agent (Nous Research): https://hermes-agent.nousresearch.com/docs/
- Vision Banana: https://vision-banana.github.io/
- Roo Code sunsetting: https://roocode.com/blog/sunsetting-roo-code-extension-cloud-and-router
- Intervista Hassabis: https://www.youtube.com/watch?v=96jN2OCOfLs
- Intervista Karpathy: https://www.youtube.com/watch?v=JNyuX1zoOgU
- Lince.sh (sandbox open source per agenti): https://lince.sh
Ascolta su Spotify:
https://open.spotify.com/episode/5PYjqRH2j4dI6zhHyW08Fb?utm_source=youtube&utm_medium=description&utm_campaign=ep50_drop
Sito:
https://risorseartificiali.com/?utm_source=youtube&utm_medium=description&utm_campaign=ep50_drop
Iscriviti al canale per non perdere il prossimo episodio.
#50
Primi 125 char (snippet YT feed/search):
“DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Herm”
Lunghezza totale: ~270 parole.
DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude e Hermes Agent gira da solo.
Settimana densa: DeepSeek V4 Pro e Flash con 1M di contesto, Kimi K2.6 e MiMo V2.5, l'analisi di Salvatore Sanfilippo che fa girare V4 Flash su Mac mini con quantizzazione mista Q2/Q8, il post-mortem di Z.AI sul bug async cache di GLM-5 (con fix contributo a SGLang), Vision Banana di Google DeepMind che usa la generazione immagini come interfaccia universale per la vision, e il deep-dive di Stefano su Hermes Agent, l'alternativa open di Nous Research a Claude Code che gira con GLM-5.1 e gestisce mail, calendario e paper di Arxiv in autonomia.
In piu': le interviste a Demis Hassabis (DeepMind) e Andrej Karpathy sull'efficienza e sull'AGI, il keynote rotto di Jensen Huang con Dwarkesh Patel, e i 40 miliardi che Google investe in Anthropic.
Follow Risorse Artificiali per non perdere il prossimo episodio.
Versione video su YouTube:
https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=spotify&utm_medium=description&utm_campaign=ep50_drop
#50
Primi 100 char (snippet Spotify):
“DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude e Hermes Agent gira da solo.”
Lunghezza totale: ~170 parole.
CSV pronto da incollare in YouTube Studio > Dettagli > Tag:
intelligenza artificiale, AI engineering, podcast tech italia, AI italiano, DeepSeek V4, Kimi K2.6, MiMo V2.5, Hermes Agent, Nous Research, Claude Code, Roo Code, Vision Banana, GLM-5, KV cache, sparse attention, mixture of experts, quantizzazione modelli, coding agents, modelli cinesi open weight, Demis Hassabis
20 tag totali, mix italiano/inglese ~50/50.
Segmento sorgente: 01:09:25 - 01:10:25 (Stefano racconta come Hermes Agent gli ha creato un evento in calendario).
(0-3s) [TESTO OVERLAY] L'AI mi ha creato un evento in calendario. Da sola.
(3-40s) Ho installato Hermes Agent, l'alternativa open di Nous Research
a Claude Code. Gira con GLM-5.1 su un vecchio PC che avevo in
cantina. Gli ho chiesto di ricordarmi una cosa da fare su GitHub.
Lui mi ha risposto: non ho i permessi per la mail, ma ti faccio
un evento sul calendario. Cerco un buco. Mezz'ora alle dodici?
Si', fammi l'evento. Me l'ha creato con tutta la descrizione del
task. Senza che gli dicessi come.
(40-50s) E questa e' la parte facile. Adesso gli sto facendo monitorare
i paper su Arxiv e le code review su GitHub.
(50-58s) Episodio completo sul canale, link nel primo commento.
L'AI mi ha creato un evento in calendario. Da sola.Hermes Agent, GLM-5.1, vecchio PC.Gli ho chiesto solo di ricordarmelo.Adesso fa anche code review e Arxiv.Hermes Agent gira da solo con GLM-5.1, gestisce mail, calendario e ricerca paper su Arxiv. Il deep-dive nell'episodio 50 di Risorse Artificiali.
https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=youtube_short&utm_medium=description&utm_campaign=ep50_drop
#AIagents #Claude #intelligenzaartificiale
Episodio completo (1h15m): DeepSeek V4 e l'attention che taglia il 78% di compute, Vision Banana, Roo Code che chiude, Hermes Agent in deep-dive.
https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=youtube_short&utm_medium=pinned&utm_campaign=ep50_drop
Publishing: Lunedi’ 4 maggio 2026, 09:00 Europe/Rome (gap +2gg dal drop sabato, peak audience IT lunedi’ mattina).
Segmento: ~29:00 - 30:15 (75 sec). Stefano spiega come DeepSeek V4 arriva a 1M di token con il 78% in meno di compute grazie a sliding window + CSA + HCA.
Relazione con lo YT Short: complementare. YT Short = Hermes Agent narrative (casual scroller, emotivo). Spotify Clip = DeepSeek V4 architettura (tech, contrarian). Bacini di pubblico diversi, zero overlap.
“Praticamente loro arrivano a un milione di token spendendo il 78% meno di potenza di calcolo. Perche’ sostanzialmente, anziche’ avere una KV cache piatta, chiave-valore, hanno fatto un sistema gerarchico di memoria ad albero. In modo tale da recuperare piu’ velocemente quelle porzioni di KV cache che sono significative per l’attenzione di quel momento. Questo livello di compressione viene fatto per pagine di KV cache piu’ o meno grandi a seconda di quanto il contesto e’ vecchio. La CSA va sulle cose non piu’ nuove ma non troppo vecchie, mentre la HCA va sulle cose piu’ vecchie. Piu’ il contesto diventa vecchio, piu’ comprimo.”
DeepSeek V4: 78% meno compute1M di token, nuova attention1M di token, 78% meno compute (30 char)
Publishing: STESSO MOMENTO del drop episodio (sabato 2 maggio 2026, 13:00 Europe/Rome). Zero gap.
Roo Code ha chiuso questa settimana, e nel blog di sunset ha lasciato una frase che mi ha tormentato per giorni: "non crediamo che gli IDE siano il futuro del coding".
Detta da chi ha costruito uno dei primi e piu' diffusi agenti dentro VS Code, e' una posizione netta. E va letta insieme al resto della settimana: i cinesi hanno rilasciato tre modelli open weight in pochi giorni (DeepSeek V4 Pro e Flash, Kimi K2.6, MiMo V2.5), DeepSeek ha pubblicato un paper architetturale che taglia il 78% di compute sulla KV cache, Salvatore Sanfilippo ha mostrato come far girare V4 Flash su un Mac mini con quantizzazione mista Q2/Q8, e Z.AI ha fatto un post-mortem pubblico sul bug async cache di GLM-5 contribuendo il fix a SGLang.
Il filo che le tiene tutte assieme e' uno: il movimento si sta spostando dalla ricerca pura all'ingegneria. Piu' gente con background di sistemi, performance, distribuzione. Meno gente con paper su arxiv come unico output.
E per chiudere il cerchio, ho passato la settimana a giocare con Hermes Agent (l'alternativa open di Nous Research a Claude Code, gira con GLM-5.1) facendogli gestire mail, calendario, paper di Arxiv. Una sensazione precisa: se il 2024 e' stato l'anno del coding agent, il 2026 e' l'anno dell'agent generalista che lavora in autonomia mentre dormi.
Episodio 50 di Risorse Artificiali, online da sabato.
https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=linkedin&utm_medium=post&utm_campaign=ep50_drop
#AIEngineering #AIAgents #IntelligenzaArtificiale #LLM
229 parole. Voce: Stefano (deep-dive Hermes da’ il filo conduttore).
Publishing hint: Martedi’ 5 maggio 2026, 14:00 Europe/Rome (+3gg dal drop, peak audience IT, cavalca long-tail YT del weekend).
Roo Code chiude: "gli IDE non sono il futuro del coding".
I cinesi rilasciano 3 modelli open weight in una settimana. DeepSeek V4 taglia il 78% di compute sulla KV cache. Hermes Agent gira da solo mentre dormo.
Puntata 50, online sabato. #AIagents
https://youtu.be/qKl4Vkb6BMw?utm_source=x&utm_medium=tweet&utm_campaign=ep50_drop
274/280 char (link conta come 23 char per il t.co di X).
Publishing: stesso slot del LinkedIn — Martedi’ 5 maggio 14:00 Europe/Rome.
codiceartificialeModalita’: bullet (default). 47 parole. Da inserire nell’intro della prossima edizione regolare di codiceartificiale.
- Sabato e' uscita la puntata 50 di Risorse Artificiali. Tre modelli cinesi open weight, DeepSeek V4 che taglia il 78% di compute sulla KV cache, e il mio deep-dive su Hermes Agent (gira da solo con GLM-5.1 e mi gestisce mail e calendario). Ascolta: https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=codiceartificiale&utm_medium=newsletter&utm_campaign=ep50_drop
Publishing: nella prossima edizione regolare della newsletter codiceartificiale (nessun orario forzato).
I meta og:* e schema.org JSON-LD sono generati automaticamente dal layout episode.html + _includes/head/custom.html consumando i campi del frontmatter v3.0. Il preview qui e’ per verifica.
DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Hermes Agent gira in autonomia mentre dormo.
Path: /assets/images/episodes/ep50.png (1280x720, 16:9). Generato al cap. 13.
{
"@context": "https://schema.org",
"@type": "PodcastEpisode",
"name": "L'AI che non dorme: da DeepSeek V4 ad Hermes Agent",
"description": "DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Hermes Agent gira in autonomia mentre dormo.",
"datePublished": "2026-05-02",
"episodeNumber": 50,
"url": "https://risorseartificiali.com/2026/05/02/ai-non-dorme-deepseek-v4-hermes-agent",
"duration": "PT1H15M30S",
"associatedMedia": [
{
"@type": "VideoObject",
"contentUrl": "https://www.youtube.com/watch?v=qKl4Vkb6BMw"
},
{
"@type": "AudioObject",
"contentUrl": "https://open.spotify.com/episode/5PYjqRH2j4dI6zhHyW08Fb"
}
],
"partOfSeries": {
"@type": "PodcastSeries",
"name": "Risorse Artificiali",
"url": "https://risorseartificiali.com"
},
"image": "https://risorseartificiali.com/assets/images/episodes/ep50.png"
}
Verifica post-deploy: https://search.google.com/test/rich-results
| Campo | Valore |
|---|---|
| Hook 3 parole | "L'AI NON DORME" (13 char) |
| Tono emozionale | Deciso / sfidante (sopracciglio alzato, sguardo fisso) |
| Background | #FFC700 giallo saturo (scettico/shock, contrarian) |
| Testo colore | #000000 nero bold, no outline |
| Soggetto | 1 host (Stefano), 50% frame, dx |
| Composizione | Split: testo sx 40%, soggetto dx 50%, safe area badge bottom-right |
| File output | /assets/images/episodes/ep50.png |
| Dimensioni | 1280x720 minimum (1920x1080 ideale) |
⚠️ Differenziazione feed: se gli ultimi 2-3 drop erano gialli, switcha a #39FF14 verde o #E63946 rosso.
Italian male podcaster in his early 40s with short dark hair and a slight beard, looking directly at camera with a sharp decisive expression, one eyebrow slightly raised suggesting skepticism, intense focused gaze. He occupies the right 50% of the frame, framed from the chest up.
Text in image: "L'AI NON DORME" in bold condensed sans-serif ultra-heavy weight, pure black (#000000) with no outline, positioned on the left side of the frame vertically centered, split across two lines: "L'AI" smaller on top, "NON DORME" larger below, filling approximately 40% of the frame width.
Style: photorealistic YouTube thumbnail, 16:9 aspect ratio, saturated yellow #FFC700 background wall, uniform color, high contrast, dramatic portrait lighting from upper left, 85mm lens shallow DOF, attention-grabbing in a feed at 246x138 pixels.
Negative: no circle portraits, no dark blue cosmic background, no multiple faces in rows, no formal stiff poses, no obituary aesthetic, no garbled characters in text, no episode number visible, no platform logos.
--style realistic --aspect 16:9 --magic_prompt OFF
YouTube thumbnail, 16:9 aspect ratio, 1280x720, photorealistic style, high contrast, punchy saturated colors.
Composition: subject on the right 50% of frame, bold text on the left 40%, split top/bottom text layout.
Subject: Italian male podcaster, early 40s, short dark hair, slight beard, looking directly at camera with a sharp decisive expression, one eyebrow slightly raised, intense focused gaze suggesting confident contrarian take. Framed from chest up.
Background: solid saturated yellow (#FFC700), uniform, no gradient, no elements.
Lighting: dramatic key light from upper left, shallow depth of field, subject in focus, background perfectly smooth.
Camera: 85mm portrait lens feel.
Text overlay integrated in the image: the words "L'AI NON DORME" rendered in bold condensed sans-serif ultra-heavy weight, pure black (#000000) with no outline, positioned on the left side vertically centered, split across two lines with "L'AI" smaller on top and "NON DORME" larger below, filling approximately 40% of the frame width. Text must be crisp, properly kerned, every letter perfectly legible including the apostrophe in L'AI.
Mood: decisive, confident, contrarian.
Negative: no circle portraits, no dark blue cosmic backgrounds, no multiple faces in rows, no formal stiff poses, no obituary aesthetic, no garbled characters in text, no lorem ipsum, no episode number visible, no platform logos.
Create a YouTube thumbnail image, 16:9 aspect ratio, photorealistic style.
An Italian male podcaster in his early 40s with short dark hair and a slight beard, looking directly at the camera with a sharp decisive expression and one slightly raised eyebrow, suggesting confident skepticism. He fills the right half of the frame, framed from the chest up.
Background: solid saturated yellow (#FFC700), no elements. Portrait lens feel, shallow depth of field, dramatic lighting from upper left.
Include the text "L'AI NON DORME" rendered prominently in the image as bold condensed sans-serif, pure black with no outline, positioned on the left side of the frame, split across two lines with "L'AI" on top and "NON DORME" larger below. The text must be perfectly legible, crisp, integrated as part of the composition, not as watermark. Filling approximately 40% of the frame width.
Style: high-contrast YouTube thumbnail aesthetic, attention-grabbing in a feed at 246x138 pixels.
Avoid: circular portrait frames, dark blue cosmic backgrounds, multiple faces in rows, stiff corporate poses, garbled text, obituary aesthetic, episode numbers visible, platform logos.
Text in image... / Include the text...)L'AI NON DORME (split 2 righe)#000000 no outlineL'AI NON DORME esatto (apostrofo incluso, no glyph strani)/assets/images/episodes/ep50.pngSezione omessa — non applicabile a episodi numerati.
/assets/images/episodes/ep50.pngyoutube_short + pinned comment con UTM pinnedapple_episode_url: al frontmatteryoutube_short)codiceartificiale_posts/2026-05-02-ai-non-dorme-deepseek-v4-hermes-agent.md/assets/images/episodes/ep50.png# apple_episode_url: commentato. Quando Apple Podcasts auto-pubblica via RSS (T+4-24h dal drop), estrai l’URL e decommenta il campo con un micro-commit separato.ep50_drop come campaign. Non modificarlo nelle pubblicazioni (altrimenti perdi attribution cross-piattaforma).thumbnail-gen v1.1.#FFC700 e’ la scelta primaria; controlla gli ultimi 2-3 drop per evitare ripetizioni e switcha a verde #39FF14 o rosso #E63946 se serve.| Campo | Valore |
|---|---|
| Titolo target | L’AI non e’ un equalizzatore | Stefano Gatti |
| YT ID | c2Xpixk2LXw |
| Durata | 1:38:07 |
| Views (al 2026-04-30) | 63 |
| Pubblicato | 2026-04-29 (T-3 dal drop ep50) |
| URL | https://www.youtube.com/watch?v=c2Xpixk2LXw |
Razionale:
L’episodio corrente al cap 51:32 contiene un invito esplicito di Stefano: “e’ uscita mercoledi’ l’intervista a Stefano Gatti, andate a sentirvela”. L’end screen e’ il pay-off naturale di quella call. Si tratta di un’intervista lunga (~1h38m) self-contained che il viewer puo’ iniziare subito dopo l’outro. Score finale 0.911, semantic match 0.95 (callback diretto), recency 0.989 (drop T-3gg). View count basso (63) ma compensato dal timing perfetto e dal pay-off narrativo. Vince come end screen invece che card perche’ il viewer arriva qui dopo aver consumato l’invito completo, momento di massima propensione al click-through.
Setup in YT Studio (operativo, ~90s):
qKl4Vkb6BMw → Editor → End screenhttps://www.youtube.com/watch?v=c2Xpixk2LXwLe YT Cards si configurano in YT Studio → Editor video → Cards. Ogni card mostra un teaser nell’angolo superiore destro per 5-10 secondi al timestamp impostato, poi resta cliccabile come icona “i” fino a fine video.
06:45 del video corrente| Campo | Valore |
|---|---|
| Linka video | Oltre la Chat: Gemini, Agenti e la corsa all’AGI tra Hassabis, Amodei |
| YT ID target | Xbi1FBoADto |
| URL | https://www.youtube.com/watch?v=Xbi1FBoADto |
| Tema della card | Hassabis e l’AGI |
| Custom message | “Hassabis e Amodei sull’AGI” |
| Teaser text | “Approfondisci AGI” |
Razionale:
Al min 06:45 di questo episodio Stefano sta dicendo “una cosa che diceva Hassabis nell’intervista che ho anticipato”. L’episodio target del 31/01/2026 ha Hassabis e Amodei nel titolo: match diretto al filone Hassabis/AGI che ep50 riprende anche al cap 33:30 (distillation, Gemini Flash). [low-conf: il post non ha chapters H2 estratti, semantic basato su title + description]
19:00 del video corrente| Campo | Valore |
|---|---|
| Linka video | Dal leak di Claude Code a Lince e antivocale |
| YT ID target | 9t03EZBL34A |
| URL | https://www.youtube.com/watch?v=9t03EZBL34A |
| Tema della card | KV cache + Z.AI quantizzazione |
| Custom message | “Turbo Quant + Z.AI bug” |
| Teaser text | “KV cache deep-dive” |
Razionale:
Al min 19:00 di questo episodio Paolo sta raccontando il bug async cache di Z.AI/GLM-5 con la PR a SGLang. L’episodio del 04/04/2026 contiene match doppio nei chapters: “Turbo Quant e quantizzazione KV cache: i primi risultati” (filone DeepSeek V4 sparse attention di ep50) + “GLM 5 di ZAI: quando la quantizzazione aggressiva rompe tutto” (filone Z.AI post-mortem di ep50). Score 0.881, semantic 0.90, dead-on match.
35:00 del video corrente| Campo | Valore |
|---|---|
| Linka video | L’AI che cambia tutto: LLM Council Karpathy + Open Router |
| YT ID target | iNbxngud1us |
| URL | https://www.youtube.com/watch?v=iNbxngud1us |
| Tema della card | Karpathy + distillation/multi-modello |
| Custom message | “LLM Council di Karpathy” |
| Teaser text | “Open Router e distillation” |
Razionale:
Al min 35:00 di questo episodio Stefano sta parlando di distillation e Gemini Flash usato in produzione da Google (“siamo riusciti a far dare delle risposte a Flash che sono di altissima qualita’ spendendo meno di un quindicesimo a livello di potenza di calcolo”). L’episodio del 29/11/2025 contiene chapter “Esperimento LLM Council di Karpathy” + “Open Router e Deployment Ibrido”: match al tema deployment multi-modello + Karpathy citato 2x in ep50 (verbosita’ al cap 04:15, Auto Research al cap 01:04:55).
55:00 del video corrente| Campo | Valore |
|---|---|
| Linka video | Intervista a Simone Di Somma: lezioni da Y Combinator (Cyberwave) |
| YT ID target | Q5s4643t4GE |
| URL | https://www.youtube.com/watch?v=Q5s4643t4GE |
| Tema della card | Robotica e Cyberwave |
| Custom message | “Simone Di Somma, Cyberwave” |
| Teaser text | “Robotica con Y Combinator” |
Razionale:
Al min 55:00 di questo episodio Stefano dice testualmente “abbiamo intervistato Simone di Somma a gennaio sull’argomento Cyberwave”. Card al timestamp esatto del nominativo per massima rilevanza. Callback nominale diretto: il viewer non deve cercare l’intervista, la trova nel momento in cui sente il nome. [low-conf sul post ma callback esplicito = semantic alta 0.90]
1:04:55 del video corrente| Campo | Valore |
|---|---|
| Linka video | Paolo in fissa Claude Code… con OpenClaw all’arrivo |
| YT ID target | 1dWdyCTovQU |
| URL | https://www.youtube.com/watch?v=1dWdyCTovQU |
| Tema della card | OpenCode parallelo a Hermes Agent |
| Custom message | “Claude Code + OpenClaw” |
| Teaser text | “Coding agents alternative” |
Razionale:
Al min 1:04:55 di questo episodio si apre il chapter Hermes Agent. La frase di apertura di Stefano e’: “Hermes Agent… e’ un’alternativa a OpenClaw”. L’episodio del 14/02/2026 nel titolo cita esplicitamente OpenClaw + Claude Code, parallelo diretto. Il viewer interessato a coding agents ha qui il riferimento storico al thread.
qKl4Vkb6BMw → Editor → CardsDurata totale ep50: ~1:15:30 (4530 secondi).
| Card | Timestamp video corrente | Posizione relativa | Gap dal precedente |
|---|---|---|---|
| Card 1 | 06:45 | 8.9% (early hook, primi 15-20%) | — |
| Card 2 | 19:00 | 25.2% | 12:15 |
| Card 3 | 35:00 | 46.4% (a meta’) | 16:00 |
| Card 4 | 55:00 | 72.8% | 20:00 |
| Card 5 | 01:04:55 | 86.0% (verso fine, prima dell’end screen) | 09:55 |
Tutti i gap sono » 90s minimum richiesto. Distribuzione uniforme lungo l’episodio. Nessun cluster.
| Video | Score finale | Semantic | Recency | Views (log) | Note |
|---|---|---|---|---|---|
| End screen — Stefano Gatti Apr29 | 0.911 | 0.95 | 0.989 | 0.706 | Callback esplicito ep50 cap 51:32 |
| Card 1 — Hassabis/Amodei AGI | 0.779 | 0.80 | 0.704 | 0.815 | Hassabis nel titolo, low-conf no chapters |
| Card 2 — Lince/TurboQuant/ZAI | 0.881 | 0.90 | 0.898 | 0.806 | Match doppio: KV cache + Z.AI |
| Card 3 — Karpathy LLM Council | 0.681 | 0.70 | 0.553 | 0.791 | Karpathy + Open Router |
| Card 4 — Simone Di Somma Cyberwave | 0.820 | 0.90 | 0.642 | 0.822 | Callback nominale, low-conf no chapters |
| Card 5 — Claude Code/OpenClaw | 0.740 | 0.70 | 0.743 | 0.847 | OpenCode parallelo Hermes |
Pesi: semantic 0.55, recency 0.25 (decay esponenziale half-life 6 mesi), views log-normalizzata 0.20.
.claude/skills/youtube-cross-link/.cache/channel-videos.json e re-invoca la skill._cross-link-v2.md.