Promo — L’AI che non dorme: da DeepSeek V4 ad Hermes Agent

File consolidato con TUTTI i deliverable del drop nuovo episodio. Generato da podcast-promo v4.1 il 2026-04-30. Identifier campaign: ep50_drop


Cheat sheet

Campo Valore
Titolo L’AI che non dorme: da DeepSeek V4 ad Hermes Agent
Format numerato
Episode number 50
Drop date 2026-05-02 13:00 Europe/Rome
YouTube ID qKl4Vkb6BMw -> https://www.youtube.com/watch?v=qKl4Vkb6BMw
Spotify Episode ID 5PYjqRH2j4dI6zhHyW08Fb -> https://open.spotify.com/episode/5PYjqRH2j4dI6zhHyW08Fb
Apple URL null (da aggiungere post-publish Apple RSS, T+4-24h)
Thumbnail path /assets/images/episodes/ep50.png
Jekyll post path _posts/2026-05-02-ai-non-dorme-deepseek-v4-hermes-agent.md
Newsletter codiceartificiale (modalita’ bullet)

1. Titolo

L'AI che non dorme: da DeepSeek V4 ad Hermes Agent

50 caratteri (limite 60). Pattern numerato: hook-first (“L’AI che non dorme”) seguito da specifica tecnica (“DeepSeek V4 ad Hermes Agent”). Keyword tech in zona utile (DeepSeek V4 al char 24).


2. Hook 30s scripted

Da registrare in coda all’episodio (3-4 take) e montare in apertura. Sigla max 3 sec.

Variante A — contro-intuitivo (claim Roo Code)

(0s)   Roo Code chiude dicendo: "gli IDE non sono il futuro".

(5s)   Mentre i cinesi rilasciano tre modelli open weight nuovi
       e DeepSeek V4 taglia il 78% di compute sulla KV cache.

(12s)  Ti raccontiamo cosa cambia davvero per chi scrive codice oggi,
       e perche' Hermes Agent mi gestisce mail e calendario mentre dormo.

(22s)  Siamo Stefano, Paolo e Alessio, puntata 50 di Risorse Artificiali.

(28s)  Andiamo.

Variante B — numerico / caso d’uso (DeepSeek-first)

(0s)   Tre modelli cinesi open weight in una settimana.
       DeepSeek V4 in testa, un milione di token di contesto.

(5s)   E una nuova attention che taglia il 78% di compute sulla KV cache.

(12s)  Sanfilippo lo fa girare su un Mac mini, Roo Code chiude
       dicendo "gli IDE sono finiti", e Hermes Agent mi gestisce
       le mail mentre dormo.

(22s)  Siamo Stefano, Paolo e Alessio, puntata 50 di Risorse Artificiali.

(28s)  Andiamo.

Regole: zero saluti nei primi 5s, autopromozione a fine video, sigla max 3s.


3. Chapters YouTube

Da incollare in YT Studio > Dettagli > Descrizione (timestamps in formato HH:MM, primo capitolo a 00:00).

00:00 Settimana cinese: DeepSeek V4, Kimi K2.6, MiMo V2.5
04:15 Token efficiency, adaptive thinking e Hassabis sui context window
10:47 DeepSeek V4: 1.6T MoE e quantizzazione mista di Sanfilippo
14:20 Dalla ricerca pura all'ingegneria del software
17:33 Z.AI post-mortem: bug async cache e fix in SGLang
25:07 Sliding window, CSA e HCA: 78% meno compute sulla KV cache
33:30 Gemini Flash, distillation e FP4 quantization aware
41:53 Jensen vs Dwarkesh e Vision Banana di DeepMind
51:32 Robotica, hackathon e Stefano Gatti relaunch
58:25 Roo Code chiude e Lince.sh: il futuro post-IDE
1:04:55 Hermes Agent: GLM-5.1, mail e calendario in autonomia

11 capitoli su ~75 min, media ~6:50 per chapter.

⚠️ Se monti l’hook 30s del cap. 2 in apertura (prima del contenuto attuale), tutti i timestamp shiftano di ~+30s. Aggiusta al paste in YT Studio.


4. Descrizione YouTube

DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Hermes Agent gira in autonomia su un vecchio PC mentre dormo. Settimana densa di modelli cinesi open weight, ottimizzazione architetturale e agenti che non si fermano mai.

In questa puntata: DeepSeek V4 Pro e Flash con un milione di token di contesto, Kimi K2.6 e MiMo V2.5 usciti nello stesso slot, e l'analisi di Salvatore Sanfilippo che fa girare V4 Flash su un Mac mini con quantizzazione mista Q2/Q8. Poi il post-mortem di Z.AI sul bug async cache di GLM-5 (con PR contributiva a SGLang), Vision Banana di Google DeepMind che usa la generazione immagini come interfaccia universale per i task di vision, e il keynote rotto di Jensen Huang nell'intervista con Dwarkesh Patel. Chiude la puntata il deep-dive di Stefano su Hermes Agent, l'alternativa open di Nous Research a Claude Code, che gira con GLM-5.1 e gestisce mail, calendario e paper di Arxiv in autonomia.

Aggiungiamo le interviste a Demis Hassabis (DeepMind) e Andrej Karpathy sull'efficienza dei modelli e sulla strada verso l'AGI, e i 40 miliardi che Google sta investendo in Anthropic.

🎙️ Capitoli:
00:00 Settimana cinese: DeepSeek V4, Kimi K2.6, MiMo V2.5
04:15 Token efficiency, adaptive thinking e Hassabis sui context window
10:47 DeepSeek V4: 1.6T MoE e quantizzazione mista di Sanfilippo
14:20 Dalla ricerca pura all'ingegneria del software
17:33 Z.AI post-mortem: bug async cache e fix in SGLang
25:07 Sliding window, CSA e HCA: 78% meno compute sulla KV cache
33:30 Gemini Flash, distillation e FP4 quantization aware
41:53 Jensen vs Dwarkesh e Vision Banana di DeepMind
51:32 Robotica, hackathon e Stefano Gatti relaunch
58:25 Roo Code chiude e Lince.sh: il futuro post-IDE
1:04:55 Hermes Agent: GLM-5.1, mail e calendario in autonomia

🔗 Link e risorse:
- Hermes Agent (Nous Research): https://hermes-agent.nousresearch.com/docs/
- Vision Banana: https://vision-banana.github.io/
- Roo Code sunsetting: https://roocode.com/blog/sunsetting-roo-code-extension-cloud-and-router
- Intervista Hassabis: https://www.youtube.com/watch?v=96jN2OCOfLs
- Intervista Karpathy: https://www.youtube.com/watch?v=JNyuX1zoOgU
- Lince.sh (sandbox open source per agenti): https://lince.sh

Ascolta su Spotify:
https://open.spotify.com/episode/5PYjqRH2j4dI6zhHyW08Fb?utm_source=youtube&utm_medium=description&utm_campaign=ep50_drop

Sito:
https://risorseartificiali.com/?utm_source=youtube&utm_medium=description&utm_campaign=ep50_drop

Iscriviti al canale per non perdere il prossimo episodio.

#50

Primi 125 char (snippet YT feed/search):

“DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Herm”

Lunghezza totale: ~270 parole.


5. Descrizione Spotify

DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude e Hermes Agent gira da solo.

Settimana densa: DeepSeek V4 Pro e Flash con 1M di contesto, Kimi K2.6 e MiMo V2.5, l'analisi di Salvatore Sanfilippo che fa girare V4 Flash su Mac mini con quantizzazione mista Q2/Q8, il post-mortem di Z.AI sul bug async cache di GLM-5 (con fix contributo a SGLang), Vision Banana di Google DeepMind che usa la generazione immagini come interfaccia universale per la vision, e il deep-dive di Stefano su Hermes Agent, l'alternativa open di Nous Research a Claude Code che gira con GLM-5.1 e gestisce mail, calendario e paper di Arxiv in autonomia.

In piu': le interviste a Demis Hassabis (DeepMind) e Andrej Karpathy sull'efficienza e sull'AGI, il keynote rotto di Jensen Huang con Dwarkesh Patel, e i 40 miliardi che Google investe in Anthropic.

Follow Risorse Artificiali per non perdere il prossimo episodio.

Versione video su YouTube:
https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=spotify&utm_medium=description&utm_campaign=ep50_drop

#50

Primi 100 char (snippet Spotify):

“DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude e Hermes Agent gira da solo.”

Lunghezza totale: ~170 parole.


6. Tag YouTube custom

CSV pronto da incollare in YouTube Studio > Dettagli > Tag:

intelligenza artificiale, AI engineering, podcast tech italia, AI italiano, DeepSeek V4, Kimi K2.6, MiMo V2.5, Hermes Agent, Nous Research, Claude Code, Roo Code, Vision Banana, GLM-5, KV cache, sparse attention, mixture of experts, quantizzazione modelli, coding agents, modelli cinesi open weight, Demis Hassabis

20 tag totali, mix italiano/inglese ~50/50.


7. YouTube Shorts script

Segmento sorgente: 01:09:25 - 01:10:25 (Stefano racconta come Hermes Agent gli ha creato un evento in calendario).

Script (~48 sec)

(0-3s)    [TESTO OVERLAY] L'AI mi ha creato un evento in calendario. Da sola.

(3-40s)   Ho installato Hermes Agent, l'alternativa open di Nous Research
          a Claude Code. Gira con GLM-5.1 su un vecchio PC che avevo in
          cantina. Gli ho chiesto di ricordarmi una cosa da fare su GitHub.
          Lui mi ha risposto: non ho i permessi per la mail, ma ti faccio
          un evento sul calendario. Cerco un buco. Mezz'ora alle dodici?
          Si', fammi l'evento. Me l'ha creato con tutta la descrizione del
          task. Senza che gli dicessi come.

(40-50s)  E questa e' la parte facile. Adesso gli sto facendo monitorare
          i paper su Arxiv e le code review su GitHub.

(50-58s)  Episodio completo sul canale, link nel primo commento.

Testo overlay mute-friendly

  1. L'AI mi ha creato un evento in calendario. Da sola.
  2. Hermes Agent, GLM-5.1, vecchio PC.
  3. Gli ho chiesto solo di ricordarmelo.
  4. Adesso fa anche code review e Arxiv.

Description Shorts

Hermes Agent gira da solo con GLM-5.1, gestisce mail, calendario e ricerca paper su Arxiv. Il deep-dive nell'episodio 50 di Risorse Artificiali.

https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=youtube_short&utm_medium=description&utm_campaign=ep50_drop

#AIagents #Claude #intelligenzaartificiale

Pinned comment template

Episodio completo (1h15m): DeepSeek V4 e l'attention che taglia il 78% di compute, Vision Banana, Roo Code che chiude, Hermes Agent in deep-dive.

https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=youtube_short&utm_medium=pinned&utm_campaign=ep50_drop

Publishing: Lunedi’ 4 maggio 2026, 09:00 Europe/Rome (gap +2gg dal drop sabato, peak audience IT lunedi’ mattina).


8. Spotify Clip spec

Segmento: ~29:00 - 30:15 (75 sec). Stefano spiega come DeepSeek V4 arriva a 1M di token con il 78% in meno di compute grazie a sliding window + CSA + HCA.

Relazione con lo YT Short: complementare. YT Short = Hermes Agent narrative (casual scroller, emotivo). Spotify Clip = DeepSeek V4 architettura (tech, contrarian). Bacini di pubblico diversi, zero overlap.

Trascrizione esatta del segmento

“Praticamente loro arrivano a un milione di token spendendo il 78% meno di potenza di calcolo. Perche’ sostanzialmente, anziche’ avere una KV cache piatta, chiave-valore, hanno fatto un sistema gerarchico di memoria ad albero. In modo tale da recuperare piu’ velocemente quelle porzioni di KV cache che sono significative per l’attenzione di quel momento. Questo livello di compressione viene fatto per pagine di KV cache piu’ o meno grandi a seconda di quanto il contesto e’ vecchio. La CSA va sulle cose non piu’ nuove ma non troppo vecchie, mentre la HCA va sulle cose piu’ vecchie. Piu’ il contesto diventa vecchio, piu’ comprimo.”

Testo overlay Spotify

Titolo Clip (max 50 char)

1M di token, 78% meno compute (30 char)

Publishing: STESSO MOMENTO del drop episodio (sabato 2 maggio 2026, 13:00 Europe/Rome). Zero gap.


9. Post LinkedIn (host)

Roo Code ha chiuso questa settimana, e nel blog di sunset ha lasciato una frase che mi ha tormentato per giorni: "non crediamo che gli IDE siano il futuro del coding".

Detta da chi ha costruito uno dei primi e piu' diffusi agenti dentro VS Code, e' una posizione netta. E va letta insieme al resto della settimana: i cinesi hanno rilasciato tre modelli open weight in pochi giorni (DeepSeek V4 Pro e Flash, Kimi K2.6, MiMo V2.5), DeepSeek ha pubblicato un paper architetturale che taglia il 78% di compute sulla KV cache, Salvatore Sanfilippo ha mostrato come far girare V4 Flash su un Mac mini con quantizzazione mista Q2/Q8, e Z.AI ha fatto un post-mortem pubblico sul bug async cache di GLM-5 contribuendo il fix a SGLang.

Il filo che le tiene tutte assieme e' uno: il movimento si sta spostando dalla ricerca pura all'ingegneria. Piu' gente con background di sistemi, performance, distribuzione. Meno gente con paper su arxiv come unico output.

E per chiudere il cerchio, ho passato la settimana a giocare con Hermes Agent (l'alternativa open di Nous Research a Claude Code, gira con GLM-5.1) facendogli gestire mail, calendario, paper di Arxiv. Una sensazione precisa: se il 2024 e' stato l'anno del coding agent, il 2026 e' l'anno dell'agent generalista che lavora in autonomia mentre dormi.

Episodio 50 di Risorse Artificiali, online da sabato.

https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=linkedin&utm_medium=post&utm_campaign=ep50_drop

#AIEngineering #AIAgents #IntelligenzaArtificiale #LLM

229 parole. Voce: Stefano (deep-dive Hermes da’ il filo conduttore).

Publishing hint: Martedi’ 5 maggio 2026, 14:00 Europe/Rome (+3gg dal drop, peak audience IT, cavalca long-tail YT del weekend).


10. Post X

Roo Code chiude: "gli IDE non sono il futuro del coding".

I cinesi rilasciano 3 modelli open weight in una settimana. DeepSeek V4 taglia il 78% di compute sulla KV cache. Hermes Agent gira da solo mentre dormo.

Puntata 50, online sabato. #AIagents

https://youtu.be/qKl4Vkb6BMw?utm_source=x&utm_medium=tweet&utm_campaign=ep50_drop

274/280 char (link conta come 23 char per il t.co di X).

Publishing: stesso slot del LinkedIn — Martedi’ 5 maggio 14:00 Europe/Rome.


11. Sezione newsletter codiceartificiale

Modalita’: bullet (default). 47 parole. Da inserire nell’intro della prossima edizione regolare di codiceartificiale.

- Sabato e' uscita la puntata 50 di Risorse Artificiali. Tre modelli cinesi open weight, DeepSeek V4 che taglia il 78% di compute sulla KV cache, e il mio deep-dive su Hermes Agent (gira da solo con GLM-5.1 e mi gestisce mail e calendario). Ascolta: https://www.youtube.com/watch?v=qKl4Vkb6BMw&utm_source=codiceartificiale&utm_medium=newsletter&utm_campaign=ep50_drop

Publishing: nella prossima edizione regolare della newsletter codiceartificiale (nessun orario forzato).


12. Meta tags sito (preview)

I meta og:* e schema.org JSON-LD sono generati automaticamente dal layout episode.html + _includes/head/custom.html consumando i campi del frontmatter v3.0. Il preview qui e’ per verifica.

og:description preview (155 char)

DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Hermes Agent gira in autonomia mentre dormo.

og:image preview

Path: /assets/images/episodes/ep50.png (1280x720, 16:9). Generato al cap. 13.

Schema.org PodcastEpisode JSON-LD preview

{
  "@context": "https://schema.org",
  "@type": "PodcastEpisode",
  "name": "L'AI che non dorme: da DeepSeek V4 ad Hermes Agent",
  "description": "DeepSeek V4 taglia il 78% di compute sulla KV cache, Roo Code chiude dicendo che gli IDE non sono il futuro, e Hermes Agent gira in autonomia mentre dormo.",
  "datePublished": "2026-05-02",
  "episodeNumber": 50,
  "url": "https://risorseartificiali.com/2026/05/02/ai-non-dorme-deepseek-v4-hermes-agent",
  "duration": "PT1H15M30S",
  "associatedMedia": [
    {
      "@type": "VideoObject",
      "contentUrl": "https://www.youtube.com/watch?v=qKl4Vkb6BMw"
    },
    {
      "@type": "AudioObject",
      "contentUrl": "https://open.spotify.com/episode/5PYjqRH2j4dI6zhHyW08Fb"
    }
  ],
  "partOfSeries": {
    "@type": "PodcastSeries",
    "name": "Risorse Artificiali",
    "url": "https://risorseartificiali.com"
  },
  "image": "https://risorseartificiali.com/assets/images/episodes/ep50.png"
}

Verifica post-deploy: https://search.google.com/test/rich-results


13. Brief thumbnail + 3 prompt image pronti

Brief

Campo Valore
Hook 3 parole "L'AI NON DORME" (13 char)
Tono emozionale Deciso / sfidante (sopracciglio alzato, sguardo fisso)
Background #FFC700 giallo saturo (scettico/shock, contrarian)
Testo colore #000000 nero bold, no outline
Soggetto 1 host (Stefano), 50% frame, dx
Composizione Split: testo sx 40%, soggetto dx 50%, safe area badge bottom-right
File output /assets/images/episodes/ep50.png
Dimensioni 1280x720 minimum (1920x1080 ideale)

⚠️ Differenziazione feed: se gli ultimi 2-3 drop erano gialli, switcha a #39FF14 verde o #E63946 rosso.

Prompt 1 — Ideogram (raccomandato come default)

Italian male podcaster in his early 40s with short dark hair and a slight beard, looking directly at camera with a sharp decisive expression, one eyebrow slightly raised suggesting skepticism, intense focused gaze. He occupies the right 50% of the frame, framed from the chest up.

Text in image: "L'AI NON DORME" in bold condensed sans-serif ultra-heavy weight, pure black (#000000) with no outline, positioned on the left side of the frame vertically centered, split across two lines: "L'AI" smaller on top, "NON DORME" larger below, filling approximately 40% of the frame width.

Style: photorealistic YouTube thumbnail, 16:9 aspect ratio, saturated yellow #FFC700 background wall, uniform color, high contrast, dramatic portrait lighting from upper left, 85mm lens shallow DOF, attention-grabbing in a feed at 246x138 pixels.

Negative: no circle portraits, no dark blue cosmic background, no multiple faces in rows, no formal stiff poses, no obituary aesthetic, no garbled characters in text, no episode number visible, no platform logos.

--style realistic --aspect 16:9 --magic_prompt OFF

Prompt 2 — Gemini 3 Pro

YouTube thumbnail, 16:9 aspect ratio, 1280x720, photorealistic style, high contrast, punchy saturated colors.

Composition: subject on the right 50% of frame, bold text on the left 40%, split top/bottom text layout.

Subject: Italian male podcaster, early 40s, short dark hair, slight beard, looking directly at camera with a sharp decisive expression, one eyebrow slightly raised, intense focused gaze suggesting confident contrarian take. Framed from chest up.

Background: solid saturated yellow (#FFC700), uniform, no gradient, no elements.

Lighting: dramatic key light from upper left, shallow depth of field, subject in focus, background perfectly smooth.

Camera: 85mm portrait lens feel.

Text overlay integrated in the image: the words "L'AI NON DORME" rendered in bold condensed sans-serif ultra-heavy weight, pure black (#000000) with no outline, positioned on the left side vertically centered, split across two lines with "L'AI" smaller on top and "NON DORME" larger below, filling approximately 40% of the frame width. Text must be crisp, properly kerned, every letter perfectly legible including the apostrophe in L'AI.

Mood: decisive, confident, contrarian.

Negative: no circle portraits, no dark blue cosmic backgrounds, no multiple faces in rows, no formal stiff poses, no obituary aesthetic, no garbled characters in text, no lorem ipsum, no episode number visible, no platform logos.

Prompt 3 — ChatGPT Image 2

Create a YouTube thumbnail image, 16:9 aspect ratio, photorealistic style.

An Italian male podcaster in his early 40s with short dark hair and a slight beard, looking directly at the camera with a sharp decisive expression and one slightly raised eyebrow, suggesting confident skepticism. He fills the right half of the frame, framed from the chest up.

Background: solid saturated yellow (#FFC700), no elements. Portrait lens feel, shallow depth of field, dramatic lighting from upper left.

Include the text "L'AI NON DORME" rendered prominently in the image as bold condensed sans-serif, pure black with no outline, positioned on the left side of the frame, split across two lines with "L'AI" on top and "NON DORME" larger below. The text must be perfectly legible, crisp, integrated as part of the composition, not as watermark. Filling approximately 40% of the frame width.

Style: high-contrast YouTube thumbnail aesthetic, attention-grabbing in a feed at 246x138 pixels.

Avoid: circular portrait frames, dark blue cosmic backgrounds, multiple faces in rows, stiff corporate poses, garbled text, obituary aesthetic, episode numbers visible, platform logos.

Fallback post-production (se il testo esce sporco)

  1. Rigenera senza il blocco testo nel prompt (commenta Text in image... / Include the text...)
  2. In Canva/Figma/Photopea aggiungi manualmente:
    • Testo: L'AI NON DORME (split 2 righe)
    • Font: Bebas Neue / Anton / Impact / Montserrat Black
    • Colore: #000000 no outline
    • Posizione: sinistra, vertically centered
    • Dimensione: ~40% frame width
  3. Esporta PNG 1280x720 (o 1920x1080)

Verifica pre-upload


14. Guest Launch Kit

Sezione omessa — non applicabile a episodi numerati.


15. Checklist Publishing

PRE-DROP

T-3gg / mercoledi’ 29 aprile

T-2gg / giovedi’ 30 aprile

T-1gg / venerdi’ 1 maggio

DROP / sabato 2 maggio 2026, 13:00

POST-DROP

Lunedi’ 4 maggio, 09:00

Martedi’ 5 maggio, 14:00

T+4-24h dal drop

MONITORING

T+7gg / sabato 9 maggio

T+30gg / lunedi’ 1 giugno


16. Link rapidi


17. Note operative


18. End screen + YT Cards (suggerito da youtube-cross-link v1.1)

End screen — 1 video (layout: Subscribe + Video)

Campo Valore
Titolo target L’AI non e’ un equalizzatore | Stefano Gatti
YT ID c2Xpixk2LXw
Durata 1:38:07
Views (al 2026-04-30) 63
Pubblicato 2026-04-29 (T-3 dal drop ep50)
URL https://www.youtube.com/watch?v=c2Xpixk2LXw

Razionale:

L’episodio corrente al cap 51:32 contiene un invito esplicito di Stefano: “e’ uscita mercoledi’ l’intervista a Stefano Gatti, andate a sentirvela”. L’end screen e’ il pay-off naturale di quella call. Si tratta di un’intervista lunga (~1h38m) self-contained che il viewer puo’ iniziare subito dopo l’outro. Score finale 0.911, semantic match 0.95 (callback diretto), recency 0.989 (drop T-3gg). View count basso (63) ma compensato dal timing perfetto e dal pay-off narrativo. Vince come end screen invece che card perche’ il viewer arriva qui dopo aver consumato l’invito completo, momento di massima propensione al click-through.

Setup in YT Studio (operativo, ~90s):

  1. YT Studio → Content → seleziona video qKl4Vkb6BMw → Editor → End screen
  2. Aggiungi elemento → Subscribe (canale Risorse Artificiali, gia’ selezionato di default)
  3. Aggiungi elemento → Video → Specific video → incolla https://www.youtube.com/watch?v=c2Xpixk2LXw
  4. Layout: pre-set “Subscribe + 1 video” (template B). Posiziona end screen negli ultimi 20 secondi del video corrente (timestamp consigliato: 01:15:10 → fine).
  5. Save.

YT Cards — 5 cards a timestamp specifici del video corrente

Le YT Cards si configurano in YT Studio → Editor video → Cards. Ogni card mostra un teaser nell’angolo superiore destro per 5-10 secondi al timestamp impostato, poi resta cliccabile come icona “i” fino a fine video.

Card 1 — Mostra al min 06:45 del video corrente

Campo Valore
Linka video Oltre la Chat: Gemini, Agenti e la corsa all’AGI tra Hassabis, Amodei
YT ID target Xbi1FBoADto
URL https://www.youtube.com/watch?v=Xbi1FBoADto
Tema della card Hassabis e l’AGI
Custom message “Hassabis e Amodei sull’AGI”
Teaser text “Approfondisci AGI”

Razionale:

Al min 06:45 di questo episodio Stefano sta dicendo “una cosa che diceva Hassabis nell’intervista che ho anticipato”. L’episodio target del 31/01/2026 ha Hassabis e Amodei nel titolo: match diretto al filone Hassabis/AGI che ep50 riprende anche al cap 33:30 (distillation, Gemini Flash). [low-conf: il post non ha chapters H2 estratti, semantic basato su title + description]


Card 2 — Mostra al min 19:00 del video corrente

Campo Valore
Linka video Dal leak di Claude Code a Lince e antivocale
YT ID target 9t03EZBL34A
URL https://www.youtube.com/watch?v=9t03EZBL34A
Tema della card KV cache + Z.AI quantizzazione
Custom message “Turbo Quant + Z.AI bug”
Teaser text “KV cache deep-dive”

Razionale:

Al min 19:00 di questo episodio Paolo sta raccontando il bug async cache di Z.AI/GLM-5 con la PR a SGLang. L’episodio del 04/04/2026 contiene match doppio nei chapters: “Turbo Quant e quantizzazione KV cache: i primi risultati” (filone DeepSeek V4 sparse attention di ep50) + “GLM 5 di ZAI: quando la quantizzazione aggressiva rompe tutto” (filone Z.AI post-mortem di ep50). Score 0.881, semantic 0.90, dead-on match.


Card 3 — Mostra al min 35:00 del video corrente

Campo Valore
Linka video L’AI che cambia tutto: LLM Council Karpathy + Open Router
YT ID target iNbxngud1us
URL https://www.youtube.com/watch?v=iNbxngud1us
Tema della card Karpathy + distillation/multi-modello
Custom message “LLM Council di Karpathy”
Teaser text “Open Router e distillation”

Razionale:

Al min 35:00 di questo episodio Stefano sta parlando di distillation e Gemini Flash usato in produzione da Google (“siamo riusciti a far dare delle risposte a Flash che sono di altissima qualita’ spendendo meno di un quindicesimo a livello di potenza di calcolo”). L’episodio del 29/11/2025 contiene chapter “Esperimento LLM Council di Karpathy” + “Open Router e Deployment Ibrido”: match al tema deployment multi-modello + Karpathy citato 2x in ep50 (verbosita’ al cap 04:15, Auto Research al cap 01:04:55).


Card 4 — Mostra al min 55:00 del video corrente

Campo Valore
Linka video Intervista a Simone Di Somma: lezioni da Y Combinator (Cyberwave)
YT ID target Q5s4643t4GE
URL https://www.youtube.com/watch?v=Q5s4643t4GE
Tema della card Robotica e Cyberwave
Custom message “Simone Di Somma, Cyberwave”
Teaser text “Robotica con Y Combinator”

Razionale:

Al min 55:00 di questo episodio Stefano dice testualmente “abbiamo intervistato Simone di Somma a gennaio sull’argomento Cyberwave”. Card al timestamp esatto del nominativo per massima rilevanza. Callback nominale diretto: il viewer non deve cercare l’intervista, la trova nel momento in cui sente il nome. [low-conf sul post ma callback esplicito = semantic alta 0.90]


Card 5 — Mostra al min 1:04:55 del video corrente

Campo Valore
Linka video Paolo in fissa Claude Code… con OpenClaw all’arrivo
YT ID target 1dWdyCTovQU
URL https://www.youtube.com/watch?v=1dWdyCTovQU
Tema della card OpenCode parallelo a Hermes Agent
Custom message “Claude Code + OpenClaw”
Teaser text “Coding agents alternative”

Razionale:

Al min 1:04:55 di questo episodio si apre il chapter Hermes Agent. La frase di apertura di Stefano e’: “Hermes Agent… e’ un’alternativa a OpenClaw”. L’episodio del 14/02/2026 nel titolo cita esplicitamente OpenClaw + Claude Code, parallelo diretto. Il viewer interessato a coding agents ha qui il riferimento storico al thread.


Setup in YT Studio (cards, operativo ~5min)

  1. YT Studio → Content → video qKl4Vkb6BMw → Editor → Cards
  2. Per ogni card sopra: a. Click “Aggiungi card” → Tipo “Video” → Cerca o incolla URL del video target b. Imposta “Show card at” al timestamp indicato c. (Opzionale) Compila Custom message + Teaser text dai campi della tabella
  3. Suggerimento: aggiungi tutte e 5 in una sessione, poi click Save una sola volta a fine.
  4. Verifica: riproduci il video corrente, scorri ai timestamp delle card, controlla che il teaser appaia per ~5 secondi nell’angolo superiore destro.

Distribuzione timestamp lungo l’episodio

Durata totale ep50: ~1:15:30 (4530 secondi).

Card Timestamp video corrente Posizione relativa Gap dal precedente
Card 1 06:45 8.9% (early hook, primi 15-20%)
Card 2 19:00 25.2% 12:15
Card 3 35:00 46.4% (a meta’) 16:00
Card 4 55:00 72.8% 20:00
Card 5 01:04:55 86.0% (verso fine, prima dell’end screen) 09:55

Tutti i gap sono » 90s minimum richiesto. Distribuzione uniforme lungo l’episodio. Nessun cluster.

Score breakdown (trasparenza algoritmo)

Video Score finale Semantic Recency Views (log) Note
End screen — Stefano Gatti Apr29 0.911 0.95 0.989 0.706 Callback esplicito ep50 cap 51:32
Card 1 — Hassabis/Amodei AGI 0.779 0.80 0.704 0.815 Hassabis nel titolo, low-conf no chapters
Card 2 — Lince/TurboQuant/ZAI 0.881 0.90 0.898 0.806 Match doppio: KV cache + Z.AI
Card 3 — Karpathy LLM Council 0.681 0.70 0.553 0.791 Karpathy + Open Router
Card 4 — Simone Di Somma Cyberwave 0.820 0.90 0.642 0.822 Callback nominale, low-conf no chapters
Card 5 — Claude Code/OpenClaw 0.740 0.70 0.743 0.847 OpenCode parallelo Hermes

Pesi: semantic 0.55, recency 0.25 (decay esponenziale half-life 6 mesi), views log-normalizzata 0.20.

Note operative