Volevo raccontare il tennis. Ho finito per costruirmi un database che si aggiorna da solo.
La storia vera — con i vicoli ciechi — di come ho dato un corpo di dati al mio modo di raccontare il tennis. Usando Claude, Gemini e zero euro in più.
📌 Ho creato un canale dove racconto il tennis a modo mio. Per scriverlo meglio mi serviva una cosa sola: i dati. Questa è la storia di come me li sono costruiti - con un paio di vicoli ciechi, una svolta inattesa, e una lezione che vale per qualsiasi cosa tu voglia fare con l’AI.
La passione, poi il problema
Qualche giorno fa ho aperto un canale che si chiama Game, Set e Sudore. Non ci scrivo i risultati: ci scrivo le storie. Come quella del tennista coi jeans strappati che mi ha fatto innamorare di questo sport.
Quando racconto, mescolo due voci, quelle voci che mi hanno fatto innamorare di questo sport. Quella di Gianni Clerici; il poeta del tennis, quello che ti fa sentire il vento sul campo. E quella di Rino Tommasi; i numeri esatti, asciutti, senza un aggettivo di troppo.
Quello che racconto in questo articolo, è qualcosa che va oltre il tennis, è un modo perfetto per crearsi i propri strumenti usando dati, così da essere pronti per dare valore.
Il problema è che la poesia ce l’avevo. I numeri no. E senza i numeri giusti, anche la storia più bella zoppica.
Il tesoro: 987.000 partite in un file
Cercando, ho trovato il lavoro di un americano, Jeff Sackmann. Da anni raccoglie e regala i dati del tennis: un archivio pubblico su GitHub con circa 987.000 partite e 66.000 giocatori, dal 1968 a oggi. Gratis.
Con Claude ho fatto due cose.
Primo: ho portato tutto offline, dentro un mio database, così non dipendo dal sito di nessuno.
Secondo: l’ho messo sul mio server e l’ho reso interrogabile direttamente da Claude, tramite MCP.
MCP, detto semplice, è un modo standard per dare a Claude degli strumenti suoi. Invece di copiare e incollare, ora gli chiedo “i precedenti tra Sinner e Alcaraz” e lui apre il database, cerca e risponde. In pochissimo tempo.
È lo stesso spirito di quando ho smesso di “costruire app” per ragionare a strumenti.
Ma i dati invecchiano (e i vicoli ciechi)
C’è un però. Sackmann aggiorna i dati a periodi, non in tempo reale. In piena stagione, con un torneo in corso, resti indietro di settimane.
Per scrivere “a caldo” non bastava.
Così ho cercato una fonte fresca. E qui sono partiti i vicoli ciechi.
Un database si presentava come “aggiornato ogni giorno”. Sono andato a controllare i dati veri: fermo da gennaio.
Lezione numero uno: verifica, non fidarti della descrizione.
Poi ho pagato 9 dollari per un servizio dati sportivi. Ottimo sullo storico, ma sul torneo in corso arrivava in ritardo esattamente come Sackmann. Cancellato.
Ho pagato per scoprire che non mi serviva.
La svolta: l’ho chiesto a Gemini
A un certo punto mi sono fatto una domanda banale: e se lo chiedessi a Gemini?
Google indicizza i risultati sportivi quasi in tempo reale. E l’API di Gemini sa cercare su Google mentre risponde, citando le fonti. Gratis fino a 1.500 richieste al giorno — io ne faccio una manciata.
Funziona davvero: gli chiedo com’è andata la partita di ieri e me la racconta col contesto, l’infortunio, il crampo, la rimonta.
A volte prende perfino il punteggio dal vivo con cinque minuti di ritardo.
È la versione “fatta in casa” di quello che già facevo a mano per analizzare Sinner.
Il trucco che ha sbloccato tutto? Gemini non sa che ore sono. Da solo pensava fosse notte fonda e mi dava dati vecchi, o si rifiutava, convinto che un torneo del 2026 fosse “nel futuro”. Gli ho semplicemente scritto l’ora corrente nella domanda. Da lì, preciso.
E i limiti, perché qui si è onesti: le statistiche fini, ace, errori non forzati, vivono dentro i riquadri interattivi di Google, che l’API non riesce a leggere. Quelle arrivano dopo, dallo storico di Sackmann. Quindi: Gemini per il racconto fresco, Sackmann per i numeri profondi.
L’ha costruito una squadra di agenti, a costo basso
La parte che mi ha sorpreso di più non è il risultato, è come ci sono arrivato. Non l’ho scritto io riga per riga. L’hanno fatto più agenti di Claude che lavorano insieme: uno scriveva il codice partendo dai test, un altro lo controllava, un altro ancora lo incastrava nel server. Coordinati. In un pomeriggio.
Il database fresco ora si aggiorna da solo quattro volte al giorno.
E i costi? Ho l’abbonamento Max di Claude, 100 euro al mese. Nonostante un uso molto intensivo, non ho mai toccato un limite. Mai. E Gemini, per quello che mi serve, è gratis. La parte “aumentata” della creatività, oggi, costa molto meno di quanto pensi.
Le due voci, ora con un motore
Torniamo all’inizio. Il mio modo di raccontare il tennis sono due voci: Clerici, la poesia. Tommasi, i numeri.
Ora quelle due voci hanno un corpo tecnico. Il racconto fresco me lo dà Gemini (che aggiorna un DB Live, così da tenere traccia dei risultati, fino a quando il DB principale non sarà aggiornato). I numeri profondi me li dà Sackmann. Tutto sul mio server, sotto il mio controllo, richiamabile sia da qui sia da Claude sul web.
Non avevo in mente di costruire un database. Volevo solo scrivere meglio di tennis. È finita che mi sono costruito lo strumento, e ho imparato più da questo che da dieci tutorial.
Il tuo Sackmann è già là fuori
Io ho trovato il tennis. Ma un archivio così, pubblico e già pronto, esiste anche per il tuo mestiere.
A volte ce l’hai già in casa senza saperlo, a volte lo scarichi gratis con un click. Il punto è iniziare a guardare i dati come una miniera, non come cartelle sparse.
Se fai il fotografo, una parte del tesoro è già sul tuo disco: il catalogo di Lightroom è un database, e dentro ha anni di scatti già catalogati, con parole chiave, valutazioni, dati di scatto e cronologia delle modifiche. Quello esiste, va solo convertito.
Ma c’è anche un archivio pubblico enorme da scaricare, il dataset di Unsplash: la versione base è gratuita, 25.000 foto con le relative parole chiave, e quella completa arriva a milioni di immagini. Dentro ci sono i colori dominanti e i dati su quali fotocamere, modelli e obiettivi funzionano meglio.
Materiale per capire cosa cerca davvero il mercato delle immagini.
Se sei un creativo, un grafico, un illustratore, il regalo arriva dai musei.
Il Metropolitan di New York mette a disposizione i dati di oltre 470.000 opere, gratis, in un file scaricabile aggiornato ogni settimana: epoca, tecnica, cultura, dimensioni, autore. E non è il solo, tanti grandi musei fanno la stessa cosa.
Una biblioteca di riferimenti visivi da interrogare a piacere.
Non sono esempi a caso. Sono archivi già pronti, gratuiti, che parlano del tuo mestiere.
Se anche tu hai una passione e un mucchio di dati sparsi, la domanda da farti non è “so programmare?”.
È “che strumento mi serve?”.
Poi lo costruisci pezzo per pezzo, verificando ogni passo. Io sono partito dal tennis.
Tu da dove parti?
Articoli correlati
Quanto un tennista mi ha fatto innamorare perché non era conforme al mondo
285 miliardi evaporati in 48 ore: perché costruire un’app è già un pensiero vecchio
Fonti
Jeff Sackmann — tennis_atp (dati ATP, GitHub) — archivio pubblico, dal 1968
Gemini API — Grounding with Google Search — Google, 2026
Gemini API — Pricing (quota grounding gratuita) — Google, 2026
TheSportsDB — Free/Premium Sports API — listino premium $9/mese
Model Context Protocol (MCP) — lo standard per dare strumenti a Claude
Unsplash Dataset, archivio pubblico di immagini e metadati su GitHub
The Metropolitan Museum of Art, Open Access, dati di oltre 470.000 opere con licenza CC0 su GitHub








