Guida completa · 15 min di lettura

Cos’è llms.txt?

La guida completa per i responsabili dei siti (edizione 2026).

Per far sì che ChatGPT, Claude e Perplexity capiscano davvero il tuo sito — e lo citino nelle risposte — esiste un file apposito: llms.txt. La specifica è stata pubblicata nel 2024. In Italia i termini GEO (Generative Engine Optimization) e SEO per l’IA stanno cominciando a diffondersi, ma siamo ancora ai primi passi. All’estero Stripe, Anthropic, Cloudflare e Vercel hanno già adottato lo standard.

Questa guida è pensata per chi gestisce un sito web in Italia e vuole occuparsene in autonomia, senza affidarsi a un’agenzia. Risponde anche alle domande più frequenti: «Vale davvero la pena?» e «L’IA non rischia di copiare i miei contenuti?»

1. Perché oggi serve un nuovo file

Per anni l’unico interlocutore a cui ottimizzare il sito era Google. L’obiettivo era apparire tra i dieci link blu della prima pagina, e la SEO tradizionale era lo strumento per arrivarci. Questo scenario sta cambiando rapidamente.

Quando un utente fa una domanda a ChatGPT, Claude o Perplexity, non riceve una lista di link ma una risposta diretta. Quella risposta cita generalmente da 2 a 7 siti, e il traffico si concentra proprio sulle fonti citate. È l’era della «ricerca AI».

Per chi gestisce un sito, questo significa due cambiamenti:

  • Una parte del traffico arriva ora dalle risposte delle AI, non più dalla pagina dei risultati di Google.
  • Essere citati o ignorati dall’IA influenza direttamente le visite al sito.

Il problema è che le AI leggono i siti in modo diverso da Google. Devono scaricare l’intera pagina HTML, poi setacciare navigazione, script, cookie banner, pubblicità e footer per trovare le informazioni utili. Questo ha un costo elevato, e il risultato pratico è che i siti più difficili da leggere vengono citati meno.

La specifica llms.txt nasce proprio per risolvere questo problema dal lato del sito. L’ha proposta Jeremy Howard (cofondatore di Answer.AI, autore di fast.ai) nel settembre 2024, e da allora la diffusione è cresciuta costantemente tra i principali siti internazionali.

2. Glossario: GEO, SEO per l’IA, LLMO e llms.txt

Il settore usa termini diversi per indicare concetti simili. Ecco una mappa rapida, pensata per il mercato italiano.

GEO (Generative Engine Optimization)
Il termine più diffuso a livello internazionale. Indica l’insieme delle attività per migliorare la visibilità di un sito nelle risposte generate da motori come Perplexity, Google AI Overviews e ChatGPT. In Italia lo usano soprattutto le agenzie e i professionisti SEO con una formazione anglosassone.
SEO per l’IA
La variante italiana più immediata: ottimizzazione per essere citati dai motori di ricerca basati sull’intelligenza artificiale. Preferita nei contenuti divulgativi e nei blog di settore italiani perché non richiede di conoscere l’acronimo GEO.
LLMO (LLM Optimization)
Ottimizzazione specifica per i grandi modelli linguistici (ChatGPT, Claude, Gemini…). Sottolinea che il target non sono generici motori AI ma proprio gli LLM usati in modalità conversazionale.
llms.txt
Il file concreto che funge da base per tutte queste attività. Va collocato nella radice del sito e contiene, in formato Markdown, un riassunto strutturato del sito stesso: chi sei, cosa offri, quali sono le pagine più importanti.

In sintesi: GEO, SEO per l’IA e LLMO sono nomi per una strategia, mentre llms.txt è uno degli strumenti concreti per attuarla — il più semplice da implementare. Nel resto della guida useremo il termine «ottimizzazione AI» per evitare confusione.

3. I problemi concreti che llms.txt risolve

Passiamo a un esempio pratico. Immagina di gestire il sito di uno studio commercialista a Milano.

Quando un utente chiede a ChatGPT «Qual è un buon commercialista a Milano?», l’AI visita i siti candidati e cerca di ricavarne un riassunto. Deve leggere:

  • L’intera pagina HTML (da centinaia di KB a più MB)
  • I contenuti generati dinamicamente da JavaScript (che spesso non riesce nemmeno a recuperare)
  • Navigazione, footer, cookie banner, spazi pubblicitari
  • Eventuali aree riservate (inaccessibili)

Questo carico non è trascurabile. Il risultato è che vengono citati soprattutto i siti più semplici da leggere. Un sito con llms.txt, invece:

  • Offre con una sola richiesta il «sommario» completo del sito
  • Riduce la quantità di token che l’AI deve elaborare, secondo alcune stime fino a un decimo
  • Aumenta le probabilità di essere citato nella risposta

In parole semplici, avere un llms.txt ben fatto è come consegnare un’ottima scheda di presentazione al momento giusto. Meglio di un biglietto scritto a mano dove bisogna indovinare chi sei e cosa fai.

4. La struttura del file — capirla con un esempio reale

llms.txt è composto da soli 4 elementi. Ecco un esempio concreto per uno studio commercialista milanese.

# Studio Commercialista Navigli

> Studio commercialista a Milano, da 20 anni al fianco dei clienti per consulenza fiscale, contabile e del lavoro.

## Servizi
- [Consulenza fiscale](https://example.com/servizi/fiscale): Pianificazione fiscale e ottimizzazione del carico tributario per imprese e professionisti.
- [Contabilità ordinaria](https://example.com/servizi/contabilita): Gestione completa della contabilità con reportistica mensile.
- [Paghe e contributi](https://example.com/servizi/paghe): Elaborazione buste paga, gestione contributi e adempimenti INPS/INAIL.
- [Dichiarazioni dei redditi](https://example.com/servizi/dichiarazioni): 730, Redditi PF e SC, IVA annuale.

## Lo studio
- [Chi siamo](https://example.com/studio): Storia, team e approccio professionale.
- [Tariffe](https://example.com/tariffe): Preventivi trasparenti per ogni servizio.
- [Contatti](https://example.com/contatti): Modulo di richiesta appuntamento e indirizzo.

## Optional
- [Blog fiscale](https://example.com/blog): Aggiornamenti normativi e casi pratici.
- [Casi di successo](https://example.com/casi): Risultati concreti ottenuti con i nostri clienti.

Ogni elemento ha una funzione precisa.

  1. 01

    # Titolo H1

    Il nome del sito o dello studio, su una sola riga. È l’unico punto dove l’AI apprende «di chi è questo sito». Va sempre messo nella prima riga del file.

  2. 02

    > Sommario (blockquote)

    Una o due righe che riassumono l’intero sito. Quando l’AI cita il sito, usa spesso questo testo come «intestazione». Includi settore, città, tipo di clientela e anni di attività: sono le parole più cercate e più utili per il modello.

  3. 03

    ## Sezioni (più di una)

    Raggruppano le pagine per argomento: Servizi, Lo studio, Optional e così via. L’ordine rispecchia la priorità per il visitatore. «Optional» è un titolo speciale definito dalla specifica: segnala all’AI che quelle pagine sono utili ma non indispensabili.

  4. 04

    - [Nome link](URL): descrizione

    Il contenuto di ogni sezione. La parte più importante è la descrizione: senza di essa l’AI non sa cosa troverà in quella pagina. È proprio la descrizione che determina quale pagina viene citata per rispondere a una domanda specifica.

Ci sono alcune regole di dettaglio (interruzioni di riga, righe vuote, codifica dei caratteri, dimensione massima) definite dalla specifica, ma non è necessario memorizzarle: lo strumento di validazione che vedremo dopo le controlla in automatico.

5. Dubbi e malintesi più comuni

Ecco le domande che ci vengono poste più spesso dai responsabili di siti aziendali, con risposte dirette.

D1. Basta davvero un solo file per avere effetti concreti?

Onestamente, mettere il file da solo non produrrà aumenti spettacolari di traffico. llms.txt ha lo stesso ruolo della sitemap.xml nella SEO classica: è un’infrastruttura. Senza di essa, anche i contenuti migliori faticano a emergere.

Il punto è che il costo per implementarla è quasi zero (meno di un’ora di lavoro), mentre il traffico proveniente dalle ricerche AI è destinato a crescere. Non farlo ha un costo di opportunità reale.

L’effetto dipende in larga misura dalla qualità dei contenuti del sito. llms.txt apre la strada; se dietro la strada non c’è niente di interessante, l’AI non citerà comunque il sito.

D2. L’AI non rischia di usare i miei contenuti per allenarsi?

È una distinzione importante da fare. llms.txt è un file per la citazione (retrieval), non per l’addestramento (training).

  • Addestramento: il processo con cui si costruisce un modello AI, incorporando testi raccolti dal web. Per limitarlo si usa robots.txt impostando GPTBot e ClaudeBot come Disallow.
  • Citazione: quando un utente fa una domanda, l’AI visita il sito in tempo reale per trovare una risposta aggiornata. llms.txt serve a rendere questa visita più efficace.

Pubblicare llms.txt non equivale quindi a «donare i propri contenuti per l’addestramento». Se vuoi permettere la citazione ma bloccare l’addestramento, configura robots.txt così:

User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: PerplexityBot
Allow: /

Attenzione: alcune AI stanno usando lo stesso crawler sia per l’addestramento che per la citazione. Il controllo selettivo «solo citazione, no addestramento» non è ancora garantito dalla sola specifica standard; tienilo presente.

D3. Quando si iniziano a vedere i risultati?

La citazione da parte delle AI non segue il ciclo classico «crawler → indicizzazione dopo qualche giorno». In molti casi l’AI legge il sito nel momento esatto in cui un utente fa una domanda. Questo significa che il giorno stesso della pubblicazione qualcuno potrebbe già ricevere una risposta che cita il tuo sito.

Non esiste ancora uno standard di settore per misurare le citazioni AI. Nel frattempo puoi fare un monitoraggio indiretto:

  • Nei log di accesso, tieni traccia mensile delle visite di GPTBot, ClaudeBot, PerplexityBot e altri bot AI
  • Una volta al mese, fai manualmente le domande più probabili su ChatGPT, Claude e Perplexity (tipo: «commercialista aziende Milano») e controlla se appari tra le fonti citate
  • In Google Search Console, verifica se compaiono accessi provenienti da domini legati ai principali servizi AI

D4. Ha effetti sulla SEO tradizionale (posizioni Google)?

Non influisce direttamente sul ranking di Google. L’algoritmo di Google non usa llms.txt per determinare le posizioni (dati aggiornati a maggio 2026).

Tuttavia, il processo di creazione del file ti obbliga a rivedere la struttura del sito, i titoli delle pagine principali e le descrizioni: operazioni che hanno un effetto positivo anche sulla SEO classica. È la stessa logica per cui curare la sitemap.xml aiuta Google a scansionare meglio il sito.

D5. Qual è la differenza con robots.txt e sitemap.xml?

I tre file hanno ruoli distinti e complementari.

  • robots.txt: dice ai crawler cosa non devono visitare. È uno strumento di controllo degli accessi.
  • sitemap.xml: elenca tutte le URL del sito ai motori di ricerca. È esaustivo per natura.
  • llms.txt: presenta all’AI le pagine più importanti e il loro contesto. È un indice ragionato, non un elenco completo.

I tre file non si escludono, si completano. L’ideale è averli tutti e tre. Per un confronto dettagliato, leggi l’articolo «llms.txt vs robots.txt vs sitemap.xml».

D6. Il mio sito è piccolo, vale lo stesso la pena?

I siti più piccoli hanno spesso più da guadagnare, non meno. Ecco perché:

  • I siti dei grandi gruppi sono spesso molto complessi da leggere per un’AI. Un sito ben strutturato con llms.txt diventa automaticamente «più leggibile» della media.
  • Per domande localizzate (es. «commercialista a Navigli») la concorrenza è limitata: bastano poche fonti buone per essere citati.
  • Chi parte prima ha un vantaggio concreto. Un’ricerca SE Ranking su circa 300.000 domini ha rilevato che a inizio 2026 solo il 10% dei siti ha un llms.txt: tra i siti ad alto traffico la percentuale scende ulteriormente.

D7. Devo coinvolgere un’agenzia o posso farlo da solo?

Puoi farlo da solo. Creare un file di testo e caricarlo sul server è più semplice che modificare un’immagine nel CMS.

Nella seconda parte della guida trovi le istruzioni specifiche per WordPress, Shopify, Wix, Webflow e HTML statico. Se sei già abituato ad aggiornare il sito in autonomia, hai tutte le competenze necessarie.

6. Creare e pubblicare il file passo dopo passo

Passiamo all’operativo. Tempo stimato: 30-60 minuti.

Passo 1. Seleziona le 5-15 pagine più importanti del sito

Inizia con carta e penna. Se l’AI dovesse presentare il tuo sito a un potenziale cliente, quali pagine vorresti che mostrasse per prime?

  • Pagina dei servizi (panoramica e pagine individuali)
  • Chi siamo (titolare, indirizzo, esperienza)
  • Tariffe o preventivi
  • Modulo di contatto o richiesta appuntamento
  • Casi di successo o referenze (se presenti)
  • 2-3 articoli del blog tra i più letti (se presenti)

Se superi le 15 pagine, seleziona. llms.txt non è il posto dove elencare tutto: è lo spazio per scegliere cosa l’AI deve assolutamente conoscere.

Passo 2. Scrivi una descrizione di una riga per ogni pagina

Questo è il passaggio più importante. L’AI usa queste descrizioni per decidere quale pagina citare in risposta a una domanda. Caratteristiche di una buona descrizione:

  • Parole concrete e specifiche (non «servizio di eccellenza» ma «dichiarazione dei redditi per società di capitali, con gestione IVA inclusa»)
  • Una frase sola, massimo 60-70 caratteri
  • Informazioni esclusive di quella pagina, che la distinguano dalle altre
  • Fatti, non slogan

Passo 3. Scrivi il sommario generale del sito

È la riga che va dopo > (il blockquote). L’AI la usa come «intestazione» quando presenta il tuo sito. Includi settore, città, tipo di clientela e anni di attività.

Esempio da evitare: «Professionisti al tuo servizio da sempre»

Esempio efficace: «Studio commercialista a Milano, da 20 anni al fianco delle clienti per consulenza fiscale, contabile e del lavoro.»

Passo 4. Salva il file come testo normale

Puoi usare Blocco Note, Visual Studio Code, Google Documenti o qualsiasi editor di testo semplice. Salva con il nome llms.txt e codifica UTF-8 (su Windows selezionala nella finestra di salvataggio).

Passo 5. Valida il file prima di caricarlo

Prima di pubblicare, controlla che il file rispetti la specifica. Errori comuni (H1 mancante, formato link sbagliato, codifica errata) impediscono alle AI di leggerlo correttamente.

Usa lo strumento di validazione gratuito qui sotto.

Strumento di validazione llms.txt

Incolla il contenuto del file e ottieni in pochi secondi un controllo su 12 criteri della specifica, con indicazioni chiare su cosa correggere.

Apri il validatore →

Passo 6. Carica il file nella radice del sito

Il file deve essere raggiungibile all’indirizzo https://tuosito.it/llms.txt. Non in una sottocartella come /docs/llms.txt o /.well-known/llms.txt: quei percorsi non vengono riconosciuti.

Le istruzioni specifiche per ogni piattaforma sono nel prossimo paragrafo.

7. Istruzioni per le principali piattaforme

Di seguito trovi i passaggi essenziali per le piattaforme più usate in Italia. Le guide dettagliate con screenshot sono nella sezione Guide per piattaforma.

WordPress (self-hosted)

  1. Apri un client FTP (es. FileZilla) oppure il File Manager del pannello di hosting (Aruba, Register.it, SiteGround o altro)
  2. Naviga fino alla document root del sito (di solito public_html o httpdocs)
  3. Carica il file llms.txt in quella cartella
  4. Verifica aprendo https://tuosito.it/llms.txt nel browser: il testo deve apparire direttamente

Nota: WordPress.com (versione in hosting gestito) non consente di caricare file nella root. Questa procedura funziona solo con WordPress.org installato su hosting proprio.

Shopify

  1. Dal pannello admin vai su Contenuti → File e carica llms.txt (Shopify lo sposta però in /cdn/shop/files/, non nella root)
  2. Per servire il file dalla root, imposta un reindirizzamento /llms.txt → URL CDN nelle impostazioni del tema, oppure usa un’app dedicata come «LLMs.txt Generator» disponibile nello Shopify App Store

Nota: Shopify non permette nativamente di posizionare file arbitrari nella root del dominio. L’uso di un’app dedicata è la soluzione più affidabile.

Wix

  1. Dal pannello vai su Impostazioni → SEO → robots.txt: in alcune versioni è presente un’opzione per file personalizzati nella root
  2. In alternativa, crea una pagina dedicata con URL /llms.txt e incolla il contenuto nel corpo della pagina (soluzione parziale, non pienamente conforme alla specifica)

Nota: Wix è tra le piattaforme più limitate per questo caso d’uso. A maggio 2026 non offre ancora un metodo standard per caricare file liberi nella root. Valuta Webflow o HTML statico se hai esigenze avanzate.

Webflow

  1. Nel pannello del progetto, vai sulla scheda Hosting
  2. Cerca la sezione «File personalizzati» o «Custom files»
  3. Carica llms.txt: Webflow lo servirà direttamente dalla root del dominio pubblicato
  4. Verifica l’URL dopo la pubblicazione

Nota: La funzione di file personalizzati è disponibile nei piani a pagamento di Webflow. Controlla il tuo piano prima di procedere.

HTML statico (Netlify / Vercel / GitHub Pages / hosting condiviso)

  1. Aggiungi llms.txt alla cartella radice del tuo progetto (la stessa dove si trova index.html)
  2. Fai il deploy normalmente: su Netlify e Vercel basta un push su git, su hosting condiviso carica via FTP
  3. Apri https://tuosito.it/llms.txt nel browser per verificare

Nota: È il metodo più semplice in assoluto. Su hosting condiviso italiano (Aruba, Register.it, ecc.) bastano 5 minuti.

8. Verificare che tutto funzioni dopo la pubblicazione

Appena pubblicato il file, esegui questi tre controlli.

  1. 01

    Il file è raggiungibile all’URL corretto?

    Apri https://tuosito.it/llms.txt nel browser. Il testo deve apparire direttamente nella pagina. Un errore 404 o un download automatico del file indicano un problema di configurazione del server.

  2. 02

    Il Content-Type è corretto?

    Apri gli strumenti sviluppatore del browser (F12), vai nella scheda Rete (Network), ricarica la pagina e controlla l’intestazione Content-Type della risposta. Deve essere text/plain o text/markdown. Se vedi application/octet-stream, alcune AI non riusciranno a leggerlo: correggi la configurazione del server.

  3. 03

    Tutti i 12 criteri della specifica sono soddisfatti?

    Usa il validatore del sito almeno una volta al mese e ogni volta che modifichi la struttura del sito.

Per il monitoraggio nel tempo:

  • Annota mensilmente nei log il numero di accessi da GPTBot / ClaudeBot / PerplexityBot
  • Una volta al mese, interroga ChatGPT, Claude e Perplexity con domande legate al tuo settore e alla tua città, e verifica se il tuo sito compare tra le fonti (se non compare, analizza i contenuti e integra ciò che manca)

9. Cosa fare regolarmente e cosa non vale la pena fare

Da fare con regolarità

  • Revisione trimestrale del contenuto: aggiorna il file ogni volta che aggiungi o rimuovi un servizio, cambi le tariffe o modifichi l’organizzazione dello studio
  • Controllo mensile delle citazioni: fai le domande più probabili sulle principali AI e verifica la tua presenza
  • Aggiorna quando pubblichi pagine importanti: mantieni il limite di 15 pagine e sostituisci quelle meno rilevanti

Cosa non vale la pena fare

  • Aggiornamenti quotidiani o settimanali. llms.txt descrive la struttura stabile del sito, non le news di giornata.
  • Elencare tutte le URL del sito. Quello è il compito della sitemap.xml: non confondere i due file.
  • Produrre contenuti pensati solo per le AI. Le AI citano ciò che è utile agli esseri umani. Scrivi per i tuoi clienti, poi usa llms.txt per guidare l’AI verso quei contenuti.

10. Il prossimo passo

Hai letto tutto. Ora è il momento di passare all’azione. Il percorso più rapido è in due mosse:

  1. 01

    Genera una bozza in 30 secondi

    Inserisci l’URL del tuo sito nel generatore: esegue una scansione e produce una bozza conforme alla specifica. Non sarà perfetta al 100%, ma ti farà risparmiare molto tempo rispetto a partire da zero.

  2. 02

    Rifinisci in 5-15 minuti

    Apri la bozza e riscrivila con le tue parole seguendo il Passo 2 (descrizioni) e il Passo 3 (sommario) di questa guida. Il risultato finale sarà un file di qualità.

Genera la bozza del tuo llms.txt

Incolla l’URL del tuo sito: il generatore lo scansiona e produce una bozza llms.txt pronta da rifinire. Gratuito, senza registrazione.

Apri il generatore →

Speriamo che questa guida ti aiuti a far conoscere il sito della tua azienda nell’era dell’IA.