Se ti occupi di gestire siti web, hai ben chiaro quanto sia facile incorrere nel rischio di ospitare contenuti duplicati sul tuo sito web: errori tecnici, schede prodotto da riproporre, pagine consultabili da URL diversi, sono tutti potenziali problemi che rischiano di suscitare una spiacevole impressione nei crawler preposti a individuare contenuti originali.

Nel 2009 Google ha introdotto il tag rel=”canonical” strumento preziosissimo per segnalare la versione preferita di un contenuto.
Il rel canonical non è soltanto un aspetto da vagliare per assicurare una corretta comprensione delle nostre pagine web, ma anche uno strumento del quale possiamo servirci per migliorare eventualmente il posizionamento.
Non si tratta di una implementazione difficile da mettere a punto, quanto di una risorsa che può essere valorizzata se compresa nella propria complessità.
Per fortuna, Google mette a disposizione una pagina che risponde ai dubbi più comuni in fatto di duplicazione degli URL dei contenuti.

Scopriamo quindi tutto quello che c’è da sapere in fatto di rel canonical e di contenuti duplicati.

Come impostare rel canonical

Cos’è il rel canonical?

Se sul tuo sito è presente una pagina web che è accessibile da diversi indirizzi, oppure se sono presenti più pagine molto simili tra loro, corri il rischio che Google rilevi dei contenuti duplicati all’interno del tuo portale.
Google scansiona il contenuto riconosciuto come canonico mentre gli altri verranno considerati come duplicati e soggetti a scansione più di rado.
L’URL canonico è l’indirizzo della pagina recepito come più significativo tra le varianti identiche o molto simili presenti: questo vale anche per pagine collocate su domini diversi.

Ad esempio, possiamo avere
www.sito.it
www.sito/index.html

che corrispondono alla stessa pagina ma che possono essere percepiti dai motori di ricerca come duplicati per via degli URL diversi.

Per esempio, se sul sito aziendale hai la pagina
sito.it/categoria/prodottoX
e sul sottodominio dedicato a quella categoria di prodotti hai la pagina di contenuti identici
categoria.sito.it/prodottoX

dovresti impostare uno dei due URL come canonico.

L’attributo canonical infatti è la via preferita da Google per gestire i contenuti duplicati e individuare con facilità quali sono i percorsi unici da scansionare. La corretta gestione dei canonical permette di ottimizzare le risorse a disposizione e di indirizzare la link popularity verso quei contenuti da percepire come rilevanti e di attribuire l’autorevolezza in maniera univoca. Non si tratta di una direttiva quanto di “un consiglio” da dare al Googlebot per ottimizzare la scansione. Nella sua versione “cross domain” rende possibile unificare anche le versioni tra i vari domini in modo, ad esempio, di riportare le descrizioni dei prodotti in forma uguale su più portali.

Il rel=canonical permette di dirimere problematiche all’ordine del giorno come prodotti che sono raggiungibili da percorsi diversi, ad esempio la sotto categoria nella quale sono posizionati e la sezione in promozione quando vengono messi in evidenza.

Come impostare il rel=canonical

Per impostare il rel=canonical devi semplicemente nel tag della pagina l’elemento “link” con la proprietà “canonical” con l’indirizzo della pagina canonica. Lo stesso canonical impostato come appena descritto dovrà essere ripetuto nelle pagine duplicate.

La formula è la seguente:
link rel=”canonical” href=”http://www.sito.it/pagina-canonica/” />
Se lavori con CMS come WordPress o Joomla puoi gestire queste indicazioni attraverso comodi plugin, ad esempio Yoast.
Il rel canonical si distingue dal redirect 301 siccome il primo è una indicazione di scansione mentre il secondo è un reindirizzamento che manda il crawler a un’altra risorsa, perciò tra i due il più “potente” è il redirect siccome svolge un effetto fisico.

Il canonical può essere utilizzato anche per contenuti appartenenti a siti differenti, riferendosi all’indirizzo assoluto della pagina.

Cosa succede se non imposto il tag canonical?

Se eviti di indicare chiaramente quale è la versione di riferimento della pagina, Google ne sceglierà una a sua discrezione oppure le valuterà entrambi allo stesso peso.
Il rel canonical è quindi un modo per ottimizzare le risorse di scansione del crawl budget e favorire l’indicizzazione su Google.

Perché devi impostare correttamente il rel canonical?

Google e i motori di ricerca in genere hanno lo scopo di rintracciare e catalogare nel web quanti più documenti possibili, che però sono già tantissimi di loro, e l’impresa richiede uno sforzo titanico. Pensa inoltre a quante versioni esistono delle stesse pagine: versioni mobile e desktop, schede prodotti di ecommerce replicate nei siti dei rivenditori, errori tecnici che portano a copie di pagine indesiderate senza alcun valore per l’utente.


Per finalizzare le proprie risorse di scansione, Google ha tutto l’interesse che le versioni identiche delle stesse pagine vengano segnalate come tali in modo che i bot le inseriscano negli archivi una sola volta. La modalità più facile consiste leggere direttamente quale pagina è contraddistinta come principale, in modo che le altre identiche passino automaticamente in secondo piano.

Aiutare googlebot a filtrare le pagine ridondanti è una buona idea per permettere al crawler di concentrarsi su quelli realmente utili per i lettori e trascurare le copie inutili che andrebbero a intasare le serp (posto che ci arrivino senza essere filtrate a monte).

La cosa migliore da fare è rivolgere i redirect 301 verso la versione principale della pagina in modo che i click su tutte le versioni vengano ricondotti allo stesso contenuto.
Ad esempio possiamo fare che:
miosito.com
miosito.com/index.html
miosito.com/index.php
rimandi sempre a
https://www.miosito.com

In questo modo potremo fare che indirizzi diversi rimandino sempre alla stessa pagina.

Il tag va aggiunto nell’ delle che presentano eventuale contenuto duplicato, ad esempio le schede prodotto nella realizzazione di ecommerce quando:

  • sono raggiungibili da più URL nello stesso store
  • sono identiche nei contenuti a quelle del produttore

Altre varianti dei canonical sono i link rel=”prev” e rel=”next” che indicano la paginazione del sito, come nel caso delle pagine categorie 1,2,3 e via dicendo.

Se seguirai tutte queste indicazioni potrai indubbiamente aiutare Google a comprendere le versioni della pagina da prendere in considerazione e a evitare errori di interpretazione.

E tu che cosa ne pensi? Parliamone qua sotto!