Come risolvere il problema dei contenuti duplicati su WordPress

Questa è una delle tragedie per chi si occupa di blogging: i contenuti duplicati. Come combattere questa piaga? Ecco una serie di indicazioni per lavorare bene con le tue pubblicazioni.

Rimani sveglio per aggiornare il blog, fai ricerca bibliografica, curi i dettagli, scegli una bella foto. Poi scopri che il sito è pieno di contenuti duplicati.

contenuti duplicati
I contenuti duplicati sul sito web sono un problema.

I testi che si moltiplicano in copia danneggiano il sito che li ospita, per questo devi correre ai ripari. Non puoi permettere che i contenuti duplicati rovinino il grande lavoro di ottimizzazione SEO che stai facendo. Come risolvere il problema? Dipende!

Non esiste un’unica tipologia di duplicazione

Difficile parlare di contenuti duplicati sul sito web. Una parte dei problemi nasce all’esterno del tuo lavoro online: ci sono persone che rubano i testi e le immagini che pubblichi, e questo può diventare un problema. Non solo dal punto di vista tecnico, ma anche e soprattutto per una questione di rispetto del lavoro altrui. Poi ci sono i contenuti duplicati che si sviluppano all’interno del sito.

Se bloccare la pubblicazione dei tuoi post sui siti esterni può essere una piccola avventura, evitare le pagine ridondanti sul tuo progetto è più semplice. A patto che ci sia consapevolezza delle azioni necessarie. Tu sai già cosa fare?

Da leggere: come ottimizzare una scheda ecommerce

Cosa fa Google con i tuoi contenuti duplicati

Il motore di ricerca non ama i duplicati. Va in difficoltà quelli che crei tu sul sito web attraverso testo standard ridondante, ma soprattutto cerca di prendere delle decisioni rispetto a pagine di siti diversi con lo stesso contenuto. Cosa significa?

Il motore di ricerca ragiona come tale: cerca di risparmiare risorse e dare il miglior risultato possibile. All’interno del tuo sito individua e fa emergere la risorsa migliore per un determinato topic. Se ce ne sono due simili ne preferirà una.

contenuti duplicati seo
Il dramma dei contenuti replicati per il bot di Google – Fonte Moz.

L’altra verrà ignorata. Questo non è un passaggio superfluo, il contenuto duplicato resta sul sito e pesa sul calcolo finale: è una pagina da scansionare dal crawler e questo vuol dire impegnare il budget che Google ti dà per rivedere risorse inutili.

Ai fini di un buon posizionamento SEO è ideale dare a Google sempre percorsi semplici e privi di dubbi. Com’è possibile questo? Ecco come risolvere.

Come evitare articoli e contenuti simili online

Il primo passo per evitare problemi: ridurre al minimo le porzioni di contenuto duplicato all’interno di un blog o un sito. Può sembrare un atteggiamento paranoico, ma è buona abitudine eliminare qualsiasi stringa di testo ridondante.

riassunto wordpress

Ad esempio quello dei riassunti. Nelle preview del post puoi inserire i primi passaggi del testo che apre un contenuto, oppure puoi usare la sezione riassunto per aggiungere un testo unico: soluzione migliore, anche se devi fare di più. Ad esempio?

Evita le pubblicazioni sullo stesso topic. Una buona gestione del calendario editoriale ti può aiutare in questo passaggio anche se io lavoro sempre con gli operatori di ricerca: prima di scrivere un post uso il site: con URL del blog e argomento.

Così vedo cosa ha digerito Google rispetto a quel topic e se c’è già qualcosa di simile nell’archivio. Ovviamente la mia idea è quella di evitare di pubblicare un contenuto che si sovrappone ed entra in contrasto con ciò che ho online.

Canonical, redirect, noindex: come risolvere?

Se ti trovi di fronte a una serie di contenuti duplicati interni puoi risolvere in modi diversi. Se il problema riguarda due pagine simili che possono essere diversificate il mio avviso è quello di riscrivere e tentare di dare direzioni diverse alle pagine.

In alternativa puoi puntare sul redirect 301: trovi una versione dominante (quella che Google ha scelto di premiare) e punti i duplicati verso la versione preferita.

Stessa cosa puoi fare con il rel=canonical. Una soluzione che consente di mantenere due pagine simili indicando a Google qual è la versione da preferire sul web.

In altri casi, quando hai bisogno di pagine semivuote o con testo duplicato, puoi puntare al noindex attraverso il meta tag che puoi inserire anche attraverso Yoast.

Ci sono tag title e meta description duplicate

Questo è uno dei problemi tipici dei siti web: meta tag Google troppo simili. Questo significa, tendenzialmente, una sovrapposizione di topic che porta a replicare pagine.

Questa realtà viene registrata dalla Search Console (spesso i risultati non sono aggiornati) ma può essere osservata grazie a una scansione con Screaming Frog.

Questo tool, infatti, consente di individuare pagine con tag title e meta description simili attraverso una funzione specifica. Tutto molto comodo e interessante,

Come risolvere meta tag duplicati?

Se il problema riguarda articoli che hai pubblicato personalmente puoi scegliere: se hai la possibilità rivedi uno dei post e porta il topic altrove, riscrivendo il testo.

Magari per cogliere una sfumatura diversa in modo da offrire a Google e al pubblico qualcosa di diverso. Oppure cancella la risorsa peggiore e lavora di redirect 301.

Se i tag replicati sono frutto di tassonomie che si moltiplicano con title e description uguali c’è una soluzione: grazie a WordPress SEO by Yoast puoi aggiungere la variabile %%page%% che aggiunge in automatico la numerazione. Vale a dire il primo passo per evitare contenuti duplicati nelle tassonomie. Qualche soluzione?

Risolvere contenuti ridondanti nelle tassonomie

Categorie, tag, archivi autore: spesso le duplicazioni si nascondono qui, in queste risorse. Parto da un punto chiaro: un blog ha i suoi archivi ed è giusto che ci siano. Non puoi evitare la generazione di tassonomie, ma puoi ottimizzare. In che modo?

In primo luogo con una gestione intelligente di tag e categorie: non creare raccolte basate su termini semanticamente uguali o vicini. Due tag che hanno lo stesso significato (web writing e scrittura online) saranno raccolte parallele e sovrapponibili.

Lo stesso vale con le categorie

Io cerco di limitare il più possibile le categorie, usando con il contagocce i tag. A volte li escludo completamente dal progetto editoriale. Deindicizzare le tassonomie può essere la soluzione estrema, ma non è quella che preferisco: meglio evitare proprio la creazione di tag inutili. Oppure si cancella e se necessario si mette un redirect.

Gestione canonical per le tassonomie

Questo elemento può essere usato anche per gestire le varie pagine delle categorie e dei tag. In che modo? Non vedendole come pagine duplicate, perché non lo sono.

Come suggerisce Google, uno degli errori principali lato SEO è quello di impostare le pagine successive alla prima con il canonical proprio su quest’ultima.

In caso di contenuto impaginato, è utile un canonical sulla singola pagina (quindi come fai per un qualsiasi articolo del blog) e i due rel prev e next sui link che portano alle versioni successive. In questo modo si definiscono tutte le relazioni per trattare i contenuti delle tassonomie nel miglior modo possibile. Un esempio?

<link rel="prev" href="https://esempio.com/"/> 
<link rel="next" href="https://esempio.com/page/3"/> 
<link rel="canonical" href="https://esempio.com/page/2"/>

Tool per scoprire contenuti duplicati e rubati

Se riprendono le tue pubblicazioni per intero e le pubblicano su un altro sito web ci possono essere problemi? In linea di massima Google capisce chi è il vero autore e penalizza il ladro. Ma non è sempre così, molto dipende dall’autorevolezza del sito.

E a volte vorresti che fosse rispettata la buona norma del link di riferimento, per non parlare della proprietà intellettuale. Per questo motivo io uso 8 strumenti online per scovare tutti i copioni fraudolenti e far rispettare i miei diritti! Sei d’accordo?

Segnalare a Google contenuti rubati

In una delle sue risorse il motore di ricerca lascia informazioni sulla presenza di testo duplicato sul proprio sito e su altri domini. Hai a disposizione un tool per segnalare al motore di ricerca chi ha copiato il tuo contenuto. Prima di arrivare a questo, però, consiglio di mandare prima un’email al proprietario del sito copione.

Duplicate Content Checker

Entriamo nel vivo degli strumenti con Duplicate Content Checker, una finestra di dialogo che ti permette di controllare una determinata porzione di testo o, se desideri, tutti i tuoi contenuti tramite url. E alla fine puoi anche esportare i risultati.

Similar page checker

Similar Page Cheker è un’altra realtà che può fare la differenza per risolvere i contenuti duplicati. Più o meno uguale al precedente, possiede le due finestre per inserire gli indirizzi da comparare. Utile per un confronto dei risultati.

Usa le Licenze Creative Commons

Le Licenze Creative Commons non sono uno strumento nel vero senso della parola, ma rappresentano il primo passo che devi muovere per tutelare i contenuti.

Scegli tra le soluzioni quella che più si adatta al tuo blog ed esponi il link che porta alle condizioni di ripubblicazione. Così puoi scoraggiare chi copia i contenuti.

Ricerca tra virgolette sui motori di ricerca

Piccolo trucco necessario per scoprire un primo strato di contenuti duplicati. Inserendo il testo incriminato tra le virgolette “” i principali motori di ricerca (Google, Yahoo! e Bing) ti restituiscono tutti i risultati che utilizzano le stesse parole.

Il mio consiglio è quello di cercare frasi brevi e distribuite all’interno del testo (evita, quindi i blocchi di 500 battute!) e interrogare anche i risultati suggeriti.

Screaming Frog (SEO tool)

Sì, Screaming Frog non serve a scoprire le persone che copiano i tuoi contenuti. Ma sai cosa? A volte il peggior nemico di te stesso sei proprio tu. Di conseguenza devi scoprire le pagine simili all’interno del tuo sito grazie a questo SEO tool.

Scopri ripetizioni: Copyscape

Copyscape restituisce risultati precisi in stile Serp di Google attraverso l’inserimento della url interessata. Personalmente ho trovato alcuni casi interessanti che non conoscevo ma, sfortunatamente, la versione gratuita è limitata alle prime 10 voci!

Plagium, tool per testi duplicati

Già conosci Plagium? Anche in questo caso basta inserire il testo nella finestra di dialogo per scoprire se hai subito un plagio nelle normali pagine web o tra le news, in una qualsiasi delle 6 lingue elencate. In questo modo puoi controllare in profondità.

Da leggere: perché Google non indicizza tutte le pagine?

Evitare contenuti duplicati online: cosa fai?

Questi sono i migliori tool per scongiurare i contenuti duplicati. Ne aggiungo un altro scegli tag e categorie con cura, sono le fonti principali di contenuti duplicati in un blog. Per il resto lascio spazio alla tua esperienza: come combatti i ladri di contenuti?

Riccardo Esposito
Sono un web writer freelance. Mi occupo di scrittura online dal 2009, mi sono specializzato nella stesura di piani editoriali per blog aziendali. Ho scritto 3 libri dedicati al mondo del blogging e della scrittura online.

9 COMMENTI

  1. Ciao Riccardo,
    grazie per l’ottima condivisione (come sempre :)).
    Volevo chiederti se avevi sperimentato l’integrazione dei “prev” e “next” in wordpress, con qualche plugin o se ti fossi affidato alla modifica di file functions. Mi riferisco al problema della duplicazione di Title e Description per le pagine delle categorie. Ho lo stesso problema e vorrei risolverlo 🙂

    Grazie mille ancora!
    Stefano

    • Ciao, di regola prev e next sono impostati di default. Non ho modificato in alcun modo, era già tutto presente. Anche il canonical sulla stessa pagina. Poi, se ancora si visualizza l’errore nella vecchia search console… Capita che ci siano dei falsi positivi.

RISPONDI AL COMMENTO

Please enter your comment!
Please enter your name here