Contenuti duplicati: cosa sono, come verificarli con i tool e risolverli

Di Riccardo Esposito | Pubblicato il - Aggiornato il

I contenuti duplicati sono un problema SEO che consiste nella presenza sulle pagine web di testo o immagini presenti già altrove, sia su pagine dello stesso dominio che esterne. Questo problema può portare a penalizzazioni del sito.


La verifica dei contenuti duplicati per la SEO è una delle attività fondamentali per evitare casi di cannibalizzazione di keyword, ovvero favorire la presenza di pagine interne che concorrono per posizionamenti simili o completamente uguali.

Verifica i contenuti duplicati di un sito.
Verifica i contenuti duplicati di un sito.

D’altro canto i contenuti duplicati sono un problema che riguarda anche il furto di testi da parte di altri siti web che prendono i tuoi lavori e li pubblicano su domini differenti. Anche questo può essere un problema? Ecco tutto quello che devi sapere.

Cosa sono i contenuti duplicati per la SEO

I contenuti duplicati sono testi e immagini che appaiono in due o più pagine differenti in modo sostanzialmente simile. Se bloccare la pubblicazione dei tuoi post sui siti esterni può essere una piccola avventura, evitare le pagine ridondanti sul tuo progetto è più semplice. A patto che ci sia consapevolezza delle azioni necessarie.

Quanti tipi di contenuti duplicati esistono?

Ci sono due tipologie: contenuti duplicati su domini differenti e sullo stesso sito web. Nel primo caso parliamo di persone che rubano i testi e le immagini che pubblichi, e questo può diventare un problema. Non solo dal punto di vista tecnico e legale.

Poi ci sono i contenuti duplicati che si sviluppano all’interno del sito a causa di copia e incolla di grandi sezioni di testo, tassonomie e versioni PDF degli articoli di un blog.

Anche il testo boilerplate – come ad esempio privacy policy, estratti e biografia nei post – può diventare fonte di contenuto duplicato. E quindi da limitare il più possibile. In alcuni casi i testi duplicati sono user generated content non sotto il tuo controllo.

Da leggere: come indicizzare un sito web

Perché i contenuti duplicati sono un problema?

Il motore di ricerca non ama i duplicati. Va in difficoltà quelli che crei tu sul sito web attraverso testo standard ridondante, ma soprattutto cerca di prendere delle decisioni rispetto a pagine di siti diversi con lo stesso contenuto. Cosa significa?

Se sul tuo sito sono presenti contenuti duplicati e tu non segui i consigli sopra riportati, noi provvediamo a scegliere una versione dei contenuti da visualizzare nei nostri risultati di ricerca.

Duplicate content secondo Google

Il motore di ricerca ragiona come tale: cerca di risparmiare risorse e dare il miglior risultato possibile. All’interno del tuo sito individua e fa emergere la risorsa migliore per un determinato topic. Se ce ne sono due simili ne preferirà una.

L’altra verrà ignorata. Questo non è un passaggio superfluo, il contenuto duplicato resta sul sito e pesa sul calcolo finale: è una pagina da scansionare dal crawler e questo vuol dire impegnare il budget che Google ti dà per rivedere risorse inutili.

contenuti duplicati seo
Il dramma dei contenuti replicati per il bot di Google – Fonte Moz.

Ai fini di un buon posizionamento SEO è ideale dare a Google sempre percorsi semplici e privi di dubbi. Com’è possibile questo? Ecco come risolvere.

Cosa fare quando ti copiano i contenuti online

Devi trovare testo duplicato così rimuovi duplicati online. Tu pubblichi un post, altri lo copiano e lo incollano su un altro blog.Tu hai lavorato giorno e notte per creare contenuti di qualità, ricchi di approfondimenti e opinioni personali. E loro si guadagnano un post. Blog appena inaugurato + contenuti duplicati = penalizzazione.

Mando una prima email in cui saluto il proprietario del blogger e gli faccio notare che ha pubblicato un articolo di mia proprietà. Nell’email ci sono alcuni dati (se non riesci a trovare i contatti usa whois e risali al proprietario del dominio):

  • L’indirizzo del suo articolo.
  • L’indirizzo del mio articolo.
  • La data di pubblicazione del mio articolo.
  • La licenza che protegge i miei contenuti.
  • La pagina di Google in cui si condannano i contenuti duplicati.

La prima email è amichevole. Nel caso in cui non si dimostri collaborativo mando messaggi più decisi e soprattutto contenenti una minaccia concreta.

Pubblica solo anteprime del feed

Chi ruba i contenuti e crea dei testi duplicati esterni al sito lo fa in automatico. Estrapolando il feed rss del tuo blog. Puoi risolvere questo problema in due modi: pubblicando solo anteprima di poche righe nel feed e inserendo un link alla fonte.

feed wordpress
Riassunto del feed rss: decidi tu.

Nel primo caso basta andare nelle impostazioni generali del blog WordPress e suggerire di lasciare solo l’anteprima del feed. Nel secondo caso, invece, puoi usare l’opzione di Yoast che consente di inserire link nel footer del feed rss come firma.

Tool per indicare a Google contenuti rubati

In una delle sue risorse il motore di ricerca lascia informazioni sulla presenza di testo duplicato sul proprio sito e su altri domini. Hai a disposizione un tool per segnalare al motore di ricerca chi ha copiato il tuo contenuto. Prima di arrivare a questo, però, consiglio di mandare prima un’email al proprietario del sito copione.

Come segnalare violazioni del copyright

Per azioni più dure in termini di violazione di copyright ti consiglio di considerare la lettera dell’avvocato, passando per il Digital Millennium Copyright Act.

Cause e soluzioni dei contenuti duplicati SEO

I contenuti duplicati SEO non danno valore all’utente e mettono in difficoltà il motore di ricerca che non sa quale pagina valorizzare. Magari indicizza entrambe ma posiziona bene solo una, o nessuna delle due. Questo significa perdere ranking.

Risolvere contenuti ridondanti nelle tassonomie

Categorie, tag, archivi autore: spesso le duplicazioni si nascondono qui, in queste risorse. Parto da un punto chiaro: un blog ha i suoi archivi ed è giusto che ci siano. Non puoi evitare la generazione di tassonomie, ma puoi ottimizzare. In che modo?

Elimina pagina autore

Uno dei settaggi base da mettere in pratica con WordPress SEO by Yoast. Se ha un unico autore sul blog la pagina archivio sarà uguale a quella dell’elenco dei post pubblicati. Risultato? Una marea di contenuti duplicati. Come risolvere?

Elimina pagina autore
Puoi eliminare pagina autore e deindicizzarle da Google.

Basta andare nelle impostazioni base di Yoast, uno dei migliori plugin WordPress, e andare nella sezione archivi. Qui puoi chiedere di eliminare la pagina archivio.

In questo modo si toglieranno i link dalla bio e tutte le pagine andranno in redirect 301 sulla home page del tuo blog. Così da Ridurre al minimo i contenuti simili.

Non creare tassonomie inutili

Serve una gestione SEO intelligente di tag e categorie: non creare raccolte basate su termini semanticamente uguali o vicini. Due tag che hanno lo stesso significato (web writing e scrittura online) saranno raccolte parallele e sovrapponibili.

Io cerco di limitare il più possibile le categorie, usando con il contagocce i tag. A volte li escludo completamente dal progetto editoriale. Deindicizzare le tassonomie può essere la soluzione estrema, ma non è quella che preferisco: meglio evitare proprio la creazione di tag inutili. Oppure si cancella e se necessario si mette un redirect.

Usa canonical per le tassonomie

Questo elemento può essere usato anche per gestire le varie pagine di categorie e tag. In che modo? Non vedendole come pagine duplicate, perché non lo sono.

Come suggerisce Google, uno degli errori principali lato SEO è quello di impostare le pagine successive alla prima con il canonical proprio su quest’ultima.

Come evitare contenuti duplicati con la paginazione.

In caso di contenuto impaginato, è utile un canonical sulla singola pagina (quindi come fai per un qualsiasi articolo del blog) e i due rel prev e next sui link che portano alle versioni successive. In questo modo si definiscono tutte le relazioni per trattare i contenuti delle tassonomie nel miglior modo possibile. Un esempio?

<link rel='prev' href='https://esempio.com/'/> 
<link rel='next' href='https://esempio.com/page/3'/> 
<link rel="canonical" href="https://esempio.com/page/2"/>

In questo modo puoi evitare i contenuti duplicati relativi all’aspetto tecnico e alla paginazione che può provocare veri e propri disastri lato SEO on-page.

Togli ogni contenuto copiato sul sito web

Ulteriore passo per evitare problemi: ridurre al minimo le porzioni di contenuto duplicato all’interno di un blog o un sito. Può sembrare un atteggiamento paranoico, ma è buona abitudine eliminare qualsiasi stringa di testo ridondante.

riassunto wordpress
Attenzione all’excerpt di WordPress.

Ad esempio quello dei riassunti. Nelle preview del post puoi inserire i primi passaggi del testo che apre un contenuto, oppure puoi usare la sezione riassunto per aggiungere un testo unico: soluzione migliore, anche se devi fare di più. Ad esempio?

Evita pubblicazioni con lo stesso topic

Se pubblichi due articoli sullo stesso tema crei contenuti duplicati interni al sito web. La gestione del calendario editoriale ti può aiutare ma io lavoro con gli operatori di ricerca: prima di scrivere uso il site: con URL del blog e argomento.

Così vedo cosa ha digerito Google rispetto a quel topic e se c’è già qualcosa di simile nell’archivio. La mia idea è quella di evitare di pubblicare un contenuto che si sovrappone ed entra in contrasto con ciò che ho online. Un controllo con Semrush o Seozoom può aiutarti ed evitare pagine internet con contenuto duplicato.

Attenzione a tag title e description duplicati

Questo è uno dei problemi tipici dei siti web: meta tag Google troppo simili. Questo significa, tendenzialmente, una sovrapposizione di topic che porta a replicare pagine.

Verifica dei meta tag.
Verifica dei contenuti duplicati SEO nei meta tag.

Questa realtà viene registrata dalla Search Console (spesso i risultati non sono aggiornati) ma può essere osservata grazie a una scansione con Screaming Frog.

Questo tool, infatti, consente di individuare pagine con tag title e meta description simili attraverso una funzione specifica. Tutto molto comodo.

Se il problema riguarda articoli che hai pubblicato personalmente puoi scegliere: se hai la possibilità rivedi uno dei post e porta il topic altrove, riscrivendo il testo.

Magari per cogliere una sfumatura diversa in modo da offrire a Google e al pubblico qualcosa di diverso. Oppure cancella la risorsa peggiore e lavora di redirect 301.

evitare contenuti duplicati ne tag title
Aggiungi variabile nelle tassonomie.

Se i tag replicati sono frutto di tassonomie che si moltiplicano con title e description uguali c’è una soluzione: grazie a WordPress SEO by Yoast puoi aggiungere la variabile %%page%% che aggiunge in automatico la numerazione. Vale a dire il primo passo per evitare contenuti duplicati nelle tassonomie. Qualche idea utile?

Strumenti per eliminare i contenuti duplicati

Se ti trovi di fronte a una serie di contenuti duplicati interni puoi risolvere in modi diversi. Se il problema riguarda due pagine simili che possono essere diversificate il mio avviso è quello di riscrivere e tentare di dare direzioni diverse alle pagine. Ma ci sono anche soluzioni tecniche che possono aiutarti a evitare i contenuti duplicati.

Redirect 301

Due pagine uguali. Cancelli quella che non serve o unisci i due contenuti. Se c’è traffico e link in ingresso puoi puntare sul redirect 301: trovi una versione dominante (quella che Google ha scelto di premiare) e punti i duplicati verso la versione preferita. Non sai come fare? Usa il plugin Redirection come faccio io.

Canonical

Ci sono due pagine uguali ma ti servono entrambe. Non puoi cancellare. Questa condizione la puoi risolvere con il rel="canonical“. Una soluzione che consente di mantenere due pagine simili indicando a Google qual è la versione da preferire.

Strumenti per eliminare i contenuti duplicati
Come impostare l’URL canonico.

Bisogna considerare che il tag canonical è perfetto per evitare contenuti duplicati su ecommerce e grandi portali dove ad esempio ci sono pagine quasi uguali per lo stesso prodotto ma con taglie e colori differenti, o schede di servizio che cambiano poco ma che sono sempre utili per l’utente. In questo caso il canonical aiuta.

Tag noindex

In altri casi, quando hai bisogno di pagine semivuote o con testo duplicato, puoi puntare al noindex attraverso il meta tag che puoi inserire anche attraverso Yoast. In ogni caso questa è la soluzione di forza, meno consigliata.

Tool contenuti duplicati per la SEO

Se riprendono le tue pubblicazioni per intero e le pubblicano su un altro sito web ci possono essere problemi? In linea di massima Google capisce chi è il vero autore e penalizza il ladro. Ma non è sempre così, molto dipende dall’autorevolezza del sito.

E a volte vorresti che fosse rispettata la buona norma del link di riferimento, per non parlare della proprietà intellettuale. Per questo motivo io uso 8 strumenti online per scovare tutti i copioni fraudolenti e far rispettare i miei diritti! Sei d’accordo?

Duplicate Content Checker

Entriamo nel vivo degli strumenti con Duplicate Content Checker, una finestra di dialogo che ti permette di controllare una determinata porzione di testo o, se desideri, tutti i tuoi contenuti tramite url. E alla fine puoi anche esportare i risultati.

Creative Commons

Le Licenze Creative Commons non sono uno strumento nel vero senso della parola, ma rappresentano il primo passo che devi muovere per tutelare i contenuti.

Scegli tra le soluzioni quella che più si adatta al tuo blog ed esponi il link che porta alle condizioni di ripubblicazione. Così puoi scoraggiare chi copia i contenuti.

Prevenire è meglio che curare. Una licenza Creative Commons tutelerà i tuoi contenuti, dirà ai lettori cosa possono fare e dove devono fermarsi, come possono usare quello che hai scritto e chi devono ringraziare. Dillo chiaro e forte che usi una Creative Commons, la gente ti rispetterà! Secondo te la licenza è inutile?

Operatori di ricerca

Un altro strumento è la ricerca di Google con gli operatori. Seleziona una stringa di testo, buttala su Google, chiudila tra le virgolette e avvia la ricerca. Sai quanti copioni ho scovato in questo modo? Ecco la lista dei principali operatori di ricerca.

Piccolo trucco necessario per scoprire un primo strato di contenuti duplicati. Inserendo il testo incriminato tra le virgolette “” i principali motori di ricerca (Google, Yahoo! e Bing) ti restituiscono tutti i risultati che utilizzano le stesse parole.

Il mio consiglio è quello di cercare frasi brevi e distribuite all’interno del testo (evita, quindi i blocchi di 500 battute!) e interrogare anche i risultati suggeriti.

Screaming Frog

Sì, Screaming Frog non serve a scoprire le persone che copiano i tuoi contenuti. Ma sai cosa? A volte il peggior nemico di te stesso sei proprio tu. Di conseguenza devi scoprire le pagine simili all’interno del tuo sito grazie a questo SEO tool.

Certo, chi vuole rubare un contenuto non viene inibito da questo elemento. Ma hai sempre un carta in più da far valere davanti ai ladri di testo e immagini.

Copyscape

Copyscape restituisce risultati precisi in stile Serp di Google attraverso l’inserimento della url interessata. Personalmente ho trovato alcuni casi interessanti che non conoscevo ma, sfortunatamente, la versione gratuita è limitata alle prime 10 voci!

Uno dei tool più famosi per scoprire contenuti duplicati online. Copyscape ti permette di individuare i copioni inserendo semplicemente un indirizzo di una pagina.

La versione gratuita del tool contro i copioni ha delle limitazione (mostra solo i primi 10 risultati) ma in molti casi è sufficiente. C’è anche il plugin per WordPress.

Google Alert

Google Alert ti aiuterà a scovare i ladri di contenuti. Crea un messaggio contenente il tuo dominio e il nome del blog, in questo modo ho scovato diversi blogger che ripubblicavano i miei articoli per intero scrivendo “fonte My Social Web”.

Search Console

Ho trovato molti contenuti duplicati grazie a link in entrata della Search Console: gli aggregatori e i blogger di bassa qualità copiano in malo modo i contenuti, aggiungono anche i link interni che avevi inserito. E la Search Console li rileva.

Reverse image

Ricorda che Google è utile anche per scoprire chi ha rubato le tue immagini. Devi andare su Google Immagini e fare una ricerca trascinando il tuo contenuto nel campo. Il motore di ricerca ti restituirà tutti i risultati simili. Ora chiedi la rimozione o un link.

Similar Page Checker

Il contenuto che hai pubblicato potrebbe essere simile a quello di altri siti web presenti online o di altre pagine all’interno del tuo progetto web. Di solito avviene per le pagine ecommerce dei prodotti o le categorie del blog. Verifica queste eventualità con un tool semplice e affidabile: Similar Page Checker.

Similar Page Cheker è una realtà che può fare la differenza per risolvere i contenuti duplicati. Più o meno uguale al precedente, possiede le due finestre per inserire gli indirizzi da comparare. Utile per un confronto dei risultati.

Plagium e contenuti duplicati

Già conosci Plagium? Anche in questo caso basta inserire il testo nella finestra di dialogo per scoprire se hai subito un plagio nelle normali pagine web o tra le news, in una qualsiasi delle 6 lingue elencate. In questo modo puoi controllare in profondità.

Un altro tool simile a Copyscape che ti permette di trovare contenuti pubblicati si chiama Plagium. Indispensabile per una ricerca incrociata ed essere sicuro al 100% di quali siano i colpevoli di furto. Da provare sul tuo blog quando copiano i contenuti.

 WP Content Copy Protection

Un plugin WordPress utile per evitare che ci siano altri casi di contenuti copiati. Con questo elemento puoi trasformare il tuo blog in una botte di ferro.

Disabilita il copy and past su WordPress.

Qualche esempio? Puoi disabilitare l’uso del tasto destro per copiare il testo, annulla l’uso dei comandi tastiera e impedire il drag and drop delle immagini.

Copyright: come scoraggiare chi copia i contenuti

Riporto il contributo di Simona Nurcato, guest blogger per My Social Web. I contenuti delle sue pagine web sono stati copiati da altri siti. Ne ha scoperti tre, hanno duplicato tutto. Ecco come ha risolto il problema dei contenuti duplicati da altri siti.

Pubblicare gli screenshot dei testi copiati

Passata la rabbia, ho elaborato una strategia: ho salvato lo screenshot delle pagine in cui erano presenti i miei testi, ho fatto la stessa cosa con le pagine del mio sito e ho evidenziato le parti di testo identiche per conservare la dimostrazione del plagio.

Poi ho pubblicato le immagini su un album nella mia pagina Facebook. Ho creato un post all’interno del blog per raccontare l’accaduto e ho chiesto di modificare le pagine. Il gioco è questo: voi togliete i testi copiati, io tolgo le immagini da Facebook.

Nelle immagini ho eliminato il nome e il logo dei copioni. Non volevo danneggiare la loro immagine, ma creare un deterrente per evitare il furto dei miei testi.

La reazione di chi ha copiato i contenuti

Mi chiama la proprietaria di uno dei tre siti scusandosi, sostenendo di aver affidato la realizzazione del sito a un conoscente di un amico che si è rivelato un pessimo professionista: “un napoletano… lasciamo perdere, è proprio vero quello che dicono”.

Immagina la mia faccia (sono napoletana) mentre ascoltavo: l’ho ringraziata per la risposta spiegandole che questo è ciò che accade quando ci si affida a webmaster improvvisati per spendere meno, assicurandola che avrei eliminato le immagini.

Un altro caso, hanno risposto così: “abbiamo utilizzato parte dei tuoi testi per spiegare un servizio che forniamo anche noi, ma non era intenzione arrecare danno”.

Parte dei tuoi testi. Quattro pagine del mio sito erano state copiate per intero. L’unica frase aggiunta da loro era un errore, perché ripeteva una frase già scritta.

Avrei potuto fare altro per i testi duplicati?

Ho fatto bene? Questo è il modo giusto di agire? Non lo so, ma nel giro di 24 ore ho ottenuto ciò che volevo: l’eliminazione dei testi copiati da altri siti web.

Se avessi chiesto di cancellare i testi mi avrebbero risposto “sì, scusa, lo faremo”. Ma poi? Quali sarebbero stati tempi dell’azione? In questo modo li ho costretti a farlo immediatamente. Il mio obiettivo era anche evitare che la cosa si ripetesse. Vuoi copiare i contenuti del mio sito? Ecco le conseguenze, la prossima volta evita.

Da leggere: perché Google non indicizza tutte le pagine?

Contenuti duplicati e SEO: ecco i link utili

C’è una sezione dedicata ai link utili in ogni tutorial. Ecco la mia selezione dedicata al tema dei contenuti duplicati: ho le fonti migliori, spero che ti aiutino.

Come risolvi i problemi di contenuti duplicati? Hai problemi di indicizzazione? Lascia la tua esperienza nei commenti e aiutami a far crescere questa guida.

Evitare contenuti duplicati online: cosa fai?

Questi sono i migliori tool per evitare contenuti duplicati. Ne aggiungo un altro scegli tag e categorie con cura, sono le fonti principali di contenuti duplicati in un blog. Per il resto lascio spazio alla tua esperienza: come combatti i ladri di contenuti?

Riccardo Esposito

Sono un web writer freelance. Mi occupo di scrittura online dal 2009, mi sono specializzato nella stesura di piani editoriali per blog aziendali. Ho scritto 3 libri dedicati al mondo del blogging e della scrittura online (bio di Riccardo Esposito).

Categoria: Ottimizzazione siti

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Torna in alto