Duplicate Content

Duplicate Content Definition

Duplicate Content bedeutet übersetzt „doppelter Inhalt“. Darunter versteht man doppelte Inhalte, also Texte, die über mehrere URL’s erreichbar sind. Der Inhalt einer Website sollte immer nur über eine URL erreichbar sein, weshalb man Duplicate Content unbedingt vermeiden sollte. Falls man sicher gehen will, dass keine doppelten Inhalte vorhanden sind, sollte man eine Content Marketing Agentur zu Rate ziehen.

Externe vs interne doppelte Inhalte

Sobald auf einer Seite mehr doppelte, als einzigartig Inhalte sind, hat man ein Problem. Allerdings muss man zwischen internem und externem Duplikate Content unterscheiden.

Interner Duplicate Content

Interner doppelter Inhalt beschränkt sich auf die eigene Domain. Er kann allein schon auftreten, wenn identische Inhalte auf einer Website unter mehreren URL’s zu finden ist.

Oftmals haben Onlineshops mit internem doppeltem Inhalt zu kämpfen, weil zum Beispiel Produkt-Detailseiten auch ohne die dazugehörige Kategorie- bzw. Produktseite aufrufbar sind:

https://www.domain-des-onlineshops.de/kategorie/produktdetailseite

https://www.domain-des-onlineshops.de/produktdetailseite

Falls extern auf beide URL’s verlinkt wurde, werden dann von Google gerne beide Seiten indexiert und als doppelter Inhalt gezählt. Auch eine nicht einheitliche interne Verlinkung kann zu Indexierungsproblemen führen.

Externer Duplicate Content

Externer doppelter Inhalt ist domain-übergreifend, also tritt er unter zwei oder mehreren Domains auf. Er kann zum Beispiel dann entstehen, wenn eine Website in mehreren Sprachversionen verfügbar ist, aber mit mehr als einer Sprachversion in derSuchmaschine in den Suchergebnissen auftaucht.

Es kann auch sein, dass Websites über verschiedene Domain-Namen erreichbar sind. Das ist soweit auch nicht schlimm, solange man die ganzen anderen Domain-Variationen per 301-Weiterleitung auf die Hauptdomain weiterleitet.

Falls das nicht gemacht wird, gibt es für Google im Index mehrere Domains mit den gleichen Inhalten, was es dem Google-Bot schwer macht, die Relevanz zu bestimmen und somit zu Ranking-Problemen führen kann.

Was kann noch als Duplicate Content gezählt werden?

  • Automatisch generierte Tag-Seiten
  • Paginierungsseiten
  • Parameter für Affiliate URL’s, wie ?partnerid=2858
  • Wenn man für Druckversionen eigene URL’s hat
  • Zusätzliche PDF’s mit Informationen, die auch schon auf der Landingpage angegeben sind
  • URL’s, die durch Groß-und Kleinschreibung erreichbar sind
  • /index.htm, /de/ und ähnliche Dinge, die Content-Management-Systeme produzieren
  • Parameter-URLs für Sortierung und Darstellung von Produktübersichten

Die Bedeutung von Duplicate Content für SEO

Doppelte Inhalte sind nicht einzigartig und liefern den Nutzern keinen Mehrwert. In den Augen von Google stellt Duplicate Content sogar in manchen Fällen einen Betrugsversuch dar.

Außerdem stellt Duplicate Content Google vor ein Problem: Es hat das Ziel, dem User das bestmögliche Ergebnis auszuliefern. Durch die doppelten Inhalte weiß es nun nicht, welche der beiden oder mehreren URL’s es weiter oben im Ranking anzeigen und so dem User ausliefern soll.

Deshalb wird von Content- und SEO-Experten doppelte Inhalte sehr ernst genommen. Sie können für starke Schwankungen in den Suchergebniss-Seiten (SERP’s) sorgen, da für Google nicht klar ist, welche der Seiten nun den relevantesten Inhalt hat.

Google’s Lösungs-Ansatz für Duplicate Content

Was die Indexierung der Inhalte betrifft, versucht Google die bestmögliche Version der doppelten Inhalte zu identifizieren und indexiert dann nur diese, sofern das möglich ist.

Google versucht doppelte Inhalte selbst zu identifizieren und dann eigenständig zu entscheiden, welcher Content am relevantesten für die Suchanfrage des Nutzers ist. Dieser wird dann ausgeliefert und steigt im Ranking auf.

Was nicht als Duplicate Content gilt

Wenn es mehrere Sprachversionen eines Textes gibt, dann zählt das nicht als Duplicate Content.
Auch zitierte Textpassagen und Zitate werden nicht als doppelte Inhalte angesehen, wobei man dort auf eine korrekte semantische Auszeichnung im Quelltext achten sollte.

Diese lautet:

<blockquote>
    Hier steht der zitierte Text - 
    <cite>
        Hier steht der Name des zitierten Autors oder der Quelle
    </cite>
</blockquote>

Auch Content in Apps und unterschiedliche Seiten mit gleichem Seitentitel werden nicht als doppelter Inhalt angesehen.

Duplicate Content – So überprüft man eine Website auf doppelte Inhalte

Es gibt viele Tools, die eine automatische OnPage-Analyse einer Website durchführen und alle Fehler, die relevant für SEO sind, anzeigen. Dazu gehört auch der Fehlertyp der doppelten Inhalte.

Ansonsten kann man auch einfach eine Text-Passage bzw. Einen Text-Baustein in Anführungszeichen setzen und googlen.

Quellen

https://www.sistrix.de/frag-sistrix/onpage-optimierung/duplicate-content/
https://www.seokratie.de/duplicate-content/