1. Magazin
  2. /
  3. SEO
  4. /
  5. So finden und vermeiden Sie Duplicate Content

So finden und vermeiden Sie Duplicate Content

SEO
Duplicate Content

So finden und vermeiden Sie Duplicate Content

Suchmaschinen, vor allem Google, setzen auf User Experience und das bedeutet einzigartiger Content mit Mehrwert. Doch häufig findet sich auf verschiedenen Websites oder auch innerhalb einer Website der gleiche Content auf verschiedenen URLs. Doch gleicher Content wird nur einmal indexiert! Im schlimmsten Fall wird Duplicate Content mit der Entfernung aus dem Index abgestraft.

Duplicate Content ist ein oft gesehenes Problem auf Websites und vor allem in Online-Shops. Das Problem: Besonders mit externem Duplicate Content riskiert man Penalties durch Google und bekommt eventuell eine schlechtere Platzierung in den SERPs.

Und wie wir alle wissen, ist Sichtbarkeit das A und O für eine erfolgreiche Website mit vielen Besuchern. Deshalb erkläre ich Ihnen in diesem Blogartikel was genau als Duplicate Content gewertet wird, wie Google mit duplizierten Inhalten umgeht und wie man sich doppelnde Inhalte vermeiden kann.

Was ist Duplicate Content?

Duplicate Content bezeichnet doppelte Inhalte, das heißt Content, der sehr ähnlich oder sogar identisch ist und auf verschiedenen URLs zu finden ist. Dabei kann man zwischen internem und externem Duplicate Content unterscheiden, beide Arten sollten möglichst vermieden werden. Das Gegenteil von Duplicate Content ist Unique Content, also einzigartiger Inhalt.

 

Duplicate Content
Duplicate Content

Die Vermeidung von Duplicate Content spielt eine wichtige Rolle für die Suchmaschinenoptimierung, da Suchmaschinen heutzutage in der Lage sind die doppelten Inhalte zu erkennen. Suchmaschinen haben sich in den letzten Jahren immer mehr auf die Analyse der Qualität von Inhalten spezialisiert und diese wirkt sich auch auf die SERPs aus.

Das ist kein Duplicate Content

Zitate gelten nicht als Duplicate Content, wobei diese im Quelltext als Zitat ausgezeichnet werden sollten. Außerdem erlaubt ist gleicher Content in Apps und gleiche Snippets, wenn diese zu unterschiedlichen Seiten gehören. Übersetzungen galten lange Zeit  ebenfalls nicht als Duplicate Content, sollten mittlerweile aber auch im Quellcode angegeben werden.

Interner Duplicate Content

Interner Duplicate Content bezeichnet doppelte Inhalte auf der eigenen Domain. Shop-Systeme haben besonders oft dieses Problem, da häufig identische Produktbeschreibungen genutzt werden. Es gibt aber auch einige technische Gründe, die für internen Duplicate Content verantwortlich sein können.

Beispiele für internen Duplicate Content

  • Tag-Übersichtsseiten
  • Snippets
  • Kategorie-Seiten
  • Produkt(einzel)seiten
  • Beiträge mit Zuordnung zu mehreren Kategorien
  • Interne Suchergebnissseiten
  • Paginierung von Kommentaren
  • Druckversionen von Websites
  • Filterfunktion in Online-Shops
  • Relaunch der Website oder Domain-Umzug
  • Ähnliche oder identische Inhalte
  • Interne Suche auf Websites
  • mobile Website mit identischem Inhalt
  • Website mit http und https erreichbar
  • Website mit www und ohne www erreichbar
  • URL-Parameter und Session IDs

Allerdings ist diese Art von Duplicate Content für Google kein schwerwiegendes Problem. Es ist allerdings immer ratsam doppelte Inhalte soweit wie möglich zu vermeiden.

So vermeiden Sie Internen Duplicate Content

Interner Duplicate Content ist schnell passiert. Doch viele Fehler lassen sich schnell beseitigen oder einfach direkt vermeiden.

Technische Gründe

Um technische Gründe für doppelte Inhalte zu erkennen, können Tools, wie Searchmetrics, Sistrix oder Xovi dienen, diese analysieren die Fehler die das CMS erzeugt. Normalerweise besteht die Lösung entweder in 301-Weiterleitungen oder dem Einsetzen von Canonical Tags.

Bei verschiedenen technischen Aspekten müssen Sie sich für eine Variante entscheiden und durch eine 301-Weiterleitung der anderen Varianten den doppelten Inhalt vermeiden. Z.B. bei www und nicht-www.

Wenn Sie sich für eine Domain mit www entscheiden, sollten Sie die Variante ohne auf die www-Domain weiterleiten. Geben Sie außerdem in der Google Search Console Ihre Wahl an. Das gleiche gilt für http und https. URLs sind mit beiden Varianten erreichbar.

Es ist aber sinnvoll die http-Seiten auf die gesicherten https-Seiten umzuleiten. 301-Weiterleitungen sollten auch betreffs Groß- und Kleinschreibung in URLs genutzt werden. Der Vorteil von 301-Redirects liegt darin, dass der PageRank bei der Weiterleitung einer kompletten Domain auch auf das neue Ziel übertragen wird.

URL-Parameter und Session-IDs geben Auskunft über Website-Besucher, allerdings ergeben sich durch das Tracking neue URLs, die für Google den Eindruck von Duplicate Content vermitteln.

Online-Shops

Das Problem bei Online-Shops entsteht durch mehrere Varianten eines Produkts, z.B. durch Farbunterschiede. In den meisten Shops für Kleidung kann man sich via Filtereinstellungen die Produkte in einer bestimmten Farbe anzeigen lassen. Aber die gefilterten Ergebnisse haben eine andere URL, wo jeweils die gleichen Produkte vorhanden sind, wie in der normalen Übersicht. Diese Produktdetailseiten werden dann häufig von Google als Duplicate Content abgestempelt.

Dieses Problem können Sie umgehen, indem nach Möglichkeit die Kategorie aus der URL der Produktdetailseite löschen. Dadurch wird vermieden, dass es zwei verschiedene URLs mit dem gleichen Produkt gibt.

Eine andere Variante ist das Einfügen eines Canonical Tags in den Quellcode von der Filterseite. Dieser verweist mit einem Link auf die ungefilterte Kategorie und zeigt Suchmaschinen so, dass es sich aus bestimmten Gründen, bzw. gewollt um einen duplizierten Inhalt handelt. Einfach ausgedrückt, zeigt der Canocial Tag (rel=canonical) Google an, welche URL nun die repräsentative ist.

Interne Suche

Auf einigen Websites wird Besuchern eine interne Suche angeboten, jedoch haben die Ergebnisseiten ebenfalls eine eigene URL, wobei, ähnlich wie bei dem Filter in Online-Shops, den gleichen Inhalten eine neue URL zugeordnet wird, die damit als Duplicate Content zählt.

Mit dem Tag „noindex“ können Sie die Indexierung der Seiten durch Google vermeiden. Der Vorteil ist, dass Suchmaschinen diese dann zwar nicht indexieren, aber den Links folgen, die sich auf diesen Seiten befinden. Dennoch kann die Seite von der Suchmaschine gecrawlt werden. Für die Erstellung von einzigartigen Inhalten bieten sich Tools an, die mit der WDF*IDF Formel das Verhältnis bestimmter Wörter innerhalb der Website berechnen.

Pagierung von Kommentaren

Ab einer bestimmten Anzahl an Kommentaren wird bei vielen Websites eine Trennung der Kommentare auf mehrere Seiten vorgenommen. Für die Suchmaschine ergeben sich daraus aber verschiedene URLs, die alle den gleichen Inhalt, nämlich Kommentare, haben und somit ebenfalls als Duplicate Content gewertet werden.

Website-Relaunch oder Umzug

Wenn Sie Ihre Website mit einer neuen URL-Struktur relaunchen oder auf eine neue URL umziehen, sind die vorherigen URLs noch erreichbar, das heißt auch weiterhin im Google Index. Da normalerweise der zuerst erschienene Content als Original gewertet wird, handelt es sich nun bei den neuen URLs um Duplicate Content. Mit 301-Weiterleitungen kann dieses Problem vermieden werden.

Unterschiedliche Sprachversionen

Mittlerweile sind sehr viele Websites, vor allem von größeren Unternehmen, in mehreren Sprachen verfügbar. In diesem Fall sollte man Google immer die geografische Ausrichtung der Seite mitteilen, da sonst die Inhalte der verschiedenen Sprachoptionen dennoch als Duplicate Content gewertet werden. Verschiedene Sprachversionen können über das Link-Attribut rel=„alternate“hreflang=„x“ definiert werden.

Inhalte

Allgemein gilt natürlich, dass man sich immer um eigenen und einzigartigen Content bemühen sollte, anstatt einfach zu kopieren oder hier und da mal einen Satz zu ändern.

Aber besonders bei Produktbeschreibungen lässt sich Duplicate Content häufig nur schwer oder garnicht vermeiden. Neben der Bearbeitung der Kategorieseiten, kann es hier von Vorteil sein, das Augenmerk auf die wichtigsten Produkte zu lenken und diese mit einzigartigen Produktbeschreibungen zu versehen.

Auch auf doppelte Seitentitel und Snippets sollte geachtet werden, denn sie verhindern, dass Google feststellen kann, welche URL nun die themenrelevantere ist. Ebenso müssen Druckversionen von Seiteninhalten, z.B. in Form von PDFs kenntlich gemacht werden, da auch diese sonst als Duplicate Content bewertet werden.

 

Was ist Externer Duplicate Content?

Wenn auf verschiedenen Domains ähnliche oder gleiche Inhalte vorhanden sind, handelt es sich um externen Duplicate Content. Es ist davon auszugehen, dass diese Art von duplizierten Inhalte in Hinblick auf Google schwerwiegender zu bewerten ist. Das schlimmste Beispiel sind Domains, die einfach fast komplett die Inhalte von anderen Domains übernehmen.

Beispiele für externen Dublicate Content

  • Content-Scraping/Diebstahl
  • Kopien von Produktbeschreibungen der Hersteller
  • Kopien von Pressemitteilungen
  • Inhalte von Affiliate-Seiten
  • Website mit mehreren Domainnamen
  • Veröffentlichung eigener Inhalte in anderen Portalen
  • Content-Einspielung über RSS-Feeds

 

Externer Duplicate Content

Duplicate Content kann man mit verschiedenen Tools herausfinden, wie Copyscape oder Siteliner. Diese Programme sind darauf spezialisiert im Internet nach Plagiaten zu suchen. Diese Tools suchen sowohl nach externem als auch internem Duplicate Content. Auch wenn letzterer nicht allzu schlimm ist, sollten Webmaster dennoch versuchen ihn zu vermeiden.

Markante Seiteninhalte können allerdings auch einfach über die Google-Suche abgefragt werden, indem man einen Textausschnitt kopiert. Achten Sie bei solchen Abfragen darauf, dass Sie keine zu allgemeinen Sätze auswählen. Es existieren mittlerweile so viele Websites und so gut wie alle Themen wurden schon mehrmals behandelt, sodass es teilweise schon automatisch zu gleichen Formulierungen kommt.

Was tun bei Content-Diebstahl?

Fällt einem Webmaster auf, dass ein anderer den eigenen Content auf dessen Website ohne Quellenangabe nutzt, so besteht der erste Schritt in der Kontaktaufnahme mit der Bitte die eigene Website als Quelle anzugeben oder den Inhalt zu löschen.

Sollte dieser Schritt nichts bringen oder es sich um einen größeren Content-Klau handelt, so kann mit einer Abmahnung gedroht werden, beziehungsweise die Verletzung des Urheberrechts an Google gemeldet werden Die Meldung an Google erfolgt über die Google Search Console.

Auch an dieser Stelle möchte ich noch einmal erwähnen, dass wirklich genau geprüft werden sollte, ob es sich tatsächlich um Duplicate Content handelt, oder einfach nur um eine ähnliche aber eigene Ausarbeitung.

Vermeidung von Dublicate Content bei responsive Design

Es empfiehlt sich schon seit längerem Websites auch für mobile Endgeräte zu optimieren, da diese dann beim Zugriff über Smartphones und Tablets höher in den SERPs angezeigt werden als Websites ohne responsive Design. Nun ergibt sich aber das Problem, dass für die mobile Website häufig eine Subdomain erstellt wird und das bedeutet, dass die Inhalte auf der mobilen Website für Google zu Dublicate Content werden. Verhindern lässt sich das durch den rel=alternate-Tag, der von der Desktop-Version auf die mobile Version verweist, sodass Suchmaschinen erkennen, dass es sich eigentlich um die gleiche Domain handelt.

Google und der Duplicate Content

Google kann Duplicate Content relativ gut erkennen, dazu haben das „Brandy“ Uodate und das „Bourbon“ Update in den Jahren 2004 und 2005 beigetragen.

Warum Google keinen Duplicate Content mag

Mehrwert für die Nutzer

Google hat lange an der Semantischen Suchmaschine gearbeitet, die das Nutzerverhalten analysiert und achtet seit den Updates „Panda“, „Penguin“ und „Hummingbird“ vermehrt auf die Qualität von Inhalten. Im Vordergrund solle laut Google immer der Mehrwert für Internetnutzer und die User Experience stehen.

Einfluss auf die Indexierung

Der Googlebot crawlt regelmäßig Websites, dabei werden bereits vorhandene Websites überprüft, sowie neue Websites analysiert und in den Index aufgenommen. Je schneller der Googlebot beim Crawlen einer Website ist, desto tiefer und öfter wird diese analysiert. Wenn die PageSpeed zu lang ist oder zu viel interner Duplicate Content auf der Seite ist, dann ist die Wahrscheinlichkeit hoch, dass der Googlebot das Crawling vorzeitig abbricht. Das bedeutet, einige wichtige URLs werden nicht mit in die Indexierung aufgenommen und das ist nicht gut für das Ranking.

Ein weiterer Grund ist, dass der Bot die Informationen der Website für das Crawling herunterlädt. Doppelte Inhalte belegen unnötig freien Speicherplatz und genau an dieser Stelle wird dann gerne Speicherplatz gespart. Auch in diesem Fall werden die Inhalte nicht indexiert.

 

Wie erkennt Google die Urheberschaft?

Die große Frage ist: Wie erkennt Google die Urheberschaft von Inhalten? Es wird davon ausgegangen, dass Google denjenigen als Urheber anerkennt, dessen Inhalte zuerst im Index aufgenommen werden.

Das kann aber auch zu Problemen führen. Häufig dauert es eine Weile bis neue Websites von Google gecrawlt und im Index aufgenommen werden. Sie haben am Anfang noch nicht so viele, bzw. gute Verlinkungen, weswegen es auch dauert bis der Googlebot vorbeischaut.

Nun ergibt sich das Dilemma, dass in der Zeit andere Website, die bereits im Index sind, Inhalte kopieren oder nur minimal abändern und für ihre Zwecke nutzen könnten. Da die Urheber noch nicht in den Index aufgenommen wurden, zählen nun die Content-Diebe als die eigentlichen Urheber und die Originalquelle erhält wegen Duplicate Content eventuell ein schlechteres Ranking.

Daher sollte man tunlichst die Reichweite steigern, wodurch auch wieder deutlich wird, wie wichtig Suchmaschinenoptimierung für das Online-Marketing ist.

 

Konsequenzen

Duplicate Content kann zu einer Abstrafung durch Google führen und sollte daher vermieden werden, wenn man nicht seine Platzierung im Ranking verlieren möchten.

Doch nicht nur von Google direkt kann eine schlechtere Platzierung in den Rankings erfolgen. Nutzer haben mittlerweile eine riesige Auswahl an Websites zur Auswahl, die ihnen gewünschte Informationen oder Produkte liefern können. Websites mit Duplicate Content bieten keinen Mehrwert und daher auch eine schlechte User Experience. Das macht sich in höheren Absprungraten und weniger Pageviews bemerkbar.

Laut Google ist Duplicate Content noch kein Grund für Penalties, vor allem nicht bei internem Content. Allerdings gibt es Ausnahmen, wenn durch den Duplicate Content manipulativen Absichten sichtbar werden, z.B. um das Ranking zu manipulieren. Die Folge sind Abstrafungen, die den PageRank verschlechtern.

Es ist also Auslegungssache und ganz von Google abhängig, ob Duplicate Content nun als Manipulation eingestuft wird oder nicht. Google versucht immer selber herauszufinden, welche URL nun den relevantesten Inhalt zu einem Thema hat und indexiert dann auch nur diesen. Wer auf Nummer sicher gehen möchte, verzichtet lieber ganz auf identische oder ähnliche Inhalte.

 

So vermeiden Sie Fehler

Sie haben nun einiges über Duplicate Content gelernt. Von der Frage was das überhaupt ist, bis hin zur Vermeidung von doppelten Inhalten. Hier möchte ich ihnen noch einmal die fünf wichtigsten Tipps mit auf den Weg geben.

  • Nicht kopieren, selber kreativ werden!
  • Schließen Sie Seiten nicht mit robots.txt von der Indexierung aus.
  • Verwenden Sie 301-Redirects
  • Verhindern Sie mit „noindex“ die Indexierung von unfertigen Seiten
  • Verwenden Sie die Google Search Console

 

Erfolg mit Unique Content

Es gibt einige Ursachen für Duplicate Content, vor allem auf der eigenen Website schleichen sich schnell kleine Fehler ein. Deshalb wollte ich Ihnen zeigen, wie Sie diese ganz einfach beheben oder gleich von Anfang an vermeiden können. Beachten Sie auch regelmäßig mit Tools zu überprüfen, ob andere Websites ihren Content geklaut haben.

Natürlich ist es immer hilfreich sich im Internet und auf anderen Websites inspirieren zu lassen. Vor allem, wenn es um aktuelle Trends geht, führt nichts um die Recherche auf anderen Websites herum. Der Trick ist hier, sich nur inspirieren zu lassen.

Sie können ihren Besuchern nur eine gute User Experience bieten, wenn ein Mehrwert für sie dabei ist. Machen Sie sich also selber Gedanken. Was machen die anderen und welche Informationen bieten sie? Was kann ich selber beitragen um den Usern was zu bieten. Vielleicht sehen Sie ja irgendwo einen Infotext über Duplicate Content und denken Sich: Ja aber das kann ich doch besser! Dann setzen Sie selber Ihre eigenen Ideen um.

Vielleicht fällt Ihnen noch eine tolle Infografik zur Veranschaulichung ein, die das Thema verständlicher macht und die es so noch nicht gibt, oder sie behandeln das Thema sehr viel umfangreicher als die anderen. So oder so, was zählt ist die Kreativität. Mit Kreativität schaffen Sie einzigartige Inhalte und so ziehen Sie auch mehr Besucher auf Ihre Website. Also legen Sie los, die Mühe lohnt sich!