Duplicate Content - auf der Suche nach den Content-Dieben

Geschrieben von Lisa | 21.04.2021 08:41:07

Duplicate Content (auf Deutsch: doppelter Inhalt) ist ein Thema, das viele Websites im Web betrifft. Sei es das Ergebnis einer gewollten Maßnahme oder eine "natürlich" entstandene Dopplung. Gründe dafür gibt es wie Sand am Meer: ein internes Problem des eingesetzten Content Management Systems (CMS), Website-Relaunch, Content-Scraper oder oder oder...

In unserem ersten Beitrag der Reihe "SEO-Grundwissen: Duplicate Content (Teil 1)" haben wir euch mit den grundlegenden Informationen zum jeweiligen Thema bereits vertraut gemacht.

In diesem Artikel geht es uns um eine bestimmte Art von Duplicate Content, um den externen Duplicate Content, sowie um die Maßnahmen zur dessen Vermeidung.

Externer Duplicate Content - da lauert die Gefahr

Was ist externer Duplicate Content?

Unter externem Duplicate Content (doppelter Inhalt) versteht man gleiche oder ähnliche Inhalte, die auf verschiedenen Webseiten bzw. Domains auftauchen.

Wann entsteht externer Duplicate Content?

Mit www oder ohne www? http und/oder https? Mit "/" Trailing Slash am Ende oder ohne?

Externer Duplicate Content entsteht zum Beispiel wenn eine Website mit www und ohne www erreichbar ist und es keine Weiterleitung von der einen Version auf die andere gibt:

www.meinbaumparadies.de UND meinbaumparadies.de

Was hilft: Domain-Umleitung in der .htaccess Datei

Bei der Nutzung von fremden Produkttexten, bzw. Produktinformationen

Onlineshops, die Produkte von anderen Anbietern verkaufen haben häufig das Problem mit der Einzigartigkeit ihrer Inhalte.

Nehmen wir an, ihr habt einen Onlineshop und bietet euren Kunden Baby-Pflegeartikel an. Da ihr diese Artikel nicht selbst produziert, sondern nur weiter verkauft, bezieht ihr die Produktinformationen entweder vom Hersteller oder von einem anderen Drittanbieter. Um Zeit und Geld zu sparen, automatisiert ihr den Prozess der Produkt-Informationen-Übernahme in euren Onlineshop und bindet Produkte im Shop ein. Was raus kommt, ist ein Onlineshop mit 100en oder vielleicht sogar 1000en Produktseiten mit Informationen, die auf anderen Websites bereits verfügbar sind. So habt ihr im Handumdrehen Duplicate Content auf eurer Domain geschaffen.

Was hilft: Produkttexte selber schreiben

Content-Klau - wenn mehrere Domains denselben Text veröffentlichen

Hier geht es sowohl um Scraper-Seiten oder Aggregatoren, die Informationen im Web automatisch sammeln und auf anderen Websites veröffentlichen als auch um die Zusammenstellung von Inhalten zum Thema XYZ aus den Inhalten anderer Websites.

Um ein ganz primitives Beispiel zu nennen: jemand baut eine Website zum Thema XYZ und kennt sich mit dem Thema nicht wirklich aus, bzw. er hat keine Lust, die Inhalte selber zu erstellen. Im Web sucht er nach Informationen zu diesem Thema, kommt auf eure Website, findet die Informationen toll, kopiert sie oder Teile davon und bindet diese auf seiner eigenen Website ein. Wer besonders "schlau" ist, spiegelt die komplette Domain unter einer anderen URL und versucht damit zu ranken. Besonders ärgerlich wird es dann, wenn die eigene Website tatsächlich an Rankings verliert.

Was hilft: canonical-Tag im Header jeder Seite einbauen, ggf. Scraper-Sites an Google melden und das Scraper Report-Formular ausfüllen.

Unterschiedliche Versionen einer Website

Hier geht es vor allem um Onlineshops, die in mehreren Sprachen verfügbar sind. Jedoch unterscheiden sich die dort vorhandenen Inhalte, bzw. Produkte nur minimal voneinander. Eine Abhilfe wäre hier die geographische Ausrichtung der Seite über das hreflang-Attribut (rel="alternate" hreflang="x") im HTML-Header der Website. Auf diese Weise weist man Google darauf hin, dass es mehrere Sprachversionen auf der Website gibt und dass sie in der Suche auseinander gehalten werden sollen.

Nach einem Domainumzug

In diesem Fall kann es dazu kommen, dass alle Seiten eurer alten Domain im Suchmaschinen-Index verfügbar sind ebenso wie die Seiten der neuen Domain, die gleiche oder ähnliche Inhalte enthalten. Das Ergebnis: gleiche Inhalte sind im Index der Suchmaschinen unter verschiedenen URLs erreichbar. Daraus folgt: gleiche Inhalte + unterschiedliche URLs = Duplicate Content

Was hilft: 301-Weiterleitung einrichten und Adresseänderung bei Google melden

Druckversionen von Seiten sind indexiert

Nehmen wir als Beispiel einen Onlineshop für Handwerker. Der Shop hat hunderte Produkte und bietet dem Kunden ausführliche Informationen wie Maßangaben, Gebrauchsanleitung, Material etc. an. Dabei sind diese Informationen nicht nur in der Produktbeschreibung auf der Website zu finden sondern stehen als PDF-Version zum Download bereit. Daraus folgt, gleiche Inhalte + unterschiedliche URLs = Duplicate Content

Was hilft: Canonical-Tag im HTTP-Header der Seite (über die Konfiguration des Webservers) einbinden

Wie prüfe ich, ob jemand meinen Content geklaut hat?

Es gibt zahlreiche Tools, mit deren Hilfe man nach „Inhalt-Dieben" im Web suchen kann. Copyscape wäre eins davon. Wer keine Tools nutzen möchte, kann es direkt in der Google-Suche machen. Dafür kopiert Teile eurer Website-Inhalte und fügt diese in das Suchfeld der Suchmaschine ein. Wichtig dabei ist den eingefügten Content-Teil mit Anführungszeichen zu versehen. Dadurch gibt man Google einen Hinweis darauf, dass es genau nach diesem Textabschnitt im Web suchen soll.

Beispiel: "Laut Google werden unter Duplicate Content hauptsächlich inhaltliche Textpassagen innerhalb einer Domain oder Domain-übergreifend verstanden"

Wie vermeide ich externen doppelten Inhalt?

Nutzt die Google Search Console
Überprüft eure Website manuell oder mithilfe von Online-Tools auf Duplicate Content
Erstellt individuellen Inhalt mit Mehrwert für eure Kunden
Bei mehreren Sprachversionen mit gleichen Ihnhalten achtet auf die geografische Ausrichtung
Richtet Weiterleitungen ein, falls ein und derselbe Inhalt unter verschiedenen URLs erreichbar ist
Bindet den Canonical-Tag auf euren Seiten ein, um den Content-Klau zu verhindern

FAZIT

Duplicate Content bedeutet nicht immer etwas Schlimmes. Laut Matt Cutts, dem Head of Google Webspam-Team, ist Duplicate Content kein Spam, der bestraft würde. 25% bis 30% des gesamten Web-Contents ist Duplicate Content. Häufig entsteht er auf eine natürliche Art und Weise. Wenn er jedoch zur Manipulation von Rankings eingesetzt wird, reagieren Google und andere Suchmaschinen drauf. Damit es nicht passiert:

Behaltet eure Rankings und die Inhalte eurer Website immer im Auge
Macht eine Stichproben-Suche nach Duplicate Content in regelmäßigen Abständen oder bei unerwarteten Ranking-Schwankungen
Versucht keinen Duplicate Content selber zu produzieren
und ihr werdet merken, dass sogar diese kleinen Maßnahmen der Gesamt-Entwicklung eurer Websites ein positives Ergebnis bringen.

Vollständigen Beitrag anzeigen