Duplicate Content (auf Deutsch: doppelter Inhalt) ist ein Thema, das viele Websites im Web betrifft. Sei es das Ergebnis einer gewollten Maßnahme oder eine "natürlich" entstandene Dopplung. Gründe dafür gibt es wie Sand am Meer: ein internes Problem des eingesetzten Content Management Systems (CMS), Website-Relaunch, Content-Scraper oder oder oder...
In unserem ersten Beitrag der Reihe "SEO-Grundwissen: Duplicate Content (Teil 1)" haben wir euch mit den grundlegenden Informationen zum jeweiligen Thema bereits vertraut gemacht.
In diesem Artikel geht es uns um eine bestimmte Art von Duplicate Content, um den externen Duplicate Content, sowie um die Maßnahmen zur dessen Vermeidung.
Unter externem Duplicate Content (doppelter Inhalt) versteht man gleiche oder ähnliche Inhalte, die auf verschiedenen Webseiten bzw. Domains auftauchen.
Externer Duplicate Content entsteht zum Beispiel wenn eine Website mit www und ohne www erreichbar ist und es keine Weiterleitung von der einen Version auf die andere gibt:
www.meinbaumparadies.de UND meinbaumparadies.de
Was hilft: Domain-Umleitung in der .htaccess Datei
Onlineshops, die Produkte von anderen Anbietern verkaufen haben häufig das Problem mit der Einzigartigkeit ihrer Inhalte.
Nehmen wir an, ihr habt einen Onlineshop und bietet euren Kunden Baby-Pflegeartikel an. Da ihr diese Artikel nicht selbst produziert, sondern nur weiter verkauft, bezieht ihr die Produktinformationen entweder vom Hersteller oder von einem anderen Drittanbieter. Um Zeit und Geld zu sparen, automatisiert ihr den Prozess der Produkt-Informationen-Übernahme in euren Onlineshop und bindet Produkte im Shop ein. Was raus kommt, ist ein Onlineshop mit 100en oder vielleicht sogar 1000en Produktseiten mit Informationen, die auf anderen Websites bereits verfügbar sind. So habt ihr im Handumdrehen Duplicate Content auf eurer Domain geschaffen.
Was hilft: Produkttexte selber schreiben
Hier geht es sowohl um Scraper-Seiten oder Aggregatoren, die Informationen im Web automatisch sammeln und auf anderen Websites veröffentlichen als auch um die Zusammenstellung von Inhalten zum Thema XYZ aus den Inhalten anderer Websites.
Um ein ganz primitives Beispiel zu nennen: jemand baut eine Website zum Thema XYZ und kennt sich mit dem Thema nicht wirklich aus, bzw. er hat keine Lust, die Inhalte selber zu erstellen. Im Web sucht er nach Informationen zu diesem Thema, kommt auf eure Website, findet die Informationen toll, kopiert sie oder Teile davon und bindet diese auf seiner eigenen Website ein. Wer besonders "schlau" ist, spiegelt die komplette Domain unter einer anderen URL und versucht damit zu ranken. Besonders ärgerlich wird es dann, wenn die eigene Website tatsächlich an Rankings verliert.
Was hilft: canonical-Tag im Header jeder Seite einbauen, ggf. Scraper-Sites an Google melden und das Scraper Report-Formular ausfüllen.
Hier geht es vor allem um Onlineshops, die in mehreren Sprachen verfügbar sind. Jedoch unterscheiden sich die dort vorhandenen Inhalte, bzw. Produkte nur minimal voneinander. Eine Abhilfe wäre hier die geographische Ausrichtung der Seite über das hreflang-Attribut (rel="alternate" hreflang="x") im HTML-Header der Website. Auf diese Weise weist man Google darauf hin, dass es mehrere Sprachversionen auf der Website gibt und dass sie in der Suche auseinander gehalten werden sollen.
In diesem Fall kann es dazu kommen, dass alle Seiten eurer alten Domain im Suchmaschinen-Index verfügbar sind ebenso wie die Seiten der neuen Domain, die gleiche oder ähnliche Inhalte enthalten. Das Ergebnis: gleiche Inhalte sind im Index der Suchmaschinen unter verschiedenen URLs erreichbar. Daraus folgt: gleiche Inhalte + unterschiedliche URLs = Duplicate Content
Was hilft: 301-Weiterleitung einrichten und Adresseänderung bei Google melden
Nehmen wir als Beispiel einen Onlineshop für Handwerker. Der Shop hat hunderte Produkte und bietet dem Kunden ausführliche Informationen wie Maßangaben, Gebrauchsanleitung, Material etc. an. Dabei sind diese Informationen nicht nur in der Produktbeschreibung auf der Website zu finden sondern stehen als PDF-Version zum Download bereit. Daraus folgt, gleiche Inhalte + unterschiedliche URLs = Duplicate Content
Was hilft: Canonical-Tag im HTTP-Header der Seite (über die Konfiguration des Webservers) einbinden
Es gibt zahlreiche Tools, mit deren Hilfe man nach „Inhalt-Dieben" im Web suchen kann. Copyscape wäre eins davon. Wer keine Tools nutzen möchte, kann es direkt in der Google-Suche machen. Dafür kopiert Teile eurer Website-Inhalte und fügt diese in das Suchfeld der Suchmaschine ein. Wichtig dabei ist den eingefügten Content-Teil mit Anführungszeichen zu versehen. Dadurch gibt man Google einen Hinweis darauf, dass es genau nach diesem Textabschnitt im Web suchen soll.
Beispiel: "Laut Google werden unter Duplicate Content hauptsächlich inhaltliche Textpassagen innerhalb einer Domain oder Domain-übergreifend verstanden"
Wie vermeide ich externen doppelten Inhalt?
FAZIT
Duplicate Content bedeutet nicht immer etwas Schlimmes. Laut Matt Cutts, dem Head of Google Webspam-Team, ist Duplicate Content kein Spam, der bestraft würde. 25% bis 30% des gesamten Web-Contents ist Duplicate Content. Häufig entsteht er auf eine natürliche Art und Weise. Wenn er jedoch zur Manipulation von Rankings eingesetzt wird, reagieren Google und andere Suchmaschinen drauf. Damit es nicht passiert: