rankingCoach Blog

SEO-Grundwissen: interner Duplicate Content

Geschrieben von Lisa | 03.10.2015 08:42:00

Interner Duplicate Content ist ein Thema, das jeden Websitebetreiber betrifft. Bei kleinen Websites ist es weniger ein Problem im Vergleich zu Onlineshops, die hunderte oder tausende von Seiten haben. 

Dennoch ist interner Duplicate Content weniger unkontrollierbar als der externe Duplicate Content. Eine gut durchdachte Strategie beim Aufziehen eines Webprojektes sowie das Wissen über das eingesetzte Content Management Systems (CMS) helfen den Webmastern dabei, viele Duplicate-Content-Fallen zu vermeiden und für einen sauberen Web-Auftritt zu sorgen. 

Was ist interner Duplicate Content? 

Unter internem Duplicate Content (interner DC) versteht man gleiche Inhalte, die unter verschiedenen URLs innerhalb einer Domain erreichbar sind. 

So entsteht interner Duplicate Content

Startseite ist unter verschiedenen URLs erreichbar

Startseiten haben oft die meisten Backlinks und gelten meist als am besten rankende Seiten in den Suchmaschinen. Häufig vergisst man aber, dass eine Startseite genauso anfällig für die Duplicate-Content-Krankheit ist wie Produktseiten. "Doppelte Startseiten" sind ein verbreitetes Phänomen, das immer dann auftritt, wenn die Startseiten unter verschiedenen URLs erreichbar sind. 

Beispiel: 

  • http://ihredomain.de 
  • http://www.ihredomain.de 
  • http://ihredomain.de/index.html 
  • http://www.ihredomain.de/startseite 

Duplicate Content durch Paginierung (Seitennummerierung) 

Damit ist die so genannte „Blättern-Funktion" bei Aufteilung längerer Texte gemeint. Bei Onlineshops ist es häufig dann der Fall, wenn eine Kategorieseite hunderte Produkte enthält, aber nur wenige Produkte pro Seite angezeigt werden. Dadurch entsteht der Bedarf nach Blättern innerhalb einer Produktkategorie. 

Das Gleiche gilt auch für Kommentare, die ab einer bestimmten Anzahl, je nach CMS, über mehrere Seiten verteilt werden. 

Gleiches Produkt in mehreren Kategorien, bzw. Tagging

Hier geht es um Seiten, die verschiedenen Kategorien zugeordnet sind. Es ist ein häufiges Problem nicht nur bei Onlineshops sondern auch bei Blogs. 

Bei Onlineshops geht es meistens darum, dass ein und dasselbe Produkt in verschiedenen Kategorien wie Marken, Neuheiten, Angebote etc. zugleich gefunden werden soll. 

Häufig ist es auch ein Problem des eingesetzten CMS. 

Beispiel: die tollen Jeans Sneakers von Armani findet man sowohl in der Kategorie /schuhe/sneakers/ als auch in /herren/schuhe/sneakers/ oder in /marken/schuhe/sneakers/ 

  • www.beispiel.ch/schuhe/sneakers/armani-jeans-sneaker 
  • www.beispiel.ch/herren/schuhe/sneakers/armani-jeans-sneaker 
  • www.beispiel.ch/marken/schuhe/sneakers/armani-jeans-sneaker 
  • www.beispiel.ch/sale/sneakers/armani-jeans-sneaker 

Bei Blogs wird ein und derselbe Artikel häufig mit verschiedenen Schlagworten (Tags) versehen und taucht dadurch mehrfach in verschiedenen Kategorien auf. 

Beispiel: ein Artikel über Duplicate Content kann sowohl mit #seo als mit #onpage getaggt werden und wird somit sowohl unter 

  • /seo/duplicate-content/ als auch unter 
  • /seo/onpage/duplicate-content/ erreichbar sein. 

Duplicate Content durch mehrere Produktversionen

Dieses Problem taucht dann auf, wenn es im Onlineshop Produkte in verschiedenen Farben, Größen etc. gibt. Produktbeschreibungen, Titel und Description unterscheiden sich minimal voneinander, jedes Produkt bekommt aber eine eigenständige URL. 

Duplicate Content durch Sortierung von Produkten

Hier geht es um Sortierungsmöglichkeiten, die es ermöglichen, Produkte im Shop nach unterschiedlichen Kriterien wie Preis, Name, Hersteller etc. zu sortieren. Dabei werden unfreiwillig neue URLs generiert, die denselben Content enthalten. Die Produktreihenfolge ändert sich, die Inhalte bleiben identisch. 

Beispiel: www.ihredomain.de/unterordner/index.html?order_by=price 

Duplicate Content durch identische oder sehr ähnliche Produktbeschreibungen

Kurze Produktbeschreibungen, gleiche Überschriften, gleiche Titel und Descriptions auf Produktseiten sind keine Qualitätssignale, die einem guten Ranking beitragen. Bei Inhalten, die auf Kategorienseiten angeteasert werden, sollte man darauf achten, wie viel einzigartiger Content auf den Produktdetail-Seiten vorhanden ist. 

Duplicate Content durch URL-Parameter und Session-IDs

Ein Phänomen, das bei eCommerce Seiten häufig auftritt. Der Grund dafür sind verschiedene URL-Parameter, die je nach Funktion ans Ende einer URL angehängt werden. 

Es können beliebige Tracking Parameter sein:

  • social tracking http://www.domain.com/page-slug?utm_source=twitter 
  • affiliate tracking 
  • Sortierungen und/oder 
  • Filterparameter http://www.domain.com/page-slug?dir=asc&order=price 

Bei Session-IDs geht es um Parameter, die zum Tracking von Nutzer eingesetzt werden. 

Duplicate Content durch interne Suchfunktion

Die interne Suchfunktion kommt dann zum Einsatz, wenn ein Nutzer nach einem Produkt mithilfe der internen Suchfunktion im Onlineshop sucht. Dabei tippt er z.B. den Namen eines Produkts in das interne Suchfeld im Onlineshop ein und bekommt eine Liste mit passenden Produkten als Ergebnis angezeigt. Solche Ergebnislisten enthalten keinen einzigartigen Content, sondern fügen Inhalte verschiedener Seiten zum Thema XY zusammen. 

Weitere häufig auftretende Duplicate-Content Fallen sind: 

  • Archive 
  • Texte in PDFs 
  • Druckansichten 

Wie ihr seht, gibt es verschiedene Gründe für internen Duplicate Content. Er (Duplicate Content) ist nicht nur dann ein Problem, wenn es um Rankings geht sondern auch wenn die Verteilung von Crawling-Ressourcen der Suchmaschinen-Bots in den Vordergrund rückt. 

Das Problem ist aber nur halb so schlimm, wenn man die Stolperfallen kennt. In unserem nächsten Beitrag zeigen wir euch, wie man internen Duplicate Content meidet, sowie was ihr tun könnt, um bereits entstandene Duplikate zu beseitigen.