BEE Digital Growth Blog | BEE

Duplicate Content vermeiden [Best Practice] | BEE

Geschrieben von Adrian Siuda | 10 Mai 2017

Nicht selten begegnet man beim Surfen durchs Netz auf mehreren Webseiten dem exakt gleichen Text. In diesen Fällen handelt es sich meist um sogenannten Duplicate Content. Manche Schätzungen gehen davon aus, dass bis zu 29 Prozent des Internets aus Duplicate Content bestehen. Im Folgenden wird der Frage nachgegangen, was Duplicate Content genau ist und wie mit diesem umgegangen werden sollte.

Was ist Duplicate Content genau?

Als Duplicate Content versteht man im digitalen Kontext die Darstellung von gleichem oder auffällig ähnlichem Inhalt auf verschiedenen Webseiten/URLs. Dabei kann es sich sowohl um Seiten der gleichen wie auch von anderen Domains handeln. Im Allgemeinen kann dem Webmaster oder Inhaltsverantwortlichen der betreffenden Webseite dabei keine Täuschungsabsicht unterstellt werden. So führen beispielsweise Druckversionen von Webseiten naturgemäss zu einer Verdopplung von bereits vorhandenem Content auf der gleichen Domain. Nicht selten versuchen jedoch Betreiber von Webseiten, mit Duplicate Content das Ranking bei Suchmaschinen zu pushen und so mehr Zugriffe zu erlangen. Aus diesem Grund haben sich Google und andere Suchmaschinenbetreiber dazu entschieden, nur die nach ihrer Ansicht relevantere Version einer Webseite anzuzeigen und bei vermuteter Täuschungsabsicht sogar Webseiten abzustrafen.

Duplicate Content kann sich im Internet in verschiedenen Formen zeigen

  1. Einer URL werden GET-Parameter in unterschiedlichen Reihenfolgen angehängt. Beispiel: "www.example.com/index.php?a=1&b=2" und "www.example.com/index.php?b=2&a=1"
  2. Wenn eine Webseite und somit jede ihrer Unterseiten sowohl mit der www-Subdomain (http://www.example.com/) wie auch ohne diese (http://example.com/) empfangbar ist.
  3. Kopierte Inhalte: Nicht selten teilen sich mehrere Seiten den gleichen Text, wie das beispielsweise bei Produktbeschreibungen in Online-Shops vorkommen kann.

Wieso ist dies ein wichtiges Thema für dich?

Sobald Google feststellt, dass Content auf mehreren Seiten in gleicher oder ähnlicher Form vorkommt, muss es sich entscheiden, welche dieser Seiten es in seinen Suchindex aufnehmen und ranken will. Meist wird die Seite ausgewählt, welche Google für am relevantesten erachtet. Ausserdem muss festgelegt werden, ob die Autorität, die sich ein Inhalt über eingehende Links aufgebaut hat, auf eine oder mehrere Seiten verteilt werden soll. Wird von allen Seiten mit Duplikaten nur eine angezeigt, wirkt sich dies negativ auf das Ranking und somit den Traffic einer Website aus. Verlinken zudem externe Webseiten auf mehrere Duplikate, müssen sich diese Seiten die Link-Autorität teilen, was sich zusätzlich negativ aufs Ranking auswirkt. Aus diesen Gründen ist eine gute Duplicate Content Strategie für Webseitenbetreiber essentiell wichtig.

Nicht zuletzt sollte bedacht werden, dass eine übertrieben wiederholte Verwendung von Content der Inbound Marketing Philosophie widerspricht - und sie macht nur in seltenen Fällen Sinn. Versuche deshalb, auf jeder deiner Seiten einzigartigen, nützlichen und an der Zielgruppe ausgerichteten Content bereitzustellen.

Wie gehst du am besten mit Duplicate Content um?

Google geht mittlerweile sehr geschickt mit Duplicate Content um. Trotzdem ist das Ergebnis nicht immer optimal. Beispielsweise kann es dazu kommen, dass eine weniger relevante Seite als ursprünglich intendiert in den Suchergebnissen angezeigt wird. Deshalb empfiehlt es sich, das Handling von Duplikaten selbst in die Hand zu nehmen. Durch folgende Tipps kannst du verhindern, dass unterschiedliche URLs auf gleiche Inhalte verweisen und angeben, welche Seite die Originalinhalte beherbergt. Dabei sollte beachtet werden, dass sich diese Tipps nur auf Google und seine Tools beziehen.

Weiterleitungen
(301-)Weiterleitungen machen es möglich, eine bestimmte URL auf eine andere URL weiterzuleiten.

Canonical Link
Muss die direkte Erreichbarkeit eines Inhalts über verschiedene URLs garantiert werden (wie beispielsweise bei der Druckversion einer Webseite), wird meist der sogenannte Canonical Link verwendet. Dieser gibt dem Autor einer Webseite mit duplizierten Inhalten die Möglichkeit, im Quellcode auf die entsprechende Seite mit den Originalinhalten zu verweisen. Ausserdem kann ein selbstreferenzierender Canonical Link auf der Seite mit den Originalinhalten verwendet werden, um Content Scraper (automatische Inhaltssammler) einen Strich durch die Rechnung zu machen.

Verschiedene Domains für landesspezifischen Content
Landesspezifischer Content sollte wenn möglich durch verschiedene Domains oberster Ebene unterschieden werden.

Noindex-follow-Meta-Tag
Eigene Inhalte, die auf verschiedenen Websites unterschiedlicher Anbieter syndiziert werden, sollten mit einem noindex-follow-Meta-Tag markiert werden, damit diese nicht in den Suchresultaten auftauchen. Ausserdem sollte jeweils auf die Seite mit den Originalinhalten verlinkt werden. „follow“ macht das Crawlen von Duplicate Content möglich.

Indexierung selber in die Hand nehmen
Mit der Search Console von Google können Seitenbetreiber bequem einstellen, welche Domains/Seiten von Google indexiert werden sollen. So kann beispielsweise die bevorzugte Domain angegeben und auch die Crawling-Frequenz einer Webseite mit umfangreichen Duplicate Content eingestellt werden.

Parameterbehandlung
Mit Google’s Tool "Parameterbehandlung" in der Search Console können Seitenbetreiber festlegen, wie Google mit URL-Parametern umgehen soll.

Verweise
Allgemein sollte die Verwendung wiederkehrender Textbausteine möglichst minimiert werden. Wenn beispielsweise auf jeder Seite immer wieder ein bestimmter Inhalt wie Urheberrechtshinweise Erwähnung finden soll, genügt es, jeweils nur eine kurze Zusammenfassung und einen Link zum umfangreichen Text zu platzieren.

Vermeidung von Platzhalterseiten
Platzhalterseiten (Seite mit Platzhalter-Inhalten, für die noch kein richtiger Inhalt besteht) sollten möglichst vermieden werden. Sollen diese dennoch veröffentlicht werden, empfiehlt sich die Verwendung des noindex-Meta-Tags.

CMS-Analyse
Eine Analyse des verwendeten Content-Management-Systems offenbart, ob seine Architektur zu Duplicate Content führt.

Zusammenfassungen
Für den Fall, dass sich der Content vieler Seiten innerhalb einer Domain sehr ähnelt, empfiehlt es sich, entweder den Content der einzelnen Seiten auszubauen oder alle Seiten unter einer einzigen zusammenzufassen.

Nicht empfohlen: Suchmaschinen-Crawler blockieren
Eine Blockade des Zugriffs von Suchmaschinen-Crawlern zu einzelnen Seiten mit Duplicate Content mittels einem Eintrag in der robots.txt-Datei oder ähnlicher Methoden wird nicht empfohlen.

Immer mit der gleichen URL verlinken
Allgemein sollte im Rahmen einer Webseite immer mit dem gleichen Link auf eine andere interne Seite verwiesen werden. Wenn möglich sollten dabei URL-Parameter und alternative Versionen von Seiten vermieden werden. Deren Aufgaben können auch problemlos von Skripts übernommen werden.

Fazit

Handle beim Content auch mal nach dem Motto “Weniger ist mehr”. Wenn deine Inhalte auf mehreren Seiten/unter mehreren URLs gezeigt werden sollen, halte dich an die oben genannten Empfehlungen.

BEE INFOS

Sammle weitere Informationen über SEO & Content Marketing auf unserer Homepage

WEITERE INFOS

Sammle weiterführende Informationen

Du möchtest ohne Umwege zum Content Marketing Erfolg?

Dann fange jetzt mit deinem individueller BEE.CONTENTPLAN an. Erfahre, wie BEE Inbound dir bei der Kreation deines Contents helfen kann.