Duplicate Content - Entstehung und Identifizierung

Duplicate Content - Entstehung und Identifizierung


In diesem Artikel erfahren Sie, wie Duplicate Content auf einer Website entstehen kann und wie Sie Duplicate Content identifizieren. Dabei wird zwischen internem und externem Duplicate Content unterschieden.

Inhalte:

 

Duplicate Content (deutsch: „doppelter Inhalt“ oder „doppelte Inhalte“) sind identische Inhalte, die auf einer Website mit unterschiedlichen URLs vorhanden sind.

Zu Duplicate Content zählen neben identischen Inhalten auch solche, die sich stark ähneln. Dies ist beispielsweise der Fall, wenn einzelne Textblöcke nur leicht verändert auf unterschiedlichen URLs zu finden sind. In Online-Shops, in denen es mitunter mehrere Varianten eines Produkts gibt, lässt sich Duplicate Content nicht immer vermeiden.

 

Entstehung von Duplicate Content.

Eine Website kann auf viele Arten Duplicate Content enthalten. In den meisten Fällen steckt hinter Duplicate Content keine böswillige Absicht der Website-Betreiber. Häufig entsteht Duplicate Content ganz einfach durch Automatismen von Content Management Systemen (CMS) bei der Generierung von URLs für neue Beiträge.

Duplicate Content 2Abbildung: Beispielhafte Darstellung von Duplicate Content. // Quelle: AKDMM

 

Beispiel zur Entstehung von Duplicate Content:

Ein neuer Beitrag wurde auf der Beispielseite https://www.beispielseite-xyz.de verfasst. Dieser ist unter folgender URL zu finden:

www.beispielseite-xyz.de/artikel-neu

Dies ist die ursprüngliche URL, wie sie bei der Erstellung der Seite ursprünglich vergeben wurde.

Das CMS der Beispielwebsite hat nach der Erstellung der Seite automatisch eine neue URL generiert, indem es die Beitragskategorie hinzugefügt hat.

www.beispielseite-xyz.de/kategorie/artikel-neu

 

Duplicate Content Originalversion und duplizierte Inhalte

Abbildung: Darstellung der Entstehung von Duplicate Content durch Hinzufügen der Beitragskategorie. // Quelle: AKDMM

 

Hierdurch ist neben der ursprünglichen Seite mit der ursprünglichen URL eine neue Seite mit identischem Inhalt entstanden, die nun unter einer anderen URL erreichbar ist.

Auf diese Weise ist Duplicate Content entstanden. Auf der Website sind also identische Inhalte unter verschiedenen URLs erreichbar:

www.beispielseite-xyz.de/artikel-neu

www.beispielseite-xyz.de/kategorie/artikel-neu

 

Weitere Beispiele zur Entstehung von Duplicate Content.

Gerade beim Arbeiten mit einem CMS gibt es eine Reihe von Faktoren, die Duplicate Content verursachen können. Zusätzlich zum vorangegangenen Beispiel können auch folgende beispielhafte Ursachen zu Duplicate Content führen:

  • Erreichbarkeit mit und ohne www
    Eine Website ist mit www vor dem Domainnamen und ohne www Beispiel: www.beispielseite-xyz.de (mit www) und beispielseite-xyz.de (ohne www).
  • Aufrufbar mit http und https
    Gleiches gilt für parallel aufrufbare Versionen einer Website mit http und https. In diesem Fall wäre die Beispielseite unter http://beispielseite-xyz.de und https://beispielseite-xyz.de aufrufbar.
  • Print-Versionen einzelner Seiten
    Wird auf einer Website eine Funktion zum Ausdrucken betrachteter Inhalte angeboten, können generierte Druckversionen einer Seite zur Verdopplung von Inhalten führen.

 

Arten von Duplicate Content

Es lassen sich im Allgemeinen zwei verschiedene Arten von Duplicate Content unterscheiden:

  • Interner Duplicate Content
  • Externer Duplicate Content

 

Interner Duplicate Content

Interner Duplicate Content ist doppelter Inhalt innerhalb einer Website. Insbesondere beim Einsatz von CMS kann es häufig zu solchen doppelten Inhalten kommen.

 

Ursachen für internen Duplicate Content

Zu den häufigsten Ursachen für das Entstehen von Duplicate Content beim Einsatz eines CMS können Automatismen bei der Generierung von URLs gehören. Dies kann z.B. bei der Erstellung neuer Seiten, bei der Bearbeitung bestehender Seiten oder bei der Nutzung bestimmter Funktionen geschehen.

 

Die folgenden Faktoren können die Ursachen für das Entstehen von internem Duplicate Content sein:

  • Erreichbarkeit mit und ohne www
    Eine Website ist mit www vor dem Domainnamen und ohne www Beispiel: www.beispielseite-xyz.de (mit www) und beispielseite-xyz.de (ohne www).
  • Aufrufbar mit http und https
    Gleiches gilt für parallel aufrufbare Versionen einer Website mit http und https. In diesem Fall wäre die Beispielseite unter http://beispielseite-xyz.de und https://beispielseite-xyz.de aufrufbar.
  • Print-Versionen einzelner Seiten
    Wird auf einer Website eine Funktion zum Ausdrucken betrachteter Inhalte angeboten, können generierte Druckversionen einer Seite zur Verdopplung von Inhalten führen.
  • Auflistung interner Suchergebnisse
    Verfügt eine Website über eine interne Inhalts- oder Produktsuche, kann es vorkommen, dass interne Suchergebnisse vom CMS durch Hinzunahme bestimmter Parameter mit veränderter URL-Struktur aufgerufen werden.
  • Seiten-Nummerierungen
    Duplizierte Inhalte können bei Beiträgen auftreten, wenn sie vom CMS durch Paginierung (Seiten-Nummerierungen) getrennt werden. Das kann beispielsweise dann entstehen, wenn größere Beiträge in mehreren Seiten aufgeteilt sind (Teil 1, Teil 2, Teil 3, etc.).
  • Verwendung mehrerer Kategorien, Tags und Filter
    Wird ein Beitrag mehreren Kategorien, Tags oder Filtern zugeordnet, kann es dazu kommen, dass je nach Einsatz mehrere URLs für ein und denselben Beitrag vom CMS generiert werden. Das kann beispielsweise auch bei Produktseiten der Fall sein.
  • Ähnliche Produktbeschreibungen bei Online-Shops
    Produkte, die sich manchmal über einzelne Produktspezifikationen wie beispielsweise Größe, Farbe oder andere Merkmale voneinander unterscheiden, können zu duplizierten Inhalten führen. In derartigen Fällen werden Produkte vom System mit unterschiedlichen URLs abrufbar, wenn der ursprünglichen URL zusätzliche Parameter einzelner Produktspezifikationen hinzugefügt werden.

 

Innerhalb einer Seite auftretender Duplicate Content kann sich - je nachdem, wie stark er ausgeprägt ist - negativ auf das Ranking einer Website auswirken. Er wirkt sich zumindest negativ auf das Crawling-Budget aus.

Bei Suchmaschinen-Crawlern, die nur begrenzte Kapazitäten für die Analyse einer Website zur Verfügung haben, kann Duplicate Content den Crawling-Prozess behindern. Crawling-Potenziale werden dadurch nicht ausgeschöpft.

 

Externer Duplicate Content

Der externe Duplicate Content entsteht durch Einflüsse von außen, die außerhalb der eigenen Website liegen. Die doppelten Inhalte sind dann auf verschiedenen Domains abrufbar. Während Duplicate Content, der intern, also innerhalb einer Seite entsteht, weniger Schaden anrichten kann, kann sich externer Duplicate Content wesentlich stärker auf das Ranking einer Website auswirken.

 

Ursachen für externen Duplicate Content

Die Bereitstellung von eigenen Inhalten auf externen Websites stellt eine häufige Ursache für die Entstehung von externem Duplicate Content dar. Dies geschieht beispielsweise dann, wenn eigene Inhalte zu Kommunikations- und Marketingzwecken bewusst per Copy & Paste auf anderen Portalen platziert werden.

Externer Duplicate Content kann aber auch durch manipulative Absichten anderer Websites entstehen.

Als Ursachen für externen Duplicate Content kommen folgende Faktoren in Frage

  • Diebstahl von Inhalten
    Von Contentdiebstahl spricht man, wenn Inhalte der eigenen Website von anderen Website-Betreibern per Copy & Paste übernommen werden. In solchen Fällen kann es zu enormen Auswirkungen auf das Ranking kommen, wenn die Suchmaschine den Originalinhalt bzw. die Herkunft nicht eindeutig identifizieren kann. Derartige Taktiken sind zudem strafbar. Außerdem können auch gestohlene Inhalte, die nur geringfügig verändert wurden, den gleichen Effekt haben.
  • Identische Produktbeschreibungen in externen Online-Shops
    Im Bereich des E-Commerce kann es sehr häufig zu externem Duplicate Content kommen, wenn z.B. die Produktbeschreibungen des eigenen Online-Shops auch anderen Verkäufern in anderen Online-Shops zur Verfügung gestellt werden. In diesem Fall werden identische Inhalte (Produktbeschreibungen) in verschiedenen Online-Shops verwendet.
  • Verbreitung eigener Inhalte auf externen Portalen
    Die Entstehung von externem Duplicate Content ist auch dann möglich, wenn die eigenen Inhalte externen Portalen zur Verfügung gestellt werden. Ein Beispiel hierfür ist die unveränderte Bereitstellung einer Unternehmensbeschreibung für Presseportale.

 

Identifizierung von Duplicate Content

Es gibt verschiedene Möglichkeiten, Duplicate Content zu identifizieren. Je nach Art des zu analysierenden Duplicate Content eignen sich unterschiedliche Tools und Vorgehensweisen.

 

Identifizierung von internem Duplicate Content

Für die Ermittlung von internem Duplicate Content kann auf externe Online-Tools zurückgegriffen werden, die nach Eingabe der URL eine Gesamtanalyse durchführen.

 

Beispiel-Tool: Siteliner

"Siteliner" bietet ein beispielhaftes Online-Tool zur Identifizierung von internem Duplicate Content.

tool siteliner screenshot

Abbildung: Screenshot des Online-Tools Siteliner.com, um internen Duplicate Content zu identifizieren. // Quelle: Screenshot Siteliner.com (abgerufen am 30.01.2023)

 

Das Tool von Siteliner ist unter dem unten stehenden Link zu finden:

https://www.siteliner.com

Nach der Analyse einer Domain liefert Siteliner unter anderem Informationen über Duplicate Content, Similar Content, Unique Content und Broken Links.

Abgesehen von Siteliner gibt es noch eine Vielzahl weiterer Tools, die zum Zweck der Identifizierung von internem Duplicate Content eingesetzt werden können. Siteliner soll hier nur als Beispiel dienen. Die anderen Tools können ebenfalls kostenlos sein oder sind als Bestandteil größerer All-in-One-SEO-Tools als teilweise kostenpflichtige Komplettpakete erhältlich.

 

Identifizierung von externem Duplicate Content

Auch für die Identifizierung von externem Duplicate Content gibt es eine Reihe von Tools, die für diesen Zweck in Frage kommen. Auch hier gibt es kostenfreie und kostenpflichtige Tools.

 

Beispiel-Tool: Copyscape

Ein Beispiel für ein solches Tool wird von Copyscape.com zur Verfügung gestellt.

 

tool copyscape screenshot
 

Abbildung: Screenshot des Tools Copyscape.com, das externen Duplicate Content und Plagiate identifiziert. // Quelle: Screenshot Copyscape.com (abgerufen am 30.01.2023)

 

Mit Copyscape können Sie Plagiate und kopierte Inhalte auf Ihrer Website identifizieren. Sie können das Tool beispielsweise auch einsetzen, wenn Sie Inhalte von externen Quellen eingekauft haben und diese auf möglichen Contentklau überprüfen möchten.

Es gibt neben Copyscape noch weitere Tools, die zur Identifizierung von externem Duplicate Content eingesetzt werden können. Copyscape dient hier nur als Beispiel. Auch andere Tools können kostenlos sein oder sind als Bestandteil größerer All-in-One-SEO-Tools als teilweise kostenpflichtige Komplettpakete erhältlich.

 

Google-Suche zur Identifizierung von externem Duplicate Content.

Die Google-Suche kann auch bei der Suche nach Duplicate Content und Plagiaten behilflich sein. Um beispielsweise zu prüfen, ob Inhalte der eigenen Website unrechtmäßig von anderen Websites übernommen wurden, kann in Google wie folgt vorgegangen werden:

  1. Markieren und kopieren Sie einen zu überprüfenden Textblock Ihrer Website. Dabei ist zu beachten, dass maximal 32 Wörter in die Google-Suche eingegeben werden können.
  2. Fügen Sie den Textblock, den Sie kopiert haben, in die Google-Suche ein.
  3. Setzen Sie vor und nach dem eingegebenen Textblock ein Ausrufezeichen („Beispiel“). So sucht Google genau nach dem eingegebenen Textblock.
  4. Wenn bei der Suche nur die Website, von der ein eingegebener Textblock stammt, als einziges Suchergebnis angezeigt wird, können im Index keine Kopien oder Plagiate dieses Textblocks gefunden werden.

 

Duplicate Content und sein Einfluss auf das Ranking

Das Ziel von Suchmaschinen ist es, die bestmöglichen Suchergebnisse für die Suchanfragen der Nutzer zu liefern. In der Regel werden die Seiten einer Website von den Crawlern der Suchmaschinen analysiert und in den Index aufgenommen. Treffen die Crawler jedoch auf eine Website, die über Duplicate Content verfügt, kann der Indexierungsprozess gestört werden. In diesem Fall stellt sich die Frage, welche der gefundenen identischen Inhalte für die Indexierung und das Suchmaschinenranking berücksichtigt werden sollen.

Es kann also nicht eindeutig entschieden werden, welche der identischen Seiten als Suchergebnis die höchste Priorität und Relevanz erhält. Umgekehrt würde sich die Frage der Relevanz bei einer Seite, die nur einmal existiert, nicht stellen. Wenn Duplicate Content auf einer Website zunimmt, kann sich dies negativ auf das Ranking in Suchmaschinen auswirken. Dies gilt insbesondere dann, wenn die Absicht besteht, das Keyword-Ranking zu manipulieren.

 

Autor dieses Beitrags:

Christos Blogavatar

Christos Farakos ist seit über 15 Jahren im digitalen Marketing führender Unternehmen tätig. In seinen letzten beruflichen Stationen war er als "Head of Marketing DACH" eines Geschäftsbereichs eines internationalen Konzerns und als "Leiter Marketing" im öffentlichen Dienst tätig. Davor arbeitete er viele Jahre in den Bereichen SEO, SEA und Performance Marketing für ein international agierendes und weltweit führendes Unternehmen sowie für eine Digital Marketing Agentur eines der größten Agenturnetzwerke der Welt.

Christos Farakos ist leitender Dozent im AKDMM-Zertifikatslehrgang "SEO und Content Optimierung".


SEO und Content Optimierung // 8-wöchiger Online-Zertifikatslehrgang

Nächster Kursbeginn am 04.03.2024

header akdmm seoco 350300px

» Mehr über diesen Lehrgang erfahren

 

Diese Beiträge könnten Sie auch interessieren: