Wissen Sie, was Duplicate Content ist? Das bedeutet, dass derselbe Inhalt unter zwei verschiedenen URLs (Webadressen) zu erreichen ist. Google mag Duplicate Content nicht und straft ihn deshalb ab. Deshalb sollten Sie sicher sein, nicht ungewollt Duplicate Content zu produzieren.

Das Problem: heute leiden viele Websitebetreiber unter Duplicate Content, die gar nicht wissen, was das ist und was sie sich selbst damit antun.

Ein beliebter Fehler: Man hat sich verschiedene Domains gesichert, zum Beispiel ihre-domain.de und ihre-domain.com. Weil beide Domains denselben Content zeigen sollen, spielt man einfach auf beide die gesamten Dateien seines Webauftritts. Das gewünschte Ergebnis: Besucher beider Domains sehen denselben Inhalt.

Google sieht das etwas anders: Derselbe Inhalt ist unter zwei oder mehr Adressen erreichbar. Das ist Duplicate Content und der wird abgestraft. In der Folge wundert sich mancher, warum er nur so schlechte Positionen in den Suchergebnissen erreicht.

Duplicate Content entsteht auch im Geheimen

Auch wer bewusst gar keinen Fehler gemacht hat, kann unter Duplicate Content leiden.

Beispielsweise weil sein Content Management System (CMS) sogenannte GET-Parameter an URLs hängt. Die sehen dann z.B. so aus: ?id=7

Wenn das CMS nicht aufpasst, gibt es nun die URL www.ihre-domain.de/inhalt.htm und www.ihre-domain.de/inhalt.htm?id=7. Und manchmal sogar noch weitere, mit anderen Parametern.

Obwohl es verschiedene URLs sind, zeigen die Seiten denselben Inhalt.

Ein weiteres heimliches Problem kann entstehen, wenn eine Website sowohl über http://www.ihre-domain.de als auch über http://ihre-domain.de aufgerufen werden kann. Also einmal ohne das www davor.

Auch das kann Google als Duplicate Content betrachten, der sich dann sogar auf die ganze Website auswirkt.

Was tun gegen Duplicate Content?

Zum einen sind die richtigen Einstellungen im Content Management System wichtig.

Speziell WordPress neigt dazu, Unmengen verschiedener Archiv-Ansichten zu produzieren, die dann als Duplicate Content gewertet werden können. Tags, Kategorien, Autoren, Datums-Archive sind nur ein paar Beispiele.

Mit einem SEO-Plugin wie Yoast lässt sich einstellen, dass solche Übersichten nicht im Google Index aufgenommen werden.

Websites umleiten mit .htaccess

Eine scharfe Waffe im Kampf gegen Duplicate Content ist das Umleiten, beispielsweise um das oben erwähnte Problem mit demselben Inhalt auf zwei Domains zu lösen.

Nehmen wir an, es gibt zwei Domains, www.ihre-domain.de und www.ihre-domain.com, die beide auf denselben Inhalt verweisen sollen, ohne Duplicate Conten zu produzieren.

Dazu wird vorab definiert, welche der zwei Domains der Standard sein soll. Von der anderen Domain wird auf diese Hauptdomain umgeleitet. Und zwar so, wie Suchmaschinen es am liebsten haben: mit einem „Redirect permanent“.

In unserem Beispiel soll www.ihre-domain.de die Hauptdomain sein.

Dann legen Sie in den Document-Root der Domain, von der aus umgeleitet werden soll (in diesem Fall www.ihre-domain.com), eine Text-Datei, die unbedingt .htaccess heißen muss. Diese Datei enthält zwei Zeilen:

RewriteEngine on
RedirectPermanent / http://www.ihre-domain.de/

Das sorgt dafür, dass alle Aufrufe von www.meine-domain.com auf www.meine-domain.de umgeleitet werden. Sogar auf die passende Unterseite, falls beispielsweise alte Bookmarks genutzt werden. (Wenn Ihre Website über SSL läuft, dann schreiben Sie https statt http.)

Allerdings funktioniert diese Umleitung nur, wenn Ihre Domain auf einem Apache-Server gehostet wird (das trifft aber in den meisten Fällen zu). Außerdem muss Ihr Provider die Nutzung von .htaccess für Ihren Tarif freigeschaltet haben.

Wichtig: Die .htaccess-Datei darf ausschließlich mit „Nur-Text-Editoren“ bearbeitet werden, die keine unsichtbaren Steuerzeichen einfügen. Ein Bearbeiten mit Word führt beispielsweise ziemlich sicher zu einem Server-Fehler, Ihre Website ist dann offline, bis Sie die defekte .htaccess-Datei wieder entfernen oder korrigieren.

So gehen Sie mit alten URLs um

Ein anderes Beispiel: Sie haben eine alte Unterseite, deren URL Sie mal geändert haben – warum auch immer. Es sind noch Verlinkungen auf die alte Seite vorhanden, die Sie nicht ändern können.

Google findet dann also denselben Content unter zwei URLs: www.ihre-domain.de/alte-seite/ und www.ihre-domain.de/neue-seite/.

Für die Suchmaschine ist das Duplicate Content. Also sollten Sie die alte Seite komplett löschen.

Doch was passiert mit den Besuchern, die über die Links zur alten Seite kommen? Die leiten Sie einfach auf die neue Seite um. Mit folgender Zeile in der .htaccess:

RewriteEngine on
RedirectPermanent /alte-seite/ /neue-seite/

Damit wird die „Linkpower“ der alten Seite weitgehend auf die neue Seite übertragen. Noch besser wäre, wenn Sie die Linkgeber darum bieten würden, den Link so zu ändern, dass er auf die neue Seite zeigt.

„RewriteEngine on“ muss übrigens nur einmal in der .htaccess-Datei stehen, es muss nicht wiederholt werden.

www oder nicht www?

Mit der .htaccess kann man sich noch ein weiteres häufiges Duplicate Content Problem vom Hals schaffen. Es entsteht dadurch, dass die meisten Websites (abhängig von der Einstellung Ihres Servers) auch ohne das www davor aufgerufen werden können. Der Besucher kann also www.ihre-domain.de in den Browser eingeben oder einfach ihre-domain.de.

So weit noch nicht schlimm. Doch sobald externe Links auf beide Varianten zeigen, nimmt Google auch beide Varianten in den Index auf. Und schon haben Sie wieder ein Problem mit Duplicate Content.

Ob mit oder ohne www ist reine Geschmackssache, es hat keine Auswirkungen auf die Platzierung bei Google. Nur entscheiden müssen Sie sich, welches die „richtige“ Version sein soll.

Dann ist auch das schnell gelöst. Sie öffnen wieder die Datei .htaccess mit einem Texteditor und fügen diese drei Zeilen hinzu:

RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.ihre-domain\.de$ [NC]
RewriteRule ^(.*)$ http://www.ihre-domain.de/$1 [R=301,L]

Damit wird automatisch dafür gesorgt, dass jeder Aufruf von ihre-domain.de auf www.ihre-domain.de umgeleitet wird. Falls es nicht funktioniert, sollten Sie Ihren Hoster fragen, ob die RewriteEngine in Ihrem Tarif freigeschaltet ist.

Sie wollen andersherum umleiten, Ihre Hauptdomain soll die Variante ohne www sein? Dann nutzen Sie diese Zeilen:

RewriteEngine on
RewriteCond %{HTTP_HOST} !^ihre-domain\.de$ [NC]
RewriteRule ^(.*)$ http://ihre-domain.de/$1 [R=301,L]

Alternative: Canonical Link

Es gibt eine weitere Möglichkeit, um Suchmaschinen anzugeben, welche Variante verschiedener Dateien die richtige ist. Dazu nutzt man den Canoncial Link, der auf die Seite verweist, die genutzt werden soll.

Dieser Link gehört in den <head>-Bereich einer Seite, in dieser Form:
<link rel=“canonical“ href=“http://www.ihre-domain.de/neue-seite/“>

Ich persönlich mag den Canonical Link nicht so sehr, da er mir für die typischen Anwendungen zu intransparent ist. Zudem gibt es keine Garantie, dass die Suchmaschinen ihn überhaupt beachten.

Mein Favorit ist deshalb in den meisten Fällen die Umleitung per .htaccess-Datei.