Duplicate Content vermeiden: Umleitungen durch .htaccess
Veröffentlicht am 26.02.2016 von Benedikt Sahlmüller
Webseitenbetreiber möchten im Regelfall eins: Möglichst gut auf Google gefunden werden. Es gibt viele Faktoren, die ausschlaggebend sind dafür, wie gut eine Webseite gefunden wird. Einige davon kann man sogar sehr schnell beeinflussen: Beispielsweise macht es Sinn, die Webseitenperformance zu optimieren, oder man stattet den Domainnamen mit einem SSL-Zertifikat aus. Ein weitere Methode, die im nachfolgenden Text betrachtet wird, besteht darin, doppelte Inhalte – sogenannten „Duplicate Content" – zu vermeiden.Was ist Duplicate Content und warum ist er problematisch?
Einfach gesagt lesen Suchmaschinen den Inhalt einer Webseite und speichern Informationen darüber, welche Inhalte für welche Suchanfragen relevant sind.
Ziel bei der Suchmaschinenoptimierung (SEO) ist es, der Suchmaschine den Job so einfach wie möglich zu machen. Dazu zählt unter anderem, dass Sie dem Suchmaschinen-Bot eindeutige Domainnamen zu Ihren Inhalten liefern. Ist der gleiche Inhalt unter verschiedenen Domains erreichbar, bekommt die Suchmaschine keine eindeutigen Daten darüber, welche der Domains für den Inhalt relevant ist. Das Resultat – der sogenannte Duplicate Content – kann negative Auswirkungen auf den Pagerank haben oder sogar zur Abstrafung der Seite führen.
Eine Umleitung per .htaccess bauen – warum?
Die .htaccess-Datei eignet sich wunderbar für eine ganze Reihe von Dingen, zum Beispiel für Umleitungen zur Vermeidung von Duplicate Content.
Warum umleiten? Nun, wurde Ihr Webdokument mehrfach unter verschiedenen Adressen gespeichert, schwächt das in den Augen der Suchmaschine seine Relevanz. Um nun alle Zugriffe zu dem Dokument auf eine Domain zu lenken, benötigen Sie einen Nachsendeservice: Alle URL-Varianten, die bisher für den Aufruf der Seite möglich waren, werden künftig auf die eine, korrekte Adresse umgeleitet.
Der Clou dabei: Google bekommt zusätzlich die Information, dass die Adressänderung permanent ist.
Genau das macht die 301er-Umleitung: Sie meldet dem Server, wo das Suchergebnis ab sofort zu finden ist. Die neue Adresse kann von der Suchmaschine erlernt werden, sodass Ihr Inhalt künftig nur noch unter der gewünschten Domain auffindbar ist.
Nachfolgend finden Sie Fallbeispiele zur Einrichtung dieser Umleitungen.
Ursachen und Lösungen für Duplicate Content
Eine mögliche Ursache für Duplicate Content sind Webseiten, die unter ähnlichen, aber nicht gleichen Domainnamen aufrufbar sind. Wenn man Domains Zeichen für Zeichen betrachtet, sieht man schnell, was den Unterschied macht:
Beispiel 1
www.example.com
ist auch erreichbar unter
example.com
Der gleiche Inhalt ist nun mit und ohne www. erreichbar. Der Unterschied sieht zwar unscheinbar aus, aber Google könnte die Seite tatsächlich dafür abstrafen. Eine Lösung für dieses Problem bietet der folgende Code:
# Erzwinge www
RewriteEngine On
RewriteCond %{HTTP_HOST} !www\.example\.de$
RewriteRule ^(.*)$ www.example.de/$1 [L,R=301,QSA]
In der ersten Zeile des Codes wird geprüft, ob der Aufruf der Adresse mit www. erfolgt. Wurde die Domain nicht mit führendem www. eingegeben (!www\.), erfolgt die Umleitung auf www.example.de.
Beispiel 2
ist auch erreichbar unter
Die SSL Verschlüsselung – also der Aufruf der Seite über https – wird sehr empfohlen. Jedoch liegen auch hier zwei Wege vor, die Seite zu erreichen. Leiten Sie also um:
# Alle Aufrufe gehen auf SSL
RewriteEngine On
RewriteCond %{HTTPS} !on
RewriteRule (.*) %{HTTP_HOST}%{REQUEST_URI} [L,R=301]
Man muss davon ausgehen, dass die meisten Besucher einer Webseite deren Adresse ohne https eingeben. In einem solchen Fall (https !on) wird per 301-Umleitung auf die https-Version der Webadresse umgestellt.
Beispiel 3
www.example.com/hello
ist auch erreichbar unter
www.example.com/hello/
Den Unterschied könnte man beinahe übersehen: Ein Schrägstrich, der sogenannte "Trailing Slash“, folgt dem Aufruf und schon kann es sein, dass Google Ihren Beitrag doppelt indiziert. Diese Umleitung sorgt für "Trailing Slashes" an allen Domainnamen:
# Alle Domains haben trailing slashes
RewriteEngine On
RewriteCond %{REQUEST_URI} /+[^\.]+$
RewriteRule ^(.+[^/])$ %{REQUEST_URI}/ [R=301,L]
Mit dieser Regel kann der aufgerufenen Zeichenkette ein Slash-Zeichen (/) am Ende angestellt werden. Die 301-Umleitung erfolgt immer dann, wenn dem Schrägstrich am Ende der aufgerufenen Adresse noch weitere Zeichen folgen.
Um die oben genannten Weiterleitungen zu testen, übernehmen Sie diese einfach in Ihre .htaccess-Datei. Ist noch keine .htaccess-Datei vorhanden, kann sie per FTP im Stammverzeichnis des Domainnamens hinterlegt werden. Bitte ersetzen Sie den Beispiel-Domainnamen "example.com" gegen Ihren Domainnamen. Nutzen Sie ein CMS, informieren Sie sich vorher bitte, an welcher Stelle der Code eingetragen werden muss.
Tipps
[actioncard] 💡 Testen Sie die Aufrufe:
Prüfen Sie alle möglichen Optionen des Webseitenaufrufs selbst. So stellen Sie sicher, dass Ihre Webseite immer so dargestellt wird, wie Sie es möchten.
💡 Weitertesten
Browser-Plug-Ins wie „Redirect Plath“ (Chrome) helfen, den Status der Umleitung zu testen.
💡 Webmaster Tools
Viele wichtige Faktoren für das Ranking Ihrer Webseite finden Sie in den Google Webmaster Tools. Hier können Sie mitbestimmen, wie Google Ihre Webseite indexiert.
💡 Caching-Tools
Bitte beachten Sie: Durch Browser-Caching, aber auch durch Caching-Werkzeuge z.B. für WordPress, wird Ihnen Ihre Webseite möglicherweise anders dargestellt als Ihren Besuchern. Leeren Sie Ihren Cache daher, bevor Sie den Aufruf Ihrer Webseite prüfen.
💡 Zahl der Weiterleitungen eingrenzen
Zu viele aufeinanderfolgende Weiterleitungen können für den Google-Bot ein Problem darstellen. Eine Kette von Weiterleitungen sollte daher maximal 3 aneinander geknüpfte Glieder haben. Weitere Informationen hierzu, gibt es auf dem Google Webmaster-Blog.
💡 Interne Links aktualisieren
Definieren Sie auch innerhalb Ihrer Webseite die richtige Domain. Prüfen Sie dazu, dass bei allen internen Verknüpfungen (z.B. "Zurück zur Startseite") die korrekte Domain hinterlegt ist. Bei CMS, wie WordPress, muss die Blog URL angepasst werden.
💡 Kanonische URL
Nach der Umstellung auf die neue Domain sollten Sie ein sogenanntes "Canonical Tag"setzen. Das Canonical Tag liefert dem Suchmaschinenbot weitere Daten darüber, welche Adresse zukünftig die richtige für das Dokument ist. Nachfolgend ein Beispiel für ein solches Canonical Tag:
<link rel="canonical" href="https://www.example.com/"/>
Eingesetzt wird der Code in das Head-Element der Webseite.
Die oben benutzten Weiterleitungen und viele weitere .htaccess-Codes finden Sie hier:
[/actioncard]