SEO: Duplicate Content vermeiden trotz SSL-Proxy

Ein Standardmassnahme zur Vermeidung von Duplicate Content ist ein einfacher mod_rewrite Eintrag in die .htaccess-Datei des Webservers, der dafür sorgt, dass alle Anfragen, die nicht zu einer bestimmten URL gehören, per 301-Umleitung auf die Standard-URL umgeleitet werden. Dies führt aber bei bestimmten SSL-Anwendungen zu Problemen.

 

Im Normalfall ist das eine gute und einfache Mehtode, um eben nur den Zugriff über eine Domain auf die Inhalte zuzulassen. Der Eintrag für die .htaccess-Datei wäre somit

RewriteCond %{HTTP_HOST} !^www\.interaktiv\.net$ [NC]
RewriteRule ^(.*)$ http://www.interaktiv.de/$1 [L,R=301]

Ein Problem entsteht nun, wenn für den Shop eine SSL-Lösung verwendet wird, die nicht den gleichen Hostnamen, wie die Standard-URL, hat. Hier gibt es nun 2 mögliche Fälle:

 

1. SSL-Zerfitikat mit abweichenden Hostnamen

Oft wird bei der Beantragung des SSL-Zerfikates das „www“ weggelassen, was dazu führt, dass die 301-Umleitung oben ausgeführt wird, sobald im Shop eine Seite über SSL angesprochen wird. Dies führt dazu, dass das SSL-Zertifkat nie angesprochen werden kann.

In dem Fall gibt es folgende Lösung:

RewriteCond %{HTTPS}        off
RewriteCond %{HTTP_HOST} !^www\.interaktiv\.net$ [NC]
RewriteRule ^(.*)$ http://www.interaktiv.de/$1 [L,R=301]

Die neue Zeile sorgt dafür, dass die generelle 301-Umleitung auf die Hauptdomain nur angewendet wird, wenn SSL nicht aktiv ist. Das Problem, das daraus entsteht ist, dass nun die Seite über die SSL-Adresse gespidert werden könnte – um auch dieses zu verhindern, ist folgende Erweiterung der .htaccess-Datei  notwendig:

RewriteCond %{HTTPS}        on
RewriteRule ^robots.txt$     /robotssl.txt [L]

Inhalt „robotssl.txt“:

User-agent: *
Disallow: /

Dieser Eintrag führt dazu, dass im Falle von aktivem SSL nicht die Standard robots.txt-Datei verwendet wird, sondern die „robotssl.txt“ ausgeliefert wird, welche die Indexierung komplett verhindert. Somit erhält man das gewünschte Ergebnis, SSL kann verwendet werden und es wird kein Duplicate Content durch unterschiedliche Domainaufrufe produziert.

 

2. Verwendung einer SSL-Proxy-Lösung

Fast alle grossen Provider bieten heute die Nutzung einer SSL-Proxy-Lösung an. Damit kann man über eine spezielle Domain auf seine Inhalte per SSL zugreifen, ohne ein eigenes SSL-Zerfikat einsetzen zu müssen – über die Sinnhaftigkeit einer solchen Lösung, soll an dieser Stelle nicht weiter eingegangen werden.

Der Aufruf erfolgt dann z.B. bei DomainFactory grundsätzlich in der Form https://sslsites.de/meinedomain.de/ – was im ersten Schritt zum gleichen Problem, wie das abweichende SSL-Zertifikat führt. Der Unterschied in dem Fall ist aber leider, dass die RewriteCond-Abfrage für aktives SSL hier nicht funktioniert, weil die Seite im Hintergrund ohne SSL abgerufen wird. Das Problem lässt sich nur umgehen, wenn man prüft von welchen IP-Adresse die Abfrage kommt, d.h. in dem Fall die IP-Adresse des SSL-Proxy-Servers des jeweiligen Providers.

Der Eintrag wäre wie folgt zu ergänzen:

RewriteCond %{REMOTE_ADDR} !^xxx\.xxx\.xxx
RewriteCond %{HTTP_HOST} !^www\.interaktiv\.net$ [NC]
RewriteRule ^(.*)$ http://www.interaktiv.de/$1 [L,R=301]

die IP-Range sollte beim Provider erfragt werden. Da sich die IP-Adressen natürlich auch ändern können, muss das regelmässig kontrolliert werden, da sonst die Lösung nicht mehr funktioniert.

 

Sollten Sie Fragen oder Hilfe bei der Umsetzung brauchen, können Sie sich jederzeit an uns wenden.