Das Canonical Tag und seine Bedeutung für die Suchmaschinenoptimierung (SEO)
In diesem Beitrag erfahrt ihr, wie ihr das Canonical Tag einsetzt, um Duplicate Content auf eurer Website zu vermeiden.
Doppelte Inhalte (Duplicate Content) auf einer Website kann sich negativ auf das Suchmaschinen-Ranking auswirken. Der Grund dafür ist, dass Suchmaschinen wie Google identischen Inhalt auf mehreren Seiten als Betrugsversuch bewerten können und die betreffende Seite abstrafen. Der Einsatz des sog. Canonical Tag im <head>-
Element eurer Website kann das Downranking verhindern. Was es in diesem Zusammenhang zu beachten gibt, zeigen wir euch in diesem Beitrag.
Zum Hintergrund
Das Canonical Tag ist ein <link>
-Element mit rel
-Attribut, dass im <head>
-Bereich der Website eingebunden wird und auf die URL verweist, die die Hauptressource des Inhalts darstellt. Wenn dieser Canonical Link nicht gesetzt wurde, und identische Inhalte auf mehreren Seiten auftauchen, weiß die Suchmaschine nicht, welche Seite indexiert werden soll. Es kann in diesem Zusammenhang zu einer Abstrafung seitens der Suchmaschine kommen, was sich natürlich negativ auf das Suchmaschinen-Ranking eurer Website auswirkt.
Kanonische URL einer Unterseite angeben
Um das oben beschriebene Problem zu vermeiden, muss auf der Unterseite, die Duplicate Content enthält, im <head>
das Canonical Tag hinzugefügt werden. Der notwendige Befehl sieht so aus:
<link rel="canonical" href="HIER DIE URL DER QUELLE" />
Anschließend weiß die Suchmaschine, welche Seite die Hauptquelle (kanonische URL) für den Inhalt darstellt. Wichtig ist in diesem Zusammenhang die Angabe des absoluten Pfades, um sicherzugehen, dass die Originalseite auch gefunden wird.
<html>
<head>
<title>Canonical Tag</title>
…
<link rel="canonical" href="http://www.example.de/original-page.html"/>
…
</head>
…
Wie interner Duplicate Content entsteht
Im Folgenden findet ihr Beispiele, wie Duplicate Content innerhalb einer Website entstehen kann.
- Die Domain ist mit und ohne
wwww.
erreichbar:http://www.kulturbanause.de
undhttp://kulturbanause.de
- Die Domain kann über
http
undhttps
aufgerufen werden:http://kulturbanause.de
undhttps://kulturbanause.de
- Verzeichnisse können sowohl mit als auch ohne »Slash« gefunden werden:
http://kulturbanause.de/images/
undhttp://kulturbanause.de/images
- Die Unterseiten sind mit Groß- und Kleinschreibung zu erreichen:
http://kulturbanause.de/Seite.html
undhttp://kulturbanause.de/seite.html
- Eine Seite ist auch mit einer Session-ID aufrufbar, ohne dass sich der Inhalt ändert:
http://kulturbanause.de/produkte.html
undhttp://kulturbanause.de/produkte.html?session_id=xyz
- Es werden weitere Ansichten angeboten wie PDF und eine Druckversion.
Mehrere Domainnamen für eine Website
Gibt es für eine Website mehrere Domainnamen, dann handelt es sich hier um externen Duplicate Content. Dies wird mit einer 301-Weiterleitung von den einzelnen Domains zur Hauptdomain vermieden.
Anwendungsfehler von rel=canonical
Die folgenden Fehler beim Integrieren des Canonical Tag solltet ihr unbedingt vermeiden:
- Verwendet die kanonische URL nicht gleichzeitig mit dem Meta-Tag
noindex
oder mit dem Befehldisallow
in derrobots.txt.
Beide Angaben verbieten der Suchmaschine das Auslesen der Inhalte. Folglich kann die kanonische URL nicht gefunden werden. - Bei nummerierten Seiten solltet ihr keinen keinen Canonical Tag auf den Seiten 2, 3, 4 etc. setzen, um auf die 1. Seite zu verweisen. Bei einer Paginierung handelt es sich um ein und denselben Inhalt.
- Das Canonical Tag muss im
<head>
-Element der Website untergebracht werden und darf nur einmal vorkommen. Keinesfalls gehört es in den<body>
. - Die Zielseite muss tatsächlich existieren und darf keine 404-Fehlermeldung ausgeben.
Die Canonical-Tags müssen ja auf der Seite mit dem dublicate content platziert werden. Was mache ich bei einem CMS-System, dass doppelten Content erzeugt? Es gibt ja offiziell nur die eine bearbeitbare Seite. Auf der Seite habe ich vielleicht für einen Flyer nochmal eine kürzere URL erzeugt z. B. http://www.website.de/produktinfo. Die eigentliche relevante Inhaltsseite ist aber http://www.website.de/abc/loesungen/produktinfo.
Wie kann ich jetzt dem dublicate-content das Canonical-Tag geben? Ich kann es in der Pflege der Seite nicht einfügen, weil ich auch den zweiten Seitenpfad auf der Zielseite des Canonical-Tags erstellt habe.
Im Falle von WordPress könntest du auf ein Custom Field für die Canonical URL ausweichen und dann abfragen, ob dort etwas eingetragen wurde. Wenn ja, soll das Canonical Tag nicht den Permalink, sondern die im Custom Field eingetragene URL anzeigen.
hm… „bei paginierten Seiten 1,2,3 usw. keinen Canonical mit Verweis auf die erste Seite“? Aber was sollen den „nummerierte Seiten im Index von Google. Sprich 200 Seiten mit jeweils 20 Artikeln? Was mach ich mit denen? NoIndex?
Viele Grüße
Thomas
Das würde mich auch interessieren.
Es kommt natürlich immer auf den Einzelfall an. Aber bei generischen Übersichtsseiten würde ich zu
noindex, follow
tendieren.