Ich bin die Tage schon über einen Blog-Beitrag von Google gestolpert:
Supporting rel=”canonical” HTTP Headers
Und Eric hat heute auch noch was in seinem Blog dazu geschrieben:
Links auf PDF-, PPT-, Word- und andere Dokumente per Canonical “verwalten”
Also, in aller Kürze: Canonical-Tags sind super, aber sie können eben nur ein HTML-Seiten vorkommen. Es wäre aber auch interessant, das für andere Dateitypen zu machen. So könnte eine PDF-Datei per Canonical-Tag auf die HTML-Version “linken”. Google-Besucher kämen dann bevorzugt auf die HTML-Seite und eben nicht auf das PDF.
Interessant ist das auf alle Fälle, aber eben auch mit einigem Konfigurationsaufwand verbunden, denn das Tag muss eben in den HTTP-Header eingebaut werden. Das geht natürlich über die Konfiguration des Web-Servers, ist aber eben etwas umständlich.
Für den Apache gibt es da dankenswerterweise das Modul mod_headers, das man genau dafür nutzen kann. Im folgenden Beispiel möchte ich, dass das PDF http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/corporate-blogs.pdf als Canonical-Tag auf die HTML-Seite http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml verweist.
Das geht mit den folgenden Zeilen Code, die man z. B. in der .htaccess unterbringen kann:
<Files corporate-blogs.pdf>
Header append Link “<http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml>; rel=\”canonical\””
</Files>
Statt <Files> kann man je nach Setup natürlich auch <FilesMatch> nutzen.
Im HTTP-Header wird es dann auch korrekt angezeigt:
HTTP/1.1 200 OK
Date: Mon, 27 Jun 2011 13:10:33 GMT
Server: Apache/2.2.10 (Linux/SUSE)
Last-Modified: Tue, 09 Oct 2007 08:36:17 GMT
ETag: “9a2002-7deb7-43c0b4339a240″
Accept-Ranges: bytes
Content-Length: 515767
Link: <http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml>; rel=”canonical”
Connection: close
Content-Type: application/pdf
…
Wenn man die Canonicals wie im obigen Fall Link für Link implementiert, hat man natürlich einiges zu tun. Besser ist es daher, wenn man hier Regeln benutzt, um aus der PDF-URL automatisch auf die dazugehörige HTML-URL zu schließen. Da zahlt es sich dann wirklich aus, wenn man seine Website immer brav strukturiert hat.
Insgesamt ist das ganze also eher für große Websites mit hunderten von PDFs, DOCs, XLSs und so weiter interessant. Da fallen wir also schon einige Kunden ein, für die das dann doch spannend sein könnte. In jedem Fall kommt es in unseren internen SEO-Best-Practice-Leitfaden.