Canonical-Tags für PDF- und andere Nicht-HTML-Dateien

27. Juni 2011 | Von Markus Hövener in SEO

Ich bin die Tage schon über einen Blog-Beitrag von Google gestolpert:
Supporting rel=”canonical” HTTP Headers

Und Eric hat heute auch noch was in seinem Blog dazu geschrieben:
Links auf PDF-, PPT-, Word- und andere Dokumente per Canonical “verwalten”

Also, in aller Kürze: Canonical-Tags sind super, aber sie können eben nur ein HTML-Seiten vorkommen. Es wäre aber auch interessant, das für andere Dateitypen zu machen. So könnte eine PDF-Datei per Canonical-Tag auf die HTML-Version “linken”. Google-Besucher kämen dann bevorzugt auf die HTML-Seite und eben nicht auf das PDF.

Interessant ist das auf alle Fälle, aber eben auch mit einigem Konfigurationsaufwand verbunden, denn das Tag muss eben in den HTTP-Header eingebaut werden. Das geht natürlich über die Konfiguration des Web-Servers, ist aber eben etwas umständlich.

Für den Apache gibt es da dankenswerterweise das Modul mod_headers, das man genau dafür nutzen kann. Im folgenden Beispiel möchte ich, dass das PDF http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/corporate-blogs.pdf als Canonical-Tag auf die HTML-Seite http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml verweist.

Das geht mit den folgenden Zeilen Code, die man z. B. in der .htaccess unterbringen kann:

<Files corporate-blogs.pdf>
Header append Link “<http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml>; rel=\”canonical\””
</Files>

Statt <Files> kann man je nach Setup natürlich auch <FilesMatch> nutzen.

Im HTTP-Header wird es dann auch korrekt angezeigt:

HTTP/1.1 200 OK
Date: Mon, 27 Jun 2011 13:10:33 GMT
Server: Apache/2.2.10 (Linux/SUSE)
Last-Modified: Tue, 09 Oct 2007 08:36:17 GMT
ETag: “9a2002-7deb7-43c0b4339a240″
Accept-Ranges: bytes
Content-Length: 515767
Link: <http://www.bloofusion.de/news-artikel/standpunkt/corporate-blogs/index.shtml>; rel=”canonical”
Connection: close
Content-Type: application/pdf

…

Wenn man die Canonicals wie im obigen Fall Link für Link implementiert, hat man natürlich einiges zu tun. Besser ist es daher, wenn man hier Regeln benutzt, um aus der PDF-URL automatisch auf die dazugehörige HTML-URL zu schließen. Da zahlt es sich dann wirklich aus, wenn man seine Website immer brav strukturiert hat.

Insgesamt ist das ganze also eher für große Websites mit hunderten von PDFs, DOCs, XLSs und so weiter interessant. Da fallen wir also schon einige Kunden ein, für die das dann doch spannend sein könnte. In jedem Fall kommt es in unseren internen SEO-Best-Practice-Leitfaden.

Mehr zu diesem Thema:

SEO + PDF

Bio
Neueste Artikel

Markus Hövener

Markus Hövener ist Gründer und SEO Advocate der auf SEO und SEA spezialisierten Online-Marketing-Agentur Bloofusion. Als geschäftsführender Gesellschafter von Bloofusion Germany ist er verantwortlich für alle Aktivitäten in Deutschland, Österreich und der Schweiz. Markus Hövener ist Buchautor, Podcaster und Autor vieler Artikel und Studien rund um SEO.

Markus hat vier Kinder, spielt in seiner Freizeit gerne Klavier (vor allem Jazz) und genießt das Leben.

Neueste Artikel von Markus Hövener (alle ansehen)

Welche SEO-Konferenz ist die beste? [Search Camp 317] - 23. April 2024
SEO-Trainee-Programme: Ganz einfach SEOs ausbilden? [Search Camp 316] - 16. April 2024
SEO-Monatsrückblick März 2024: Google Updates, Search Console + mehr [Search Camp 315] - 2. April 2024
Recap zur SMX München: Die wichtigsten Take-Aways [Search Camp 314] - 19. März 2024
Sichtbarkeit und/oder Traffic gehen nach unten: Woran kann’s liegen? [Search Camp 313] - 12. März 2024

2 Kommentare zu “Canonical-Tags für PDF- und andere Nicht-HTML-Dateien”

Benjamin Löwen
August 11th, 2011 at 13:41
Super nach so einer Möglichkeit habe ich schon lange gesucht. Bislang habe ich PDFs, in der Regel, per Robots ausgeschlossen, es sei denn im PDF war ein Mehrwert.

Genial ist das man den Header auch bei anderen Dateien mitgeben kann, hiermit lässt sich sicher einiges SEOmäßig anstellen und eventuell kann man so etwas Performance für unnötiges einsparen 🙂
Knut
Juni 6th, 2012 at 08:00
Endlich geht das, dafür kenne ich auch einige Anwendungsfälle

Canonical-Tags für PDF- und andere Nicht-HTML-Dateien

Markus Hövener

Neueste Artikel von Markus Hövener (alle ansehen)

2 Kommentare zu “Canonical-Tags für PDF- und andere Nicht-HTML-Dateien”

Kommentieren