Semantische Link-Erkennung: Ein paar Gedanken zur Linkanalyse (wie es sein könnte)

12. Mai 2011 | Von in SEO

Google sagt öfter, dass man dank semantischer Technologie in der Lage sei, wertvolle von wertlosen Links zu trennen. Da ich selber mal in grauer Vorzeit Suchmaschinen entwickelt habe, frage ich mich bei solchen Äußerungen natürlich immer, wie ich so etwas selber implementieren würde – in der Hoffnung, dass Google sich ähnliche Gedanken macht.

Man darf natürlich niemals vergessen, dass alle Methoden, die man sich so ausdenken kann, auch effizient berechnet werden können müssen. Denn grundsätzlich wird Google nicht mehr in der Lage sein, sich jeden Link Stück für Stück anzuschauen und nach zig Kriterien zu bewerten. Da müssen schon Heuristiken zum Einsatz kommen.

Im Folgenden stelle ich eine Idee vor, die ich für sinnvoll halte und von der ich glaube, dass sie so oder so ähnlich auch zum Einsatz kommen könnte – und sollte.

Themenwolken

In den Google Webmaster Tools zeigt Google mir ja eine Liste der Suchbegriffe und Suchbegriffsvariationen an, um die es in meiner Website geht. So sieht das dann beim suchradar aus:

Bild

Das macht so natürlich inhaltlich Sinn. “Google”, “seo”, “sem” und so weiter sind sicherlich Kernthemen der Website.

Wenn man nun davon ausgeht, dass Google für jede Website eine solche Themenwolke hat, könnte Google ja überprüfen, wie sich meine Themenwolken verhält im Vergleich zu

  1. den Themenwolken aller eingehenden Links
  2. den Themenwolken aller ausgehenden Links

Bild

Themenfaktoren

Beim suchradar müsste es hier große Überschneidungen geben. Die eingehenden Links werden wohl alle etwas mit SEO/SEM zu tun haben; die ausgehenden Links auch zum großen Teil.

Google könnte nun hieraus zweierlei ermitteln:

  1. Einen Faktor (“Thematic Match”), der besagt, wie gut meine Themenwolke zu den ein- und ausgehenden Themenwolken passt. So ein Faktor läge z. B. bei 0.0, wenn Hinz und Kunz auf mich verlinken, meine Website alle möglichen Themen behandelt und meine Website auch auf Hinz und Kunz verlinkt. Beim suchradar läge der wahrscheinlich eher nahe bei 1.0, weil es eben große Überschneidungen gibt.
  2. Eine Themenwolke (“Thematic Cloud”), die angibt, für welche Themen ich besonders authoritär bin.

Einsatz der Faktoren

Wenn Google nun einen einzelnen Link beurteilen muss, kann es zunächst den Thematic Match nutzen, um den Link entsprechend zu bewerten. Es werden natürlich andere Faktoren in die Gleichung einfließen. Wenn man sich die klassische PR-Gleichung hernimmt, wären das dann Faktoren wie die Link-Popularität der verlinkenden Seite und die Anzahl der ausgehenden Links. Hier könnte dann der Thematic Match als zusätzliches Signal einfließen, so dass Links von thematisch kohärenten Sites besonders hoch bewertet würden.

Das würde im Übrigen auch das Problem der allgemeinen Verzeichnisse und Social-Bookmarking-Sites lösen, weil diese ja einen Thematic Match von ~0.0 hätten. Diese Links würden also noch ein klein bisschen in die Gleichung einfließen, aber keinen großen Einfluss haben.

Wichtig ist natürlich, dass Thematic Match nur ein Faktor ist. Ein Link von SPON wird ja immer gerne als Ritterschlag unter den Links angesehen, obwohl man SPON sicherlich einen niedrigen Thematic Match zuordnen würde. Hier würden dann aber andere Faktoren wie Domain Popularity und Authority reinspielen und dem Link so wieder einen hohen Wert geben.

Die Thematic Cloud könnte zudem auch noch genutzt werden, um einzelne Links doch noch zu bewerten. Denn ein Link, der nicht zur Thematic Cloud passt, könnte dann trotzdem noch abgewertet werden. Beispiel: suchradar mit hohem Thematic Match verlinkt auf einen Musik-Online-Shop (wie in einigen Artikeln passiert). Dieser Link ist dann thematisch unpassend, könnte auch schnell algorithmisch als unpassend erkannt werden.

Konsequenzen

Aus Sicht einer Suchmaschine sollte ein solches Vorgehen Sinn ergeben. Wenn z. B. ein Anbieter von Reitsportartikeln Links von anderen Reitsport-Websites bekommt, die jeweils einen hohen Thematic Match haben, wäre das alles leicht zu erkennen.

Google (und andere Suchmaschinen) müssen ja gegen unpassende Links vorgehen – vor allem gegen gekaufte. Wenn man sich also auf einer PS3-Website einen Link auf einen Fertighaus-Anbieter kauft, muss Google diesen effizient abwerten können, auch wenn der Ankertext “Fertighaus” lautet. Über ein solches Modell könnte das effizient geschehen.

Google könnte so auch viele der Satelliten-Blogs entwerten. Hier geht es ja darum, dass schnell mehrere Blogs aufgebaut werden (z. B. pferdesportaktuell.blogspot.com), die manchmal mit sehr “billigen” Links versehen werden (also z. B. über Social-Bookmarking-Sites). Wenn Google allerdings die eingehenden Links nach Themenwolken bewertet, wäre klar, dass derartige Links von Allerwelt-Sites keinen Wert mehr hätten und dass der Satellit auch keinen Wert mehr hätte.

Wenn man also an dieses Modell glaubt, muss man hier etwas umdenken und nicht nur für Link-Popularität sorgen, sondern sich wirklich gut innerhalb der Thematik (eingehend wie ausgehend) verlinken.

Auch müssten Links insgesamt umfassender bewertet werden (von Tools wie Linkscape oder Majestic SEO). Die derzeitigen Metriken sind ja allesamt zahlenbasiert und basieren auf Modellen, bei denen die Thematik eines Link nicht betrachtet wird. Hier bräuchte man eine explizite Bewertung der Thematik, mit der Möglichkeit, sowohl den Thematic Match als auch die Thematic Cloud einzusehen.

Und das Modell gibt Social Media weiteren Auftrieb, weil es eben auch impliziert, dass man Links von “echten” Blogs und Portalen bekommen und Links nicht einfach nur nach Link-Popularität zusammenkaufen sollte. Wir haben es z. B. mit einer Social-Media-Aktion in der letzten Woche geschafft, dass innerhalb einer für uns wichtigen Branche die fünf wichtigsten Marktteilnehmer auf unser Portal verlinkt und das auch noch getwittert haben. Auch wenn sich das nicht direkt im SEO-Traffic niedergeschlagen hat, glaube ich, dass derartige Links extrem wertvoll sind und mittelfristig helfen, sich gegen andere Portale durchzusetzen.

Fazit

Ich weiß natürlich nicht, ob Google es wirklich derart implementiert – aber sinnvoll wäre es auf jeden Fall. Und wenn man glaubt, dass derartige Überlegungen sinnvoll sind, hat das auch Auswirkungen auf den Linkaufbau – sowohl den unbezahlten als auch auf den bezahlten.

Da Google aber nicht mitteilt, welche Links gut und schlecht oder sogar komplett entwertet sind, werden wir das wohl niemals herausfinden. Ist halt eine Glaubensfrage…

The following two tabs change content below.
Avatar-Foto

Markus Hövener

Markus Hövener ist Gründer und SEO Advocate der auf SEO und SEA spezialisierten Online-Marketing-Agentur Bloofusion. Als geschäftsführender Gesellschafter von Bloofusion Germany ist er verantwortlich für alle Aktivitäten in Deutschland, Österreich und der Schweiz. Markus Hövener ist Buchautor, Podcaster und Autor vieler Artikel und Studien rund um SEO.

Markus hat vier Kinder, spielt in seiner Freizeit gerne Klavier (vor allem Jazz) und genießt das Leben.

7 Kommentare zu “Semantische Link-Erkennung: Ein paar Gedanken zur Linkanalyse (wie es sein könnte)”

  1. Avatar-Foto Pascal

    Generell macht sowas schon Sinn – allerdings sieht es in der Realität imho bisher noch etwas anders aus oder der Einfluss dessen ist zu gering. Thematisch fremde Links “funktionieren” ja immer noch.

    Außerdem gibt es bei der Theorie das Problem, dass Ähnlichkeiten hier nur auf Wortebene berechnet werden. Was passiert aber mit Synonymen oder angrenzenden Themengebieten? Möglich, dass dort das Verhältnis “zufällig” passt. Kann aber auch sein, dass das System hier versagt.

    Problem dürfte vor allem sein, dass man diese Theorie nur schwer testen kann, vor allem wenn es ein Einflussfaktor mit geringer Wertigkeit ist (wovon ich ausgehe).

  2. Avatar-Foto Markus

    Ich sehe auch, dass das derzeit so noch nicht implementiert ist. Ich glaube aber auch, dass Google schon vieles recht gut erkennen kann. Wenn jeder, der einen Link kauft, wüsste, dass Google diesen vielleicht auf Grund der Themenferne entwertet, würde den Linkverkäufern wohl einiges an Umsatz wegbröckeln.

    Das mit den Synonymen sehe ich auch als Problem, aber Google hat hier genug Relationen zur Hand. Das treibt vielleicht den Rechenbedarf in die Höhe, aber es ist dennoch machbar.

  3. Avatar-Foto Fritz

    Hmm…was vielleicht noch dazu kommt ist die sematische Linkrelevanz von den beiden Seiten, die da auf einander verlinken – wer verlinkt wo und was wird wieder von dort wohin wie aktuell…

    Gleich wie das menschliche Gehirn, wo ja vieles kreuz und quer semantisch verlinkt ist 😉

  4. Avatar-Foto Alex

    Eine interessante Betrachtung, die sehr schlüssig erscheint. Der Grundgedanke, dass Webseiten thematisch miteinander in Bezug gesetzt werden zeigt auch klar die Richtung vor, wie Linkbuilding konzeptioniert werden sollte und es erklärt sich warum Social Bookmark Dienst und Artikelverzeichnisse als Linkquellen schon eine ganze Weile ausgedient haben.

  5. Avatar-Foto Ole

    Was meiner Meinung nach wichtig ist, in welchem Textumfeld steht ein Link. Es werden ja auch beim Bäcker Zeitungen verkauft, obwohl das verschiedene Domänen sind. Und so kann natürlich auch eine Webseite auf eine andere verlinken, obwohl die Semantik scheinbar nicht übereinstimmt, es aber trotzdem zum Thema passt und dazu auch etwas mehr als der Link auf der Seite steht.

  6. Avatar-Foto Gonzo

    Die thematische Übereinstimmung ist meiner Meinung nach in der Realität eine heikle Sache. Es gibt zwar erstaunlicherweise noch immer die gekauften Footerlinks, die auf alle möglichen unpassenden Sites linken, teilweise mit haarsträubenden Spam-Begriffen, die ich hier nicht nennen möchte.

    Auf der anderen Seite muss ich feststellen, dass gerade freiwillige Links von normalen Usern (teilweise auch von Webmastern) oft von themenfremden Sites kommen.

  7. Avatar-Foto Markus

    Suchmaschinen müssen da einen gesunden Zusammenhang der unterschiedlichen Faktoren finden. Ein Link von einem “normalen” User ist sicherlich oft themenfremd, wird aber deswegen schon “etwas gelten, weil die Seite natürlich trotzdem anderen Positivfaktoren aufzuweisen hat.

Kommentieren