Termgewichtungsanalyse

Das kann die Analyse von Seolingo

Termgewichtung Überblick
 

Ziel der Termgewichtungsanalyse ist es, für ein vorgegebenes Keyword weitere möglichst relevante Terme zu finden, die in einem sinnvollen Text zu dem Ursprungskeyword optimalerweise enthalten sein sollten.Beispiel: Für das Keyword „Weihnachten“ wären z.B. „Heiligabend“, „Geschenke“, „Dezember“ oder „Feiertage“ weitere Terme, die man in einem guten Text über das Ursprungskeyword erwarten würde.

Verallgemeinert kann man sagen, dass man zu einem Schlüsselwort weitere semantisch relevante Schlüsselwörter finden möchte. Grundsätzlich ist das eine extrem aufwändige Aufgabe: intuitiv wissen wir zwar, dass Heiligabend, Geschenke und Co für einen Text über Weihnachten semantisch relevant sind, aber wie lässt sich das automatisiert für ein beliebiges Keyword herausfinden?

Die gängigen Termgewichtungstools (und auch Seolingo) kürzen den Prozess etwas ab und gehen dabei vereinfacht folgendermaßen vor: es werden Texte analysiert, von denen bereits bekannt ist, dass sie für unser Keyword relevant sind. Es wird dann einfach geprüft, welche anderen Terme in diesen Texten oft vorkommen; das müssen dann die semantisch relevanten Terme sein.

Um Texte zu finden, die für ein Keyword relevant sind, wird einfach eine Suchmaschine, normalerweise also Google, verwendet. Durch Analyse der Top Suchmaschinentreffer zu einem Keyword lassen sich also viele weitere Terme finden, die für einen Text zu dem Keyword semantisch relevant sind.

Offen ist an dieser Stelle noch, wie die gefundenen Terme sortiert werden (bzw. welche Terme denn nun am wichtigsten sind). Ein einfacher Ansatz wäre es, die Terme einfach nach der Gesamtanzahl ihrer Vorkommen in allen analysierten Dokumenten zu sortieren. In der Realität werden hierfür aber bessere Verfahren verwendet, lesen Sie für Details die Ausführungen zum Thema WDF*IDF.

Die schließlich erhaltenen Ergebnisse kann man dann auf verschiedene Weise nutzen:

  • Die nach dem zuvor beschriebenen Verfahren ermittelten wichtigsten Terme sollten wir also nach Möglichkeit in unserem eigenen Text zum Keyword verwenden. Diese sogenannten Proof-Keywords signalisieren der Suchmaschine, dass sich unser Text tatsächlich um das Keyword dreht, da das wichtigste Vokabular auch genutzt wird.
  • Die Termgewichtungsanalyse findet aber für gewöhnlich auch noch hunderte oder tausende weitere Terme, die in anderen guten Texten zu unserem Ursprungskeyword vorkommen. Natürlich können wir in unserem Text nicht alle diese Terme benutzen. Ein guter Text zu einem Thema zeichnet sich jedoch dadurch aus, dass er mehrere Teilbereiche eines Themas gründlich abdeckt. Wir können also aus den gewonnenen Termdaten Teilbereiche des Themas identifizieren, die in den anderen Dokumenten eventuell noch nicht so gut behandelt werden und diese sehr gut in unserem eigenen Text aufbereiten.
  • Die Termgewichtungsanalyse zeigt uns aber auch, wie intensiv ein Term in den anderen Dokumenten genutzt wurde. Gerade bei den wichtigsten Termen sollten wir darauf achten, dass wir diese nicht intensiver behandeln als das jeweils intensivste bereits rankende Dokument. Warum? Wenn Terme zu oft verwendet werden, gerät man schnell in den Verdacht des Keyword-Stuffings und kann somit in einem Spam-Filter landen. Es ist daher immer eine gute Idee, sich an den bereits rankenden Dokumenten zu orientieren und die Top-Terme nicht intensiver zu verwenden, als das in den gut rankenden Dokumenten der Fall ist.

Wie geht das in Seolingo?

Konfiguration der Termgewichtung in Seolingo

Konfiguration der Termgewichtung in Seolingo

Zur Konfiguration geben Sie einfach ihr gewünschtes Keyword ein. Sie können dann angeben, welche der drei ersten Ergebnisseiten bei Google für die Analyse verwendet werden sollen. Außerdem können Sie auf Wunsch auch die Ergebnisse von Google News statt der normalen Websuche verwenden.

Optional können Sie nun noch ein Referenz-Dokument angeben, das mit den Ergebnissen der Google-Suche verglichen werden soll. Wenn Sie jetzt auf Analyse starten klicken, wird der Vorgang gestartet und Sie erhalten meist innerhalb von 1 – 2 Minuten Ihr Analyseergebnis.

Was mache ich mit dem Ergebnis?

Als Ergebnis erhalten Sie ein Diagramm, in dem Sie die wichtigsten, semantisch relevanten Terme für Ihr Keyword sehen. Die Terme sind sortiert nach der durchschnittlichen Relevanz, mit der Sie in den Vergleichsdokumenten aus der Google-Suche vorkommen.

Der grüne Balken zeigt die durchschnittliche Relevanz eines Terms über alle Vergleichsdokumente, die gelbe Fläche zeigt die maximale Relevanz des Terms an (d.h. wie relevant der Term in dem Dokument ist, in dem er am intensivsten genutzt wurde). Wenn Sie ein eigenes Referenz-Dokument angegeben haben, zeigt die rote Linie mit den blauen Punkten die Relevanz des Terms in Ihrem Dokument an.

Sie können auch im Diagramm auf einen Datenpunkt klicken und bekommen dann die genauen Zahlenwerte angezeigt.

Anzeigen der Werte

Im theoretischen „Optimalfall“ liegt die Relevanz im eigenen Dokument zwischen der durchschnittlichen und der maximalen Relevanz bei den Vergleichsdokumenten. Wenn Sie einen Term also optimieren möchten, sollten Sie versuchen, die Relevanz des Termes in Ihrem eigenen Dokument etwa in diesen Bereich zu bringen (mehr dazu im Kapitel über die Text-Assistenz).

Warum ist hier nur von einem „theoretischen Optimalfall“ die Rede? Nun, in der Praxis sollten Sie Texte natürlich immer so schreiben, dass sie möglichst gut lesbar und informativ sind. Ein stures Schreiben eines Textes nach einer Kurve wird also vermutlich auch nicht immer die besten Resultate bringen, wenn man „mit Gewalt“ versucht, einen Term noch in einen Text reinzuquetschen.

Die Ergebnisse der Termgewichtungsanalyse sollten Sie also dazu nutzen, sich einen groben Rahmen vorgeben zu lassen und nicht als absolutes, unbedingt zu erreichendes Optimalziel ansehen.

Weitere Optionen

Sie können das Termgewichtungs-Diagramm nach belieben Aufzoomen bzw. den Sichtbarkeitsbereich ändern. Das geht sowohl über Tastatur als auch über die Maus.

Zoomen

Mit den Tasten + bzw. – kann der Diagrammbereich aufgezoomt werden. Komfortabler geht das mit einer Maus mit Mausrad – dieses kann zum Zoomen benutzt werden.

Tipp: Fahren Sie mit dem Mauszeiger an das linke Ende des Diagrammbereiches, um optimal zoomen zu können.

Panning

Sie können auch den Bildbereich verschieben. Das geht intuitiv mit den „Pfeil links“ und „Pfeil rechts“ Tasten auf der Tastatur. Auch mit der Maus ist das bekannte Panning möglich – es muss jedoch die rechte Maustaste statt wie sonst meist üblich der linken verwendet werden. Halten Sie also die rechte Maustaste gedrückt und ändern Sie die Mausposition, um den Bildbereich zu verschieben.

Sie können auch gezielt einen Diagrammbereich mit der Maus auswählen, auf den gezoomt werden soll. Halten Sie dazu die Taste Strg gedrückt und wählen Sie mit der rechten Maustaste den Diagrammbereich aus, auf den gezoomt werden soll.

Durch Drücken der Taste A auf der Tastatur kann der Bildausschnitt auf die Standardeinstellung zurückgesetzt werden.

Proof-Keyword Filter

Sie finden über dem Diagramm auch einen Regler, der als Proof-Keywort Filter dient. Sie können damit die Auswahl auf Begriffe begrenzen, die in mehreren untersuchten Dokumenten vorkommen. Schieben Sie den Regler weiter nach rechts, sehen Sie also nur noch diese Terme, die in mehreren Dokumenten vorkommen.

Weitere Diagramme

Einzeldiagramm

Einzeldiagramm

Alle Dokumente in einem Diagramm

Alle Dokumente in einem Diagramm

 

Neben dem Übersichtsdiagramm können auch noch weitere Diagramme angezeigt werden. Dass Wettbewerbs-Diagramm zeigt die Termgewichtungswerte aller Dokumente in einem Diagramm an. Sie können dabei aber nach Belieben einzelne Dokumente ausblenden und so schließlich bestimmte Dokumente genau miteinander vergleichen.

Zudem kann jedes Dokument in einem Einzeldiagramm angezeigt werden, damit können Sie die Termgewichtungskurve für die einzelnen Dokumente genau analysieren.

Werden bei der Termgewichtungsanalyse eigentlich „Stoppwörter“ o.ä. herausgefiltert?

Die Antwort auf diese Frage lautet: ….. es kommt darauf an! 😉

Im Kapitel WDF*IDF wurden die unterschiedlichen Ansätze zur Messung der Relevanz eines Termes in einem Dokument vorgestellt. Das Problem bei Verfahren wie Keyword Density und WDF ist, dass dabei jeder Term gleich behandelt wird: der Begriff, der am häufigsten in einem Dokument vorkommt, wird bei einem solchen Verfahren als der relevanteste ermittelt.

Das scheint auf den ersten Blick zwar sinnvoll, doch wenn man es in die Tat umsetzt, sieht man das Problem: plötzlich stehen häufig in der Sprache vorkommende Begriffe wie „und“, „ich“, „ist“, „also“ oder „die“ ganz an der Spitze, eben einfach weil diese Wörter in fast jedem Text recht häufig vorkommen.

Wenn Sie eine Analyse per Keyword Density oder WDF durchführen, werden solche sogenannten „Stoppwörter“ daher in der Tat aus den Ergebnissen gefiltert, da sie sonst einen beträchtlichen Teil der „wichtigsten“ Terme ausmachen würden.

Meistens werden Sie aber eine Analyse nach WDF*IDF durchführen. Durch die Verwendung des IDF wird dabei dafür gesorgt, dass solche häufigen Terme automatisch „abgewertet“ werden, weil sie einen sehr niedrigen IDF-Wert besitzen.

Bei der WDF*IDF-Analyse werden deshalb KEINE Stoppwörter aus dem Ergebnis herausgefiltert. Wenn Sie einen Text schreiben, in dem ein Stoppwort sehr sehr sehr häufig vorkommt, kann dieses Stoppwort dann auch als relevanter Term für das Dokument angezeigt werden.

Seolingo jetzt kostenfrei testen

Sie können die hier vorgestellte Termgewichtungsanalyse und viele weitere Features von Seolingo jetzt kostenlos und unverbindlich testen.

Ihr Testaccount läuft nach 5 Tagen bzw. 5 Analysen automatisch aus, Sie brauchen nicht zu kündigen, wenn Sie Seolingo danach nicht mehr nutzen möchten.

Sie brauchen für die Testphase auch keine Zahldaten anzugeben.

Seolingo testen