Zum Hauptinhalt springen
Glossar-Begriff

Semantic Similarity (Semantische Ähnlichkeit)

Maß für Bedeutungsähnlichkeit zwischen Texten via Cosine Similarity.

Definition

Semantic Similarity ist ein Maß dafür, wie ähnlich zwei Texte, Wörter oder Dokumente in ihrer Bedeutung sind – unabhängig von exakten Wort-Übereinstimmungen. Berechnet wird Semantic Similarity typischerweise über Cosine Similarity zwischen Vector Embeddings: Zwei Texte mit ähnlicher Bedeutung haben Vektoren, die im hochdimensionalen Raum nah beieinander liegen.

Warum das wichtig ist

Klassische Keyword-Analyse versagt bei semantischer Ähnlichkeit: "Automobil" und "Auto" → 0% Keyword-Overlap, aber 95% semantisch ähnlich. Moderne Suchmaschinen und LLMs verstehen Bedeutung – Semantic Similarity ist die Metrik, die misst, ob dein Content die richtige Bedeutung abdeckt.

Vidasus-Kontext

In unserer Marketing Intelligence nutzen wir Semantic Similarity für Content Gap Analysis: Eigener Content → Embeddings, Konkurrenz → Embeddings, Similarity zeigt thematische Lücken. Auch für Keyword-Kannibalisierung Detection: URLs mit Similarity >0.85 = potenzielle Kannibalisierung.

Praxis-Beispiel

SaaS-Unternehmen schrieb über "Marketing Automation". Semantic Similarity-Analyse zeigte: Konkurrent A deckt "Email Workflows" besser ab, Konkurrent B deckt "Lead Scoring" ab (identifizierte Content-Gaps). Erstellung gezielter neuer Artikel führte zu deutlich verbesserter Topical Authority.

Messbarkeit

Cosine Similarity Interpretation: 0.9-1.0 (nahezu identisch), 0.7-0.9 (sehr ähnlich), 0.5-0.7 (moderat ähnlich), 0.3-0.5 (schwach ähnlich), 0.0-0.3 (unähnlich).

Level-System

1
Word-Level – Ähnlichkeit einzelner Wörter (König ↔ Königin = 0.85)
2
Sentence-Level – Ähnlichkeit von Sätzen/Phrasen
3
Document-Level – Ähnlichkeit ganzer Dokumente/Artikel