Möglichkeiten und Grenzen der Tonalitätserkennung im Social Media Monitoring Teil 1

4. April 2015
Jan Bartels

Die Erkennung der korrekten Tonalität eines Social Media Posts (positiv, neutral, negativ) spielt beim Monitoring eine entscheidende Rolle. Erst dadurch können Unternehmen die wirkliche Stimmung rund um ihre Produkte und Marken im Social Web einfangen. Wie ist die letzte Kampagne aufgenommen worden? Wie steht es um die Reputation unserer Geschäftsführung? Wer sind die Für- und Widersprecher unseres Unternehmens? Zur Tonalitätsbestimmung verwenden Social Media Monitoring Tools zwei grundlegende Methoden, zum einen die manuelle Vorgehensweise durch geschulte Analysten, zum anderen die automatisierte Erkennung durch entsprechende Technologien. Zwischen beiden gibt es nach wie vor große qualitative Unterschiede. Woran liegt das jedoch und welche Variante macht Sinn für welchen Anwendungsfall? Im ersten von zwei Blogbeiträgen zu dieser Thematik beschäftigen wir uns mit der automatisierten Auswertung durch Computertechnologien.

Automatisierte Tonalitätsbestimmung

Die Weiterentwicklung der automatisierten Erkennung der Tonalität stellt weiterhin eine große Herausforderung für Social Media Monitoring Anbieter dar. Die Vorteile einer solchen Textanalyse liegen auf der Hand. Nahezu in Echtzeit lassen sich große Datenmengen in Form einer Social Media Analyse analysieren, sodass der Kunde stets über das aktuelle Geschehen rund um dessen Suchauftrag informiert ist. Ebenso werden auf Anbieterseite dadurch Human Ressources eingespart. Zwar konnten wir die Analysequalität in den vergangenen Jahren sukzessive verbessern, dennoch gibt es weiterhin große qualitative Unterschiede gegenüber einer manuellen Auswertung. Im Folgenden möchten wir einen Überblick geben, bei welchen Aussagen eine automatisierte  Tonalitätserkennung an Ihre Grenzen stößt.

 

„Das sind ja Arbeitsbedingungen wie bei Primark!“

Kontext:

Bei einer automatisierten Tonalitätsbestimmung würde dieser Beitrag höchstwahrscheinlich als „neutral“ eingestuft. Ein Analyst erkennt an dieser Stelle jedoch den negativen Kontext („Arbeitsbedingungen wie bei Primark“) und würde den Beitrag daher negativ einstufen.

 

„Die neue Jeanskollektion von Kik ist qualitativ echt hochwertig.“

Ironie:

Ironie und Zynismus wird vor allem im Social Web sehr häufig verwendet. Selbst Analysten haben hierbei ab und an Probleme solche Beiträge korrekt einzustufen. Automatisierte Lösungen haben es entsprechend noch schwerer.
 

„Verdammtes Wetter, bin völlig nass. Wenigstens fährt die S-Bahn.“

Tonalität Beitrag vs. Tonalität aus Markensicht:

An diesem Beispiel wird deutlich, dass ein Beitrag insgesamt negativ sein kann, aus Unternehmenssicht (S-Bahn) jedoch neutral oder sogar positiv einzustufen ist. Auch hier haben Technologien bei der Tonalitätserkennung häufig Probleme.
 

Sehr kurze Beiträge:

Eine Tonalitätsbestimmung bei sehr kurzen Beiträgen ist ebenfalls nicht immer leicht. Postet ein Nutzer z.B. lediglich „Krombacher“, so stuft die Technologie diesen Beitrag als neutral ein. Analysten versuchen an der Stelle hingegen wiederum den Kontext dieses Posts zu eruieren, jedoch ist auch dieser nicht immer gegeben.
 

Bewertung entspricht nicht dem Wortlaut:

Gerade in Verbraucherportalen haben Nutzer häufig die Möglichkeit Unternehmen und Produkte an Hand von Punkten, Sternen oder ähnlichem zu bewerten. Zudem kann eine Bewertung in Textform hinzugefügt werden. Für die Technologie besteht hier die Schwierigkeit diese beiden Angaben zusammenzuführen, gerade, wenn diese sich unterscheiden (positive Sterne-Angabe, negatives Statement).
 

„Super SNB, bi gspannt uf die erschte Reaktione vom Tourismus…“

Umgangssprache, Rechtschreibfehler, Dialekte, Schwitzerdütsch und Co.:

Im Internet schreiben Nutzer häufig, wie sie in ihrer Region sprechen. Das heißt Beiträge werden nicht auf Standarddeutsch verfasst. Ebenfalls gibt es für Umgangssprache und Dialekte keine einheitliche Schreibweise. Auch mangelnde Orthografie erschwert eine automatische Einstufung der Beiträge. Darüber hinaus können bestimmte Sätze natürlich auch verschiedene Bedeutungen haben oder der Satzbau wirkt sich auf die Tonalität des Beitrages aus.
 

Sharing-Funktionen:

Oftmals verwenden Nutzer im Social Web die Sharing-Funktionen von YouTube, WordPress & Co., um spannende Inhalte zu teilen. Hierbei wird häufig ein Text vordefiniert („I liked a Video on YouTube…“). Dadurch entsteht die Problematik, das Beiträge nicht identisch mit der Sprache des Users sind, beziehungsweise, dass z.B. die Aussage zur beobachteten Marke im Video negativ ist, der Nutzer jedoch das Video für positiv befindet.
 

Zwischenfazit

Natürlich eignet sich eine Automatisierung, um einen schnellen Überblick zu erhalten. Ebenso können große Datensätze damit effizient analysiert werden. Möchte ein Unternehmen jedoch qualifizierbare Insights gewinnen, so kommt es um eine manuelle Aufbereitung der Daten nicht herum. Diese Vorgehensweise ist Gegenstand des zweiten Teils dieser kleinen Serie.

Sie sind mit der Qualität Ihrer aktuellen Tonalitätserkennung nicht zufrieden? Sprechen Sie uns einfach an, wir beraten Sie gerne.


Weitere interessante Artikel


Kommentare

0

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.