Social Media Spam: Bezahlte Postings sollen zukünftig automatisiert erkannt werden

Unerwünschte Beiträge, generell als Spam bezeichnet, sind ein Problem. Hautnah spür- und erfahrbar zumindest für jeden E-Mail Nutzer. Aber auch in sozialen Netzwerken, allen voran Bewertungsplattformen, Facebook-Pages oder Ratgeberforen, werden Inhalte veröffentlicht, die man als unerwünscht qualifzieren kann: verdeckte Werbung, gefakte Produktbewertungen, Stimmungsmache gegen Mitbewerber etc. Stichwort: Social Media Spam.

Bezahlte Beiträge: Ein eigener Geschäftszweig
Dass hinter diesen Beiträgen eine richtige Industrie steckt, ist quasi ein offenes Geheimnis. Das Community Management kämpft dabei an vorderster Front, um die Plattformen so sauber wie möglich zu halten. Verständlicherweise, leben doch gerade Bewertungsplattformen oder Themencommunitys von ihrer Glaubwürdigkeit. Wird diese dauerhaft untergraben, ist das Geschäftsmodell gefährdet.

Gegenstand der Studie: Automatisierte Erkennung von unterwünschten Inhalten
Was bisher durch die Administratoren, Social Media Verantwortlichen und natürlich Community Manager meist in mühevoller Handarbeit, teilweise zumindest unterstützt von Technik, herausgefiltert wird, soll zukünftig automatisiert erkannt werden. Dies hat sich zumindest ein Forscherteam von der Universität in Victoria in der kanadischen Provinz British Columbia auf die Fahnen geschrieben:

We initiate a systematic study to help distinguish a special group of online users, called hidden paid posters, or termed “Internet water army” in China, from the legitimate ones.

Basis der Studie sind Analysen des Verhaltens (offensichtlich) bezahlter Beitragsschreiber in zwei großen chinesischen Foren. Eine Erkenntnis: Bezahlte Beitragsschreiber legen ein anderes „Postingverhalten“ an den Tag, als der normalersterbliche Nutzer. So ist nach Erkenntnissen der Forscher beispielsweise die Postingfrequenz vergleichsweise hoch und es werden bevorzugt neue Threads eröffnet und seltener in bestehenden Threads geantwortet. Da die Arbeit faktisch nach Akkord bezahlt wird, werden auch Passagen häufiger wiederverwendet, sprich es wird verstärkt Copy & Paste genutzt. Auch die Bestands- bzw. Nutzungsdauer der einzelnen Accounts ist vergleichsweise kürzer.

Vergleichsweise hohe Trefferquote: > 88%
Die am 18.11.2011 unter dem Titel Battling the Internet Water Army: Detection of Hidden Paid Posters veröffentlichten Erkenntnisse sind nicht der erste Versuch, missliebige Spammer und deren Beiträge zu identifizieren. Interessant an der aktuellen Studie ist vor allem die Trefferquote, basierend auf semantischen Analysen, welche die Forscher mit einer Genauigkeit von bis zu 88,79% angeben. Zum Vergleich: Vorhergehende Studien kommen nach Aussage der Forscher nur auf eine Trefferquote um die 50%. Oder klarer ausgedrückt: Kommissar “Zufall” hat eine ähnliche hohe Zuverlässigkeit. Anzumerken ist allerdings, dass die untersuchte Grundgesamtheit in der vorliegenden Studie aus lediglich 775 Usern und knapp 22.000 Beiträgen bestand.

Im nächsten Schritt ist eine weitere Verfeinerung und Erweiterung der Systematik geplant:

As future work, we plan to further improve our detection system and extend our research to other relevant areas, such as network marketing.

Spam-Erkennungssoftware für jedermann?
Ob und in welcher Form aus dieser Studie ein marktreifes Produkt in Form einer “Spam-Erkennungssoftware” entstehen kann und soll, steht bisher in den Sternen. Zum aktuellen Zeitpunkt ist die Studie aber zumindest mit dem Prädikat „lesenswert“ für alle Community & Social Media Manager zu versehen, die ihre eigene Trefferquote beim Kampf gegen die Spammer gerne erhöhen würden.

Wer die Ergebnisse gerne im Original sichten und bewerten möchte, kann die 10-seitige Studie auf der folgenden Seite herunterladen:

Professionelles Community Management mit Software-Unterstützung: Das Basecom Community Cockpit

Da mich die professionelle Ausrichtung des Basecom-Teams und die selbstentwickelte Software-Lösung wirklich beeindruckt hat, habe ich den (strategischen) Community Manager von Basecom Florian Stöhr kurzerhand gebeten, das Community Cockpit hier im Community Management Blog vorzustellen und zusätzlich auch ein paar Worte zum internen “Bestrafungssystem” zu sagen. An dieser Stelle vielen herzlichen Dank an Florian und das gesamte Basecom Community Management Team: Sehr beeindruckend, macht weiter so!


Nutzerakte: Alle Informationen auf einen Blick

Jeder Nutzer hat in seinem Profil eine nur für die Administratoren einsehbare „Akte“. Hier kann man sich einen Überblick über all seine Aktivitäten auf der Plattform verschaffen, zum Beispiel wem er wann welchen Gästebucheintrag geschrieben hat oder mit welchen Kommentaren und Forenbeiträge er sich bislang an der Community beteiligt hat. Außerdem gibt es eine detaillierte Auflistung aller bisherigen Bestrafungen, anderer Adminaktionen (z.B Geburtsdatumsänderungen) und der Beschwerden von und über den Nutzern mit Reaktion (bestätigt / abgelehnt / offen).


Nutzerhistorie

Dies ist die Zusammenfassung aller durch Admins durchgeführten Aktionen bei einem Nutzer.

Die grünen Markierungen im linken Bereich kennzeichnen durchgeführte Bestrafungen, die rote Zahl ist der jeweilige Punktabzug. Mehr zu den einzelnen Bestrafungsszenarienim letzten Punkt dieses Artikels.


Ticketsystem mit automatischer Priorisierung nach Dringlichkeit

Das Backend dient der kompletten Administration der Plattform. Unter dem Menüpunkt „Tickets“ werden alle Meldungen von Nutzern über Nutzer zusammengefasst. In der ersten Übersicht werden die einzelnen Meldungen gewichtet angezeigt, um eine möglichst zügige Abarbeitung der kritischsten Tickets zu gewährleisten. Die Gewichtung setzt sich aus der Art des Verstosses, die von den Nutzern schon beim Melden kategorisiert wird, und der Häufigkeit der Meldung zusammen. Rassismus wird grundsätzlich bereits mit 12 Gewichtungspunkten bewertet, wird in diesem Fall aber durch fünf Meldungen der gleichen Beleidigung mit 5 Gewichtungspunkten in der Priorität überholt.


Gemeldete Textpassagen werden zur Beweissicherung archiviert

Das einzelne Ticket listet alle aktuellen Beschwerden über den Nutzer auf. Der Beschwerdetext wird nach der Meldung in einer gesonderten Datenbank gespeichert, so dass die Beleidigung gelöscht werden kann, bzw. der Täter sie nicht im Nachhinein noch editieren kann. Der automatische Wortfilter (Regelverstoß) greift sofort beim Absenden eines Eintrags, deswegen sind die Wortfragmente auch in dem Beschwerdetext integriert. Da nur die heftigsten Worte gefiltert werden, ist das aber nicht weiter dramatisch.

Das Community Management Team verlangt bei jeder Beschwerde einen Begründungstext, auch um einen Missbrauch des allgegenwärtigen „melden“-Buttons zu verhindern.


Ausgeklügeltes System mit automatischem Vorschlag für eine Strafe

Die Abarbeitung einer Beschwerde erfolgt mit der so genannten Ampel (Grün = Bestrafung, Gelb = Ablehnen, Rot = Löschung des Täters). Durch die vorherige Kategorisierung der Beschwerde, die Zeit seit der Anmeldung und das Vorstrafenregister in der Akte schlägt das System automatisch einen empfohlenen Strafmix vor. Diesen Mix kann man durch die Auswahl eines anderen Vergehens (Beleidigung leicht, mittel, hart) oder direkten Eingriff verändern.

Die im Mix benutzten Strafen beziehen sich auf das Punktesystem, den einfachsten Teil des Achievementsystems. Wer im Gefängnis sitzt kann keine Punkte verteilen oder bekommen, außerdem wird sein Knastaufenthalt durch Gitterstäbe über dem Nutzerbild öffentlich gemacht. Der Abzug von Punkten wird normalerweise prozentual berechnet, allerdings gibt es immer eine Mindestpunktzahl die abgezogen wird. Bei SPAM wird für jeden Eintrag eine gewisse Punktzahl abgezogen, die identischen Einträge werden hierfür vom System gezählt.

Die Strafe wird kurz ins Gästebuch des Nutzers gepostet, die ausführliche Begründung, inklusive des beanstandeten Texts bekommt der Täter per privater Nachricht. Die „Opfer“ werden am Ende ebenfalls per privater Nachricht über die Bestrafung oder Ablehnung der Beschwerde informiert.


System “Fast Forward” zur schnellen Ticket-Abarbeitung

Um die Abarbeitung für die teilweise freiwilligen Administratoren so einfach wie möglich zu machen, wurde das System „Fast Forward“ eingeführt. Dort werden maximal 15 Tickets einer Kategorie mit allen wichtigen Informationen aufgelistet. Das beauftragte Teammitglied kann somit sehr schnell über die Seite screenen, an den Stellen wo kein Vergehen vorliegt die Strafe herausnehmen, und am Ende mit einem Klick alle anderen Strafen automatisch auslösen.


Beschwerden über Strafen sind ebenfalls möglich

Natürlich passieren auch Fehler, deswegen kann sich jeder Nutzer über Strafen beschweren. Ziel ist es, dass ein anderer Administrator diese Beschwerde bearbeitet und noch einmal überprüft.


Die unterschiedlichen Eskalationsstufen der Bestrafungen

  • Die Ermahnung ist einfach, aber häufig schon sehr effektiv. Sie wird aber nur bei kleinen Vergehen gezogen.
  • Bei der Punktestrafe wird eine gewisse Zahl der Punkte abgezogen.
  • Wer im Punktegfängnis sitzt kann keine Punkte verteilen oder bekommen, außerdem wird sein Knastaufenthalt durch Gitterstäbe über dem Nutzerbild öffentlich gemacht.
  • Wenn der Nutzer nur im Forum negativ aufgefallen ist oder er droht zu vertrollen, besteht die Möglichkeit einer zeitlich begrenzten Forensperre. Diese wird in der Praxis meist in Absprache mit dem Nutzer durchgeführt, um auch ihm die Möglichkeit einer Selbstreflexion im zeitlichen Abstand zu geben.
  • Beim Zurücksetzen bleibt das Profil erhalten, es werden aber alle Achievements, Freunde, Fotos, Blogartikel und Beschreibungen gelöscht. Nach den bisherigen Erfahrungen stellt das Zurücksetzen und damit der komplette Verlust der virtuellen Persönlichkeit teilweise sogar eine gefühlt größere Strafe für den Nutzer dar als das Löschen des ganzen Accounts.
  • Beim Löschen des Accounts besteht zusätzlich die Möglichkeit, den Nutzernamen und die E-Mail-Adresse zu sperren. Außerdem wird für eine begrenzte Zeit ein Backup des Nutzerkontos für polizeiliche Ermittlungen gespeichert.
  • Das virtuelle Hausverbot hat mehrere Eskalationsstufen, die von einer einfachen schriftlichen Kündigung bis zum Zivilprozess reichen. In bisher einem Fall musste Basecom eine Unterlassungserklärung mit der Androhung einer hohen Strafe und Ordnungshaft beim Landgericht erwirken.