Wie im Thread Beitrag "Transparenz für uC Net" bereits
angedeutet, sammle ich Daten über gelöschte Threads hier im Forum und
versuche daraus Methoden abzuleiten, um Trollthreads frühzeitig zu
erkennen und ihre Veröffentlichung zu verhindern. Dazu würden erkannte
Threads zunächst in eine Moderationswarteschlange gelegt werden.
Nach genauer Betrachtung meines Verfahrens ist mir aufgefallen, dass ich
nur sehr wenige false positives haben dürfte. Genau das habe ich jetzt
auch erreicht:
1
'total': 528,
2
'correct_positive': 141,
3
'correct_negative': 327,
4
'false_positive': 0,
5
'false_negative': 60,
6
'removed': 201,
7
'not_removed': 327
Ich verwende derzeit alle Threads, die ich bis zum 11.08.2018
aufgezeichnet habe als Referenz, aus denen mein Programm
Bewertungskriterien ableitet. Alle Threads seitdem werden mit den
dadurch bestimmten Kriterien bewertet. Somit sind diese Daten absolut
realistisch, da ich nun genau mit den Informationen bewerte, die zum
Zeitpunkt der Erstellung eines neuen Threads am 11.08.2018 vorgelegen
haben.
Das Ergebnis lässt mich einmal mehr fragen: Warum bekommt man die Trolle
in diesem Forum nicht in den Griff? Es gab kein einziges false positive,
der Mehraufwand für die Moderation ist also gleich Null. Dagegen wurden
70% aller Trolle korrekt erkannt, sodass deren Threads niemals
veröffentlicht worden wären. Zudem muss beachtet werden, dass nicht alle
gelöschten Threads von Trollen kamen, sondern nach Aussage eines
Moderators auch durchaus durch ihre Ersteller gelöscht werden. Die
Trefferqoute liegt also noch etwas darüber.
Ein Troll dessen Beiträge nicht mehr veröffentlicht werden, wird den
Spaß am trollen verlieren. Niemand wird seine Beiträge mehr lesen
können, sodass er keine Aufmerksamkeit erhält und seine Aktivitäten für
ihn uninteressant werden. Die einzige Möglichkeit, die ihm bleibt ist
jedes Mal einen individuellen Beitrag zu verfassen, der aber ebenfalls
innerhalb kurzer Zeit gelöscht werden würde. Der Aufwand für einen Troll
würde also erheblich steigen, sodass die Fluten an Threads, die derzeit
erstellt werden, deutlich eingedämmt werden würde. Unter den gefunden
Threads sind neben dem Löschen-Spinner auch Paul B. mit seinem Geheule
wegen des Hausverbots sowie Matthis FH- und Ausbildungsergüsse.
Als vorsorgliche Begründung: Ich hätte diesen Beitrag natürlich auch im
Thread Beitrag "Transparenz für uC Net" schreiben können.
Dann landet er allerdings in /dev/null, und da gehört dieses Thema
meines Erachtens nun nicht mehr hin, da nun auch Lösungsansätze
betrachtet werden.
Ich werde nun noch ein wenig experimentieren und dann Details zu meinem
Verfahren sowie den Code als eine Art Spende für das Forum bekanntgeben.
Der gesamte Python Code, also die Datenbankaktionen, Erstellung der
Kriterien, die Bewertung von Threads sowie die Überprüfung, ob ein
Thread korrekt klassifiziert wurde nimmt derzeit gerade einmal 90 Zeilen
in Anspruch.
Robin M. schrieb:> sammle ich Daten über gelöschte Threads hier im Forum und> versuche daraus Methoden abzuleiten, um Trollthreads frühzeitig zu> erkennen und ihre Veröffentlichung zu verhindern.
Erklär mir den kausalen Zusammenhang von TROLL und gelöschten Threads.
Gelöscht wird wegen Verstoß gegen die Forenregeln.
Robin M. schrieb:> Threads sind neben dem Löschen-Spinner auch Paul B. mit seinem Geheule
Paul steckt dich mit seiner Erfahrung und Wissen in den Sack.
Seine Umgangsform ist jedoch nicht so ganz komform.
Bist du von Google geschickt?
Robin M. schrieb:> Warum bekommt man die Trolle> in diesem Forum nicht in den Griff?
Klappt doch ganz gut.
Wir diskutieren nur sehr viel über die Trolle, was sicherlich den
Löwenanteil des von Trollen verursachten Traffics ausmacht.
Auch das nutzt sich ab und wir kehren bald zum Tagesgeschäft zurück.
(LED Vorwiderstände und Oszi Kaufempfehlungen)
Veit Emsländer schrieb im Beitrag #5527145:
> Schon mal in Dich hineingehorcht wie es Dir erginge mit einem Gefühl des> Unrechts zensiert, verfolgt, verunglimpft zu werden?
Dein Gefühl mag das sein, das was wir bisher von den gelöschten Threads
und gesperrten Benutzern zu sehen bekommen haben rechtfertigt aber jede
Lösch und Sperraktion.
Beleidigungen, Themen die hier explizit unerwünscht sind, mutwillige
Störaktionen, Drohungen etc.
Wenn man das eigene Verhalten nicht reflektiert, nicht bereit ist sich
an irgendwelche Regeln zu halten ausser den eigenen, dann strapaziert
man sein Gegenüber derart das man irgendwann auch mal unerwünscht ist.
In keinem Restaurant kann ich nackt auf dem Tisch tanzen und mit essen
um mich werfen ohne rauszufliegen.
Wenn ich auf einer Party randaliere bekomme ich aufs Maul und lande vor
der Tür.
Hier wird man eben gelöscht und gesperrt.
Liegt an jedem selbst ob er sich sozial verträglich verhalten will oder
wie die Axt im Walde.
Selbstwahrnehmung und Fremdwahrnehmung gehen hier bei einigen derart
weit auseinander das eine Verständigung was noch geht und was vollkommen
inakzeptabel ist, unmöglich scheint.
Ausser Sperren bleibt einem da nichts übrig wenn man die Natur des
Forums das man anbieten möchte, erhalten will.
Welche Art Forum Andreas anbieten möchte, welcher Ton und welche Themen
angemessen sind, ist die Entscheidung des Hausherrn.
So wie ich in in meinem Haus entscheide wer willkommen ist und wer
nicht.
Im allgemeinen bekommen sich die Leute wieder ein und verlassen die
Party wenn man sie dazu auffordert.
Die ungeschriebenen Regeln zwischenmenschlichen Zusammenlebens scheinen
aber bei einigen nicht sozialisiert worden zu sein oder irgendein
manischer Zwang treibt sie immer wieder an den Ort ihrer Zurückweisung.
Für die Betroffenen schein ihr Verhalten völlig natürlich zu sein.
Für den Aussenstehenden ist das verstörend und krankhaft, weil es weit
ausserhalb des Verhalten liegt das man selbst zeigen oder von anderen
erwarten würde.
Das stößt ab und weckt den Wunsch noch intensiver von diesen Leuten
befreit zu werden.
Veit Emsländer schrieb im Beitrag #5527145:
> Fachidiotentum überschätzt sich häufig weil es> meist arge Defizite auf anderen Gebieten zur Folge hat deren profunde> Kenntnis zur Problemlösung aber blöderweise oft zwingend erforderlich> ist :)
Und der Kranke hält sich selbst gern für den einzig Gesunden.
Eine der Definitionen des Wahnsinns ist die, das der Wahnsinnige selbst
niemals im allergeringsten daran zweifelt vollkommen gesund zu sein.
Gerade diese völlige Abkehr von Selbstzweifeln lässt sein Verhalten
immer weiter wegdriften von dem was die Gesellschaft noch als zumutbar
empfindet.
In diesem Sinne.
Gute Nacht
Robin M. schrieb:> Das Ergebnis lässt mich einmal mehr fragen: Warum bekommt man die Trolle> in diesem Forum nicht in den Griff? Es gab kein einziges false positive,> der Mehraufwand für die Moderation ist also gleich Null. Dagegen wurden> 70% aller Trolle korrekt erkannt, sodass deren Threads niemals> veröffentlicht worden wären.
30% Kollateralschaden, was solls, die Loser gehören eh in die Tonne. Es
lebe die Postmoderne-Evolution.
Veit Emsländer schrieb im Beitrag #5527145:
> Schon mal in Dich hineingehorcht wie es Dir erginge mit einem Gefühl des> Unrechts zensiert, verfolgt, verunglimpft zu werden? Wie wohlfeil Dein> Befund...
Und immer die selbe Leier, egal unter welchem Namen!
Veit Emsländer schrieb im Beitrag #5527145:
> Fachidiotentum überschätzt sich häufig weil es> meist arge Defizite auf anderen Gebieten zur Folge hat deren profunde> Kenntnis zur Problemlösung aber blöderweise oft zwingend erforderlich> ist :)
Auch dieser Satz ist schon bekannt!
Veit Emsländer schrieb im Beitrag #5527145:
> Vielleicht fehlen Dir ein paar wesentliche Informationen?
Vielleicht frage ich genau nach diesen Informationen?
Veit Emsländer schrieb im Beitrag #5527145:
> Tatsächlich? Wer definiert hier "Troll"?
Wie nennst du jemanden, der ständig den selben belanglosen Kram
veröffentlicht?
Veit Emsländer schrieb im Beitrag #5527145:
> Schon mal in Dich hineingehorcht wie es Dir erginge mit einem Gefühl des> Unrechts zensiert, verfolgt, verunglimpft zu werden? Wie wohlfeil Dein> Befund...
Meine Datenbasis habe ich offengelegt. Bei den Threads, auf die Du dich
mutmaßlich beziehst, kann ich keine Verfolgung, Verunglimpfung oder
unrechte Zensur des TO erkennen. Es geht hier lediglich um die Filterung
wiederkehrender Müllthreads anhand ihres Ausgangsposts und nicht die
Betrachtung einzelner Posts und ihrer Zensur (die ich nicht bewerten
kann und will).
Veit Emsländer schrieb im Beitrag #5527145:
> Mach das. Doch bedenke: Fachidiotentum überschätzt sich häufig weil es> meist arge Defizite auf anderen Gebieten zur Folge hat deren profunde> Kenntnis zur Problemlösung aber blöderweise oft zwingend erforderlich> ist :)
Falls du damit darauf hinaus willst, dass die automatische Erkennung von
Posts wie "Ab wann spricht man von einem Akademiker?" oder "Wer fühlt
sich als rabiater Zensor geboren?" fehlende Empathie meinerseits
vermuten lässt, würde ich dich da doch um nähere Begründung bitten.
michael_ schrieb:> Erklär mir den kausalen Zusammenhang von TROLL und gelöschten Threads.> Gelöscht wird wegen Verstoß gegen die Forenregeln.
Wenn es dir damit besser geht: Habe ich wohl unklar formuliert. Hier
wird in diesem Zusammenhang oft von Trolls geschrieben.
michael_ schrieb:> Paul steckt dich mit seiner Erfahrung und Wissen in den Sack.> Seine Umgangsform ist jedoch nicht so ganz komform.
Hm. Von jemandem, der meiner Intelligenz überlegen ist, würde ich schon
etwas smartere Lösungen erwarten als über 100 mal das Selbe zu posten.
michael_ schrieb:> Bist du von Google geschickt?
Bist du Veit Emsländer?
Lukas T. schrieb:> Blocken ist schlechter als Hellbanning.
Kann man machen. Kritisch ist doch erstmal die Erkennung von
unerwünschten Threads. Ich denke allerdings, dass ein Troll schnell
bemerken wird, dass er Hell-gebannt wurde. Welchen Mehrwert würde das
bringen?
Lukas T. schrieb:> Dass aber jeder auch immer denken muss, gerade SEIN Code sei der nächste> heiße Scheiß...
Nunja, er funktioniert halt offensichtlich, auch wenn ich das selber
nicht erwartet hatte. Inzwischen 85% Erkennungsrate bei 0 false
positives würde ich durchaus als brauchbar bewerten. Es braucht aber
sicher noch weitere Tests.
Teo D. schrieb:> 30% Kollateralschaden, was solls, die Loser gehören eh in die Tonne. Es> lebe die Postmoderne-Evolution.
Bei 0 false positives kann ich keinen Kollateralschaden erkennen. Diese
30% sind lediglich die Posts, die zunächst nicht erkannt worden wären,
aber trotzdem gelöscht worden sind, also veröffentlicht worden wären.
Zudem sollte so etwas ohnehin nicht "unbeaufsichtigt" laufen, sondern
vorerst gesperrte Beiträge überprüft und ggf. freigegeben werden.
Inzwischen sind es übrigens nur noch 15%. Bedeutet konkret, dass den
Forennutzern 172 von 201 Beiträgen erspart geblieben wären - innerhalb
etwa 6 Tagen.
Robin M. schrieb:> Wie nennst du jemanden, der ständig den selben belanglosen Kram> veröffentlicht?
Definier ständig.
Wie oft darf man in der Woche, im Monat, im Jahr über das gleiche Thema
schreiben? Im Radio, in Zeitschriften, im Fernsehen, zwischen Freunden
geht es auch sehr oft um die gleichen Themen. So funktionieren Menschen
nunmal, die Wiederholung und der Informationsüberfluss sind zwingend
notwendig.
Definier belanglos.
Etwas, das Dich stört? Etwas, das deiner Meinung nach nicht diskutiert
werden soll? Etwas, das Dich stört kann man bestimmt in die Kategorie
packen, wenn man die große Entscheidung trifft, was dazu gehört oder
nicht, oder?
Was ist schlimmer, der Troll oder der Troll, der über den Troll
schreibt?
Ansonsten dürfe es dem Betreiber egal sein, ob er sein Geld mit oder
ohne Trolle verdient. Das µCNet wird als technisches Forum so oder so
immer uninteressanter.
Obwohl ich das Thema der automatischen Erkennung sehr interessant finde,
schlage ich vor mal Andreas direkt anzuschreiben. Dann könnt ihr
ungestört darüber reden, ohne dass jeder meint seinen Senf dazugeben zu
müssen.
11. Gebot
Du sollst Deinen Troll lieben.
... dies ist eine Troll Nachricht eines läufigen rollenden Trolls.
... alle Trolls werden nicht gelöscht sondern an diesen Beitrag
angehängt.
... wenn du einen Troll aufhängst werden zwei draus.
Lukas T. schrieb:> Keine Neuigkeiten soweit.> Blocken ist schlechter als Hellbanning.
Hellbanning funktioniert allerdings nur, wenn Du die Trolle zuverlässig
wiedererkennen kannst. Das ist in einem Forum ohne Anmeldezwang aber
nicht gegeben. Alternative Techniken wie Cookies und Fingerprinting sind
entweder leicht zu umgehen oder mit hohen Fehlerraten behaftet. Man
könnte derartige Techniken jedoch mit dem Ansatz des TO kombinieren.
Unter den gegebenen Voraussetzungen muß aber jede Maßnahme zunächst an
der Erkennung der Trolle und / oder ihrer Beiträge ansetzen. Was dann
mit den erkannten Trollposts gemacht wird, steht auf einem anderen
Blatt.
> Autor: Robin M. (Gast)> Datum: 18.08.2018 23:12
Wenn Du Deine Zeit für sinnvollere statistische Erhebungen verwenden
würdest, wärst Du jetzt schon ne Ecke weiter :P
Im einfachsten Fall wird der Troll-Beitrag gelöscht.
Im erweiterten Fall werden viele/alle Trollbeiträge eines Trolles
gelöscht.
Im erschwerten Fall wird der Account des Trolles gelöscht.
Aber:
wie macht die Forenanmeldesoftware das/es: ???
Der Troll ist lebenslang gesperrt und kann sich nie wieder anmelden?
egal welchen PC er benutzt ?
egal welchen Router er benutzt ?
egal welchen Provider er benutzt ?
Robin M. schrieb:> Dagegen wurden> 70% aller Trolle korrekt erkannt
Das ist aber eine extrem schlechte Erkennungsrate, was für ein Verfahren
wendest du an?
Percy N. schrieb:> Vielleicht liegt es an der Tageszeit, dass mir dieser Thread als> Metatroll erscheint.
Advanced. Die Fähigkeit der Entwicklung von Verschwörungstheorien und
der damit einhergehenden Falschverdächtigungen in diesem Forum ist
beeindruckend.
Stefan schrieb:> Jedenfalls ist dieser Lösch-Spinner aka Uni-Absolvent erst einmal weg.
Ahja? Woran machst du das fest? Laut meinen Daten war der Uni-Absolvent
heute um 10:23 und der Löschspinner ebenfalls um 10:23 hier.
Monopoli schrieb:> Definier ständig.>> Wie oft darf man in der Woche, im Monat, im Jahr über das gleiche Thema> schreiben?
Nicht das gleiche, das selbe. Wie oft liest du in der Zeitung in Syntax
und Semantik exakt identische Beiträge? Es geht nicht um Beiträge mit
thematischen Überschneidungen, sondern um Threads, die Erfahrungsgemäß
ohnehin gelöscht werden und so schon frühzeitig erkannt würden.
Monopoli schrieb:> Etwas, das Dich stört? Etwas, das deiner Meinung nach nicht diskutiert> werden soll? Etwas, das Dich stört kann man bestimmt in die Kategorie> packen, wenn man die große Entscheidung trifft, was dazu gehört oder> nicht, oder?
Etwas, was hier im Forum schon in einigen anderen Threads als störend
bezeichnet wurde.
Teo D. schrieb:> Gibts echt nicht wichtigeres, im Leben?
Doch, schon. Aber es soll ja Leute geben, die sich für so etwas
interessieren. Ich hätte da übringens noch eine offene Frage an dich
(siehe oben).
BlackUC schrieb:> Mal ne ganz banale Frage: Warum hast Du Deinen Nick geändert?
Weil ich mir hier im Forum genau überlege, wo ich meinen Namen stehen
haben will. Immerhin wird hier eigentlich jede Diskussion erstmal in den
Dreck gezogen.
ohne Account schrieb:> Wenn Du Deine Zeit für sinnvollere statistische Erhebungen verwenden> würdest, wärst Du jetzt schon ne Ecke weiter :P
Die da wären? Die Statistik fällt aus dem Programm, nachdem man
Optimierungen vorgenommen hat...
Werner S. schrieb:> wie macht die Forenanmeldesoftware das/es: ???> Der Troll ist lebenslang gesperrt und kann sich nie wieder anmelden?
Solange er wie momentan immer die selben Beiträge verfasst, werden die
Beiträge einfach nicht veröffentlicht. Es geht hier nicht um
Wiedererkennung des Geräts, sondern des Textes. Ob da irgendein Account
gesperrt wird, ist völlig belanglos, da man sich (wie Matthis in seinen
Anfangszeiten) ja einfach einen neuen Account klicken kann.
Nachdem die wenig gehaltvollen Beiträge nun abgefrühstückt sind, kann
ich ja mal zum technischen kommen.
Bernd K. schrieb:> Robin M. schrieb:>> Dagegen wurden>> 70% aller Trolle korrekt erkannt>> Das ist aber eine extrem schlechte Erkennungsrate, was für ein Verfahren> wendest du an?
Ich gebe dir Recht, dass das erstmal schlecht aussieht. Ich bilde
zunächst zwei Tag Clouds. Eine für gelöschte Threads und eine für
Threads, die weiterhin exisitieren. Bei beiden wird derzeit nur der
Eröffnungspost betrachtet. Anschließend werden alle Wörter, die in der
"bösen" und der "guten" Tag Cloud sind aus der "bösen" gelöscht. Dabei
gehe ich zur Simulation des Lernprozesses bis zu einem bestimmten Datum.
Momentan bis zum 17.08.2018.
Anschließend werden alle Threads betrachtet, die danach veröffentlicht
wurden und die böse Tag Cloud darauf angewendet. Aus der Anzahl der
"bösen" Wörter wird ein Troll Score bestimmt. Für jedes böse Wort gibt
es einen Punkt. Je mehr einzigartige Wörter ein Thread enthält, umso
höher darf dieser Troll Score sein, bevor ein Thread als Trolling
markiert wird.
Direkt im Anschluss wird geprüft, ob dieser Beitrag richtig eingeordnet
wurde. Für die Daten seit dem 17.08. gilt momentan, dass insgesamt 99
Threads gelöscht worden sind. 91 davon, also 91,92% habe ich davon
richtig erkannt. Die folgenden gelöschten Threads wurden nicht erkannt:
Das sind meistens Threads, die noch keinem bekannten Trolling Muster
entsprechen oder eben keine Trolls sind und dennoch gelöscht wurden.
Interessant finde ich aber schon, dass der "Kaiserslautern!" Thread
einen sehr hohen Score erhalten hat, obwohl er vorher nicht in den
Lerndaten enthalten war. Gleiches gilt für "Ungeeignet fürs Lernen?".
Wenn man sich also dann auch die Threads ansieht, die nicht erkannt
wurden, und analysiert, warum sie nicht erkannt wurden, ist das Ergebnis
nicht mehr so schlecht.
Robin M. schrieb:> Bernd K. schrieb:>> Das ist aber eine extrem schlechte Erkennungsrate, was für ein Verfahren>> wendest du an?>> Ich gebe dir Recht, dass das erstmal schlecht aussieht. Ich bilde> zunächst zwei Tag Clouds. Eine für gelöschte Threads und eine für> Threads, die weiterhin exisitieren. Bei beiden wird derzeit nur der> Eröffnungspost betrachtet. Anschließend werden alle Wörter, die in der> "bösen" und der "guten" Tag Cloud sind aus der "bösen" gelöscht. Dabei> gehe ich zur Simulation des Lernprozesses bis zu einem bestimmten Datum.> Momentan bis zum 17.08.2018.
Angesichts der Tatsache, daß das Verfahren noch recht trivial ist und
die Datenbasis ausgesprochen klein, finde ich diese gute Erkennungsrate
schon ziemlich beeindruckend.
Andererseits zeigt das aber IMHO nur, daß die Trollpostings bisher
relativ gleichförmig sind. Sollte Dein Verfahren praktisch genutzt
werden, werden die Trolle aber sicherlich erst einmal Gegenmaßnahmen
ergreifen, um Deiner Erkennung zu entgehen. Das wird zwar ihren Aufwand
erhöhen, aber ich halte es dennoch für fraglich, ob das eine hinreichend
enervierende Wirkung hat. Immerhin sabotiert der selbsternannte
"Freiheitskämpfer" unter den Trollen dieses Forum schon seit über zwei
Jahren mit einem beeindruckenden Einsatz an Zeit, Aufwand und Energie.
Soweit ich das sehe, setzt Du im Moment eher bei der statistischen
Häufung von Worten an. Das liefert für eine automatisierte Methode ohne
manuelle Eingriffe offensichtlich schon ganz brauchbare Ergebnisse,
vermag aber zum Beispiel nicht, zwischen Worten wie zB. "Moderator",
"Moderatoren" und "Moderation" zu unterscheiden.
Eine echte Analyse der Inhalte erscheint mir daher daher als sinnvoller
Ansatz zur Verbesserung der Trefferquote und zur Reduktion von False
Positives. Vielleicht kannst Du Dir dazu bei Volltext-Suchmaschinen wie
Elasticsearch (siehe da unter [1] und dort insbesondere unter "Language
Analyzers") oder in Pythons Natural Language Toolkit ein paar nützliche
Anregungen und ggf. Funktionen holen.
Vor allem wäre aber eine bessere Datenbasis sinnvoll, beispielsweise ein
anonymisierter Datenbankabzug mit Markern für "gelöscht", und sowas kann
wohl lediglich Andreas liefern.
Zuletzt sehe ich auch noch das Problem, daß Deine Software in Python,
die Forensoftware jedoch in Ruby implementiert ist, und die
Infrastruktur von Ruby ist in vielen Bereichen leider bei Weitem nicht
so gut und ausgereift wie die von Python. Eine Portierung könnte daher,
insbesondere wenn einige fortgeschrittene Funktionen aus entsprechenden
Python-Bibliotheken genutzt werden, durchaus aufwändig werden.
Alternativ wäre eine Implementation als Microservice wohl am leichtesten
zu bewerkstelligen, wäre zudem jederzeit schnell und einfach auswechsel-
oder abschaltbar, und könnte bei Timeouts oder anderen Fehlern jederzeit
einfach ignoriert werden.
Da es in meinem Leben zwar Wichtigeres gibt (zwinker zu Teo), ich aber
immer auch Lust zum Spielen habe, würde ich mir Deine Software und Deine
Datenbasis gerne einmal anschauen -- und nach Möglichkeit vielleicht
auch die eine oder andere Verbesserung einbringen. Als angemeldeter
Nutzer bin ich ja leicht zu erreichen. ;-)
[1]
https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-analyzers.html
Hi Robin,
für dieses wirklich extrem triviale Verfahren und die kleine Datenbasis
sind das ja schon wirklich enorm gute Werte!
Ich finde es schade, wie einige Personen deine Arbeit hier
schlechtreden, aber du scheinst zum Glück ja nicht so dünnhäutig zu sein
:-)
Interessant wäre auch mal zu sehen, wie sich andere Verfahren bewähren,
eine Datenbasis hast du ja freundlicherweise schon zur Verfügung
gestellt.
Falls ich mal ein bisschen freie Zeit und Lust finde, könnte ich mich
auch mal mit so einem System beschäftigen, evt ein komplexeres
(Neuronales Netz, etc)
Ich würde dir auch raten, dir einen Account anzulegen und dich mal mit
Andreas in Verbindung zu setzen, du könntest ihm bspw vorschlagen, einen
Testbetrieb für einen Monat einzurichten oder ähnliches.
Weiterhin gutes Schaffen,
Ivo
Hallo Robin,
ich wuerde nicht die Kreativitaet der Trolle unterschaetzen.
Auch die Gegenseite kann Python und neuronale Netze einsetzen. Eine
bessere Filterung wird daher wohl eher zu raffinierteren Trollverfahren
fuehren.
Was waere z.B., wenn der Troll per Skript aus regulaeren alten Threads
einen plausiblen Pseudotext zusammenbaut, um Dein Filter zu passieren
und erst in den Folgeantworten seinen Quatsch ablaesst? Mit einem
Proxydienst koennte er auch gleich noch zahlreiche Diskutanten
simulieren. Und warum sollte er nicht einfach in erfolgreiche
existierende Threads posten?
Mit einer Synonymdatenbank, einer bezueglich Handlungsstrang etwas
formatierten Textbasis und einem Rechtschreibfehlergenerator koennte er
zudem muehelos hunderte individualisierte Beitraege generieren.
Das Ergebnis waere vermutlich sowas wie die Meisenkaiserin (Huerbine von
Pleuselspink) auf Speed, die pausenlos irgendein
Elektrotechnikgeschwurbel, gespickt mit den von ihr zu transportierenden
Botschaften, ausspuckt und damit regulaere Diskussionen stoert.
Ich finde das jetzige System nicht schlecht. Die Anzahl und der Bestand
der Trollnachrichten ist doch recht gering.
Knallfrosch schrieb:> Hallo Robin,> ich wuerde nicht die Kreativitaet der Trolle unterschaetzen.> Auch die Gegenseite kann Python und neuronale Netze einsetzen. Eine> bessere Filterung wird daher wohl eher zu raffinierteren Trollverfahren> fuehren.
Irgendwie bezweifle ich, dass unsere schlimmsten Trolle Matthis und Moby
dazu fähig sind. Beide machen ja fast nur Copy&Paste (vor allem
Matthis). Bei Moby ist es auch noch so, dass er außer von ein bisschen
AVR-Assembler vom Tuten und Blasen keine Ahnung hat. Wenn er sich nun
ernsthaft mit Python und neuronalen Netzen auseinandersetzten müsste,
wäre das ja quasi eine Therapie (sein "Gerechtigkeitssinn" ausgenommen).
Es sei denn er ist ein Troll höchster Güte, hat uns jahrelang verarscht
und uns nur was vorgemacht mit seinen Pamphleten über Hochsprachen etc..
Das kann ich ehrlich gesagt, nicht mehr ausschließen. Aber das ist
eigentlich sehr unwahrscheinlich, nach Ockhams Rasiermesser leidet er
einfach nur am Dunning-Kruger-Effekt und ist ein Fanatiker mit zu viel
Zeit.
Insofern würde es schon was bringen.
Monopoli schrieb:> Definier ständig.>> Wie oft darf man in der Woche, im Monat, im Jahr über das gleiche Thema> schreiben? Im Radio, in Zeitschriften, im Fernsehen, zwischen Freunden> geht es auch sehr oft um die gleichen Themen. So funktionieren Menschen> nunmal, die Wiederholung und der Informationsüberfluss sind zwingend> notwendig.
Das hat sich wohl auch der nds Innenminister Schünemann (der mit der
Volkssturm-Frisur, aber bei weitem nicht so lange her) gesagt, bevor er
innerhalb von nicht einmal zwei Minuten ohne jeden Beleg fünf Mal die
Behauptung aufstellte, Migranten würden nach Überschreiten der deutschen
Grenze als Erstes ihre Pässe verbrennen.
Und derartige Indoktrination hältst Du zwischen Freunden für
erforderlich?
Teo D. schrieb:> MiWi schrieb:>> Teo D. schrieb:>>> Gibts echt nicht wichtigeres, im Leben?>> Gibt's echt nichts wichtigeres - im Leben?>> Gefällt dir das nun besser?
Satzzeichen retten Leben:
"Wir essen jetzt, Opa!"
Habe a nice day ?
Dein Vorhaben ist löblich, keine Frage.
Warum das aber nichts bringen wird:
Der Troll wird solange an seiner Wortwahl feilen, bis seine Beiträge
sofort im Forum erscheinen. Er kann den Filter - genug Arbeit
vorausgesetzt - umgehen. Er kann den Filter auch leicht austesten, denn
alles was sofort durchgeht, erkennt der Filter nicht.
Jemand, der so drauf ist wie z.B. dieser anti-Mod-Troll sagt nicht
einfach "oh, da gibts einen Filter, naja, dann geb ich auf und geh
Tauben züchten". Sondern der wird weiter versuchen, seine Beiträge hier
hineinzustellen.
Solange du keine KI basteln kannst, die den INHALT der Posts liest und
versteht, ist das Vorhaben zum Scheitern verdammt.
Man bräuchte ne KI auf nem starken Server/Rechner (wieviel TFlops
braucht man für sowas überhaupt?)
Aber zu viel Verzögerung würde das Forum kaputtmachen...
Trotzdem gute Sache - viel Glück.
LG
Knallfrosch schrieb:> ich wuerde nicht die Kreativitaet der Trolle unterschaetzen.
Wenn sie wenigstens kreativ wären, würden sie vermutlich niemanden
stören, denn dann könnte man ja darüber lachen.
> Auch die Gegenseite kann Python und neuronale Netze einsetzen.
Nein, eher nicht. Für den selbsternannten "Widerstandskämpfer" ist alles
jenseits von Assembler Teufelszeug, und bevor der mit seinen
beschränkten Fähigkeiten ein einsatzfähiges neuronales Netzwerk in
Assembler entwickelt oder gar eine moderne Hochsprache wie Python
gelernt hat, dürfte sich die Angelegenheit wohl längst auf biologischem
Weg gelöst haben. ;-)
> Was waere z.B., wenn der Troll per Skript aus regulaeren alten Threads> einen plausiblen Pseudotext zusammenbaut, um Dein Filter zu passieren> und erst in den Folgeantworten seinen Quatsch ablaesst?
Das mit den Folgeantworten machen sie ja jetzt schon. Trotzdem schaffen
es die wunderbaren Moderatoren, sie zu finden und zu löschen (danke
dafür an den Betreiber und sein Moderationsteam).
Was das automatisierte Zusammensetzen von Versatzstücken aus alten
Threads angeht: erstens würden sie damit ihre "Message" nicht
verbreiten, die ihnen doch so überaus wichtig ist, und das würde ihre
"Kräfte" zumindest teilen.
Zweitens ist es wesentlich schwieriger und aufwändiger, halbwegs
plausible Texte zu konstruieren, als sich wiederholende Muster in
vorhandenen Texten zu finden; schon deswegen würde "die Abwehr" dieses
Rennen in jedem Falle spielend gewinnen. Obendrein glaube ich, daß man
hier sicher mehr Manpower für die Arbeit an einer "Abwehr"-Lösung
gewinnen kann, während die Trolle naturgemäß Einzelkämpfer sind -- und
es auch bleiben müssen. Denn um sich zu organisieren, müßten sie ihre
Anonymität aufs Spiel setzen... ;-)
jemand schrieb:> Warum das aber nichts bringen wird:> Der Troll wird solange an seiner Wortwahl feilen, bis seine Beiträge> sofort im Forum erscheinen. Er kann den Filter - genug Arbeit> vorausgesetzt - umgehen. Er kann den Filter auch leicht austesten, denn> alles was sofort durchgeht, erkennt der Filter nicht.
Ja, das würde der heutige Filter nicht erkenn, der von morgen aber
schon. Wir reden schließlich nicht von einfachem statischem Blacklisting
oder von einfacher Mustererkennung. Obendrein bleibt die ganz normale
Moderation schließlich erhalten (und wird nur technisch unterstützt), so
daß es mit den wie bisher manuell gelöschten Beiträgen in jedem Fall
einen Rückkanal gibt, um die Filter manuell oder maschinell
weiterzuentwickeln.
> Jemand, der so drauf ist wie z.B. dieser anti-Mod-Troll sagt nicht> einfach "oh, da gibts einen Filter, naja, dann geb ich auf und geh> Tauben züchten". Sondern der wird weiter versuchen, seine Beiträge hier> hineinzustellen.
Es würde den Aufwand jedes einzelnen Trolls jedenfalls deutlich erhöhen
und damit seine Frustrationstoleranz belasten. Bei lernenden Filtern
wären die Trolle zudem immer wieder gezwungen, neue Strategien zu
entwickeln, was die ihnen zur Verfügung stehenden Ressourcen
einschränken würde.
> Solange du keine KI basteln kannst, die den INHALT der Posts liest und> versteht, ist das Vorhaben zum Scheitern verdammt.
Das wiederum glaube ich nicht.
Percy N. schrieb im Beitrag #5528039:
> Ja, da habe ich wohl übersehen, wie gut man verbrannte Pässe verkaufen> kann.
Ob sie verbrannt oder verkauft werden, spielt im Endeffekt keine Rolle.
Am Ende sind sie jedenfalls nicht mehr bei der Person, die sie
identifizieren sollen.
> Tut mir leid, war keine Absicht.
Doch, natürlich war das Deine Absicht. Könntest Du Deine Pass-Diskussion
bitte irgendwo weiterführen, wo sie hinpaßt? Lieben Dank.
A. P. schrieb:> Man bräuchte ne KI auf nem starken Server/Rechner (wieviel TFlops> braucht man für sowas überhaupt?)
Die Transaktionsvolumina und die Zeitkritikalität sind hier wohl nicht
sehr hoch. Die meisten einfacheren Verfahren lassen sich sicher
komfortabel auf einem Raspberry Pi 2 oder 3 abfrühstücken.
Hallo,
ich will ja hier nicht der Spielverderber sein, aber hat eigentlich mal
jemand von euch "Troll-Erkennern" beim Betreiber dieses Forums
nachgefragt, ob überhaupt ein Interesse besteht die vorgeschlagene
Technik einzusetzen? Wäre doch schade wenn ihr euch jetzt so viel Mühe
macht und am Ende die ganze Arbeit umsonst war.
rhf
Sheeva P. schrieb:> Percy N. schrieb im Beitrag #5528039:>> Ja, da habe ich wohl übersehen, wie gut man verbrannte Pässe verkaufen>> kann.>> Ob sie verbrannt oder verkauft werden, spielt im Endeffekt keine Rolle.> Am Ende sind sie jedenfalls nicht mehr bei der Person, die sie> identifizieren sollen.>>> Tut mir leid, war keine Absicht.>> Doch, natürlich war das Deine Absicht. Könntest Du Deine Pass-Diskussion> bitte irgendwo weiterführen, wo sie hinpaßt? Lieben Dank.
Schade, Sheeva!
Von Dir hätte ich eigentlich erwartet, dass Du erkennst, dass es gerade
nicht um Pässe geht. Auch noch um eine bestimmte politische Ansicht
Hätte beispielsweise Frau Kipping fünfmal hintereinander behauptet, alle
Mitarbeiter der Jobcenter verbrachten den Tag damit, arme Arbeitslose zu
schikanieren, hätte das ebenso hierher gepasst.
Nicht hingegen aktuelle Zitate zB aus NRW.
Es ging mir - aus dem Zusammenhang durchaus ersichtlich - um die
mantraartige Wiederholung einer spezifischen Aussage, was Monopoli als
förderlich für die Kommunikation verstanden wissen wollte. Dem bin ich
entgegengetreten, mehr nicht.
Was Migranten mit Pässen machen, kann ich nicht wissen; ich habe
Schünemanns Mantra auch nirgendwo bestritten. Es wäre schön, wenn Ihr
Euch von den Pässen lösen könntet und zur Frage der Eignung von Mantras
(Mantren?) zurückfändet.
Danke!
(warum muss man derartige Banalitäten in extenso erläutern?)
Roland F. schrieb:> ich will ja hier nicht der Spielverderber sein, aber hat eigentlich mal> jemand von euch "Troll-Erkennern" beim Betreiber dieses Forums> nachgefragt, ob überhaupt ein Interesse besteht die vorgeschlagene> Technik einzusetzen? Wäre doch schade wenn ihr euch jetzt so viel Mühe> macht und am Ende die ganze Arbeit umsonst war.
Ach, ich mach' das aus Spaß an der Freude, unabhängig davon, ob
hinterher etwas dabei herum kommt und ob es benutzt wird. Der TO hat
bisher auch nur neunzig Zeilen Fingerübung geschrieben. Das sind doch
alles noch ziemlich überschaubare Investitionen, findest Du nicht?
Percy N. schrieb:> Es ging mir - aus dem Zusammenhang durchaus ersichtlich - um die> mantraartige Wiederholung einer spezifischen Aussage, was Monopoli als> förderlich für die Kommunikation verstanden wissen wollte. Dem bin ich> entgegengetreten, mehr nicht.
Das war mir -- und auch anderen -- nicht ersichtlich, zumal Du auf eine
Replik auf die Pässe wieder zum selben Thema geantwortet hast.
> Es wäre schön, wenn Ihr Euch von den Pässen lösen könntet und zur> Frage der Eignung von Mantras (Mantren?) zurückfändet.
Darum geht es doch gar nicht. Wir alle kennen das Paradigma, demzufolge
eine Lüge nur oft genug wiederholt werden muß, um geglaubt zu werden.
Gibt es da einen Diskussionsbedarf, zumal hier? Ich glaube nicht. Hier
geht es um eine technische Lösung zur Identifizierung von Trollposts,
Monopoli wollte dabei nur ein bisschen stören.
Sheeva P. schrieb:> A. P. schrieb:>> Man bräuchte ne KI auf nem starken Server/Rechner (wieviel TFlops>> braucht man für sowas überhaupt?)>> Die Transaktionsvolumina und die Zeitkritikalität sind hier wohl nicht> sehr hoch. Die meisten einfacheren Verfahren lassen sich sicher> komfortabel auf einem Raspberry Pi 2 oder 3 abfrühstücken.
Und ich dachte schon an Quadro karten und ne lga 3647 xeon gold cpu ^^ -
Rpi ist ja nicht viel schwächer :P
LG
PS : Blad gibt RTX Karten (Nachfolger der GTX 10xx)
Percy N. schrieb:> Schade, Sheeva!> Von Dir hätte ich eigentlich erwartet, dass Du erkennst, dass es gerade> nicht um Pässe geht. Auch noch um eine bestimmte politische Ansicht> Hätte beispielsweise Frau Kipping fünfmal hintereinander behauptet, alle> Mitarbeiter der Jobcenter verbrachten den Tag damit, arme Arbeitslose zu> schikanieren, hätte das ebenso hierher gepasst.> Nicht hingegen aktuelle Zitate zB aus NRW.> Es ging mir - aus dem Zusammenhang durchaus ersichtlich - um die> mantraartige Wiederholung einer spezifischen Aussage, was Monopoli als> förderlich für die Kommunikation verstanden wissen wollte. Dem bin ich> entgegengetreten, mehr nicht.>> Was Migranten mit Pässen machen, kann ich nicht wissen; ich habe> Schünemanns Mantra auch nirgendwo bestritten. Es wäre schön, wenn Ihr> Euch von den Pässen lösen könntet und zur Frage der Eignung von Mantras> (Mantren?) zurückfändet.
Percy N.:
Ich kann Dir nicht folgen, worauf Du hinaus willst!
Sheeva P. schrieb:> Percy N. schrieb:>> Es ging mir - aus dem Zusammenhang durchaus ersichtlich - um die>> mantraartige Wiederholung einer spezifischen Aussage, was Monopoli als>> förderlich für die Kommunikation verstanden wissen wollte. Dem bin ich>> entgegengetreten, mehr nicht.>> Das war mir -- und auch anderen -- nicht ersichtlich, zumal Du auf eine> Replik auf die Pässe wieder zum selben Thema geantwortet hast.>
Ich hatte gehofft, die Duplik sei hinreichend ironisch formuliert, um
ganz egal die Unsinnigkeit seiner materiellen Replik vor Augen zu
führen. Das scheint nicht nur bei ihm nicht funktioniert zu haben.
>> Es wäre schön, wenn Ihr Euch von den Pässen lösen könntet und zur>> Frage der Eignung von Mantras (Mantren?) zurückfändet.>> Darum geht es doch gar nicht. Wir alle kennen das Paradigma, demzufolge> eine Lüge nur oft genug wiederholt werden muß, um geglaubt zu werden.
Alle? Hmmm ...
> Gibt es da einen Diskussionsbedarf, zumal hier? Ich glaube nicht.> Monopoli wollte dabei nur ein bisschen stören.
Dann bin ich wohl einem Troll aufgesessen.
Nichts für ungut!
Percy N. schrieb:>> Gibt es da einen Diskussionsbedarf, zumal hier? Ich glaube nicht.>> Monopoli wollte dabei nur ein bisschen stören.>> Dann bin ich wohl einem Troll aufgesessen.
Du hältst auch echt jeden für nen Troll...
A. P. schrieb:> Percy N. schrieb:>>> Gibt es da einen Diskussionsbedarf, zumal hier? Ich glaube nicht.>>> Monopoli wollte dabei nur ein bisschen stören.>>>> Dann bin ich wohl einem Troll aufgesessen.>> Du hältst auch echt jeden für nen Troll...
Und noch ein Humorverweigerer ...
Die scheinen hier recht dicht gesät zu sein!
Nein nein, erinnere dich doch mal ! Ich helfe dir gerne weiter, will dir
nur nicht den Spaß am Raten verderben, bist ja so lustig ;)
LG
PS :
Percy N. schrieb im Beitrag #5528209:
> @Schwarzer Werber:>> Versuche es doch bitte im korrekten subforum, Du weißt schon, das mit> den hüppschen sticky Stellenangeboten!
Das ist ein anderer Thread
Robin M. schrieb:> Etwas, was hier im Forum schon in einigen anderen Threads als störend> bezeichnet wurde.
...
> Teo D. schrieb:>> Gibts echt nicht wichtigeres, im Leben?>> Doch, schon. Aber es soll ja Leute geben, die sich für so etwas> interessieren. Ich hätte da übringens noch eine offene Frage an dich> (siehe oben).
Tja, erwischt...
Dein Projekt und die Ergebnisse, sind eigentlich recht interessant.
Ich kann es mir nicht mehr erlauben, das Leben allzu ernst zu nehmen. So
gesehen, warst du mein Kollateralschaden. Hast mich auf dem falschen Fuß
erwischt.
>> Gibts echt nicht wichtigeres, im Leben?
Ja absolut. Nur sollte man sich nicht, mit solch Nebensächlichkeiten,
davon ablenken.
Danke
Hier wird 80%ig getrollt und gelöscht, echte Themen werden hier so
kaputt gemacht. Aber belangloser Stuss wird aufgeblasen.
Man muss sich ein anderes Forum suchen, wenn es um Berufe und Ausbildung
geht. Weil man glaubt in der Berufsfachschule die besten Absolventen
gesehen zu haben.
Mani W. schrieb:> Percy N.:>> Ich kann Dir nicht folgen, worauf Du hinaus willst!
Sorry, sehe Deinen Beitrag jetzt erst.
Wenn Du Dir den ursprünglich bezogenen Post von Monopoli noch einmal
ansiehst und meine Antworten an Sheeva durchliest, sollte es eigentlich
klar werden.
A. P. schrieb im Beitrag #5528278:
>> Ich referierte über kleine Kinder - stand doch da. Oder glaubst Du, hier>> möchte jemand übers Knie gelegt werden?
Ich glaub ich weiß worauf du raus willst...
A. P. schrieb:> A. P. schrieb im Beitrag #5528278:>>> Ich referierte über kleine Kinder - stand doch da. Oder glaubst Du, hier>>> möchte jemand übers Knie gelegt werden?>> Ich glaub ich weiß worauf du raus willst...
Könnten wir dann jetzt wohl bitte wieder zum Thema zurückkommen? Danke.
Sheeva P. schrieb:> A. P. schrieb:>> A. P. schrieb im Beitrag #5528278:>>>> Ich referierte über kleine Kinder - stand doch da. Oder glaubst Du, hier>>>> möchte jemand übers Knie gelegt werden?>>>> Ich glaub ich weiß worauf du raus willst...>> Könnten wir dann jetzt wohl bitte wieder zum Thema zurückkommen? Danke.
Hast Du gestern als Gast gepostet ?
Ich kann mir das irgendwie nicht vorstellen.
LG
Bogdan schrieb:> Was ist schlimmer, der Troll oder der Troll, der über den Troll> schreibt?
Der Troll, der über den schreibt, der über den Troll schreibt!
Willi Wichtig schrieb:> Hier wird 80%ig getrollt und gelöscht, echte Themen werden hier so> kaputt gemacht. Aber belangloser Stuss wird aufgeblasen.>> Man muss sich ein anderes Forum suchen, wenn es um Berufe und Ausbildung> geht. Weil man glaubt in der Berufsfachschule die besten Absolventen> gesehen zu haben.
Oder wenns allgemeinere Dinge in OOP, C++ oder anderen
Programmiersprachen geht, dann artet das früher oder später in die
tausendste Grundsatzdiskussion aus. Ums ursprüngliche Thema geht es
schon längst nicht mehr. Und das nur, weil immer wieder die gleichen
Leute ihren Horizont und ihre Anwendungen für den einzig richtigen
Maßstab halten. Natürlich haben die zu der Thematik keine Ahnung,
trotzdem lassen sie nicht ab, auch nicht wenn man deren Thesen klar
widerlegt. Irgendwann schaut dann auch noch Moby vorbei und spammt den
Thread voll, früher oder später wird der Thread geschlossen. Und das ist
echt schade, weil es hier ein paar Köpfe gibt von denen man wirklich was
lernen kann. Aber unter den Umständen kann ich nur empfehlen die
Thematik an einem anderen Ort zu besprechen, wo man aufgeschlossen ist.
Beispielhaft für solche Threads ist dieser hier, der erst vor kurzem
eskaliert ist und geschlossen wurde.
Beitrag "Rust als Embedded-Programmiersprache"
Eigentlich sollte es dabei um Rust und den Einsatz auf Mikrocontrollern
gehen, stattdessen wurde mal wieder eine Grundsatzdiskussion über
(C-/Pascal)-Syntax und die Sinnhaftigkeit allgemein von neuen
Programmiersprachen und Konzepten (hilfe ich muss nach 40 (bzw. 20)
Jahren mal was neues lernen) daraus. Um Rust selber gings nicht mehr.
Wenn es konkret um eine Sache in C++ oder Ähnliches geht, funktioniert
das Forum zum Glück noch.
Ich persönlich hätte den Ansatz der statistischen Wortanalyse als wenig
zielführend eingeschätzt. Der Zusammenhang zwischen Signalwörtern und
Trollbeiträgen kann statt einer Kausalität genauso eine Korrelation
sein. Insbesondere da die Datenbasis wirklich recht gering erscheint.
Zudem kann durch die häufigen Reposts auch eine Art Überanpassung
zustande kommen.
Diese Punkte sind natürlich spekulativ und können nur mit einer größeren
Datenbasis be- oder widerlegt werden.
Nichts desto trotz hat das Verfahren ein paar systematische Schwächen,
welche leicht ausgenutzt werden können. So verfügen die Trolle ja auch
über eine Lernfähigkeit und der Zusammenhang zwischen manchen "starken"
Worten und dem Nichterscheinen des Threads ist sicher schnell
hergestellt. Insbesondere da Threads mit einzelnen Worten den Filter
sofort auslösen, sobald diese in der Bad-Liste auftauchen.
Genauso gibt es aber auch einen simplen Trick um mit einem beliebigen
Beitrag deinen Test zu bestehen. Du verwendest ja notweniger weise das
Verhältnis aus Bad/God-Wörtern für die Entscheidung. Damit kann aber das
Scoring einfach durch das Anfügen einer langen Liste aus z.B.
["der","die","das"] oder anderen häufig vorkommenden neutralen Wörtern
nach unten "korrigiert" werden.
Solange man kein Verfahren findet, welches sich nicht in 5 Minuten
überlisten lässt ist das zwar nett gemeint, wird dem Forum aber nicht
viel helfen.
Moby schrieb im Beitrag #5528815:
> Dabei wär die so einfach:> [...] die Moderation beschränkt ihre> Löschambitionen auf [...]> themenfremde Äußerungen.
Tun sie. Genau deswegen werden deine Beiträge gelöscht.
Man sollte übrigenz im Hinterkopf behalten, das man hier als Troll nur
dank der Gutmütigkeit der Forenbetreiber die Zeit seiner Mitmenschen
verschwenden darf.
Ich persönlich hätte einfach eine Registrierungspflicht eingeführt und
fertig. Damit lässt sich ja ein Hausverbot ganz gut durchsetzen. Und wer
jetzt schreit, dass so eine Pflicht das Forum kaputt macht, dem erkläre
ich gern mal warum beim Trollen nur die Taten zählen und nicht die
Absicht.
Wie funktioniert denn der Spam-Filter in zum Beispiel Thunderbird oder
ähnliche lernfähige Spam-Filter in anderen Produkten? Vielleicht könnte
sich man da inspirieren lassen oder evtl. direkt verwenden, zb. eine
standalone Implementation wie bogofilter um die herum die man nur noch
nen kleinen Wrapper schreiben müsste daß man von deren Erfahrungen und
Verbesserungen des Algorithmus profitieren und nicht bei 0 anfangen
muss?
Soweit ich weiß arbeiten die meisten Spam-Filter mit einer Blacklist.
Würde hier also nur etwas nützen wenn die Trolle ihre Beiträge erst in
anderen Foren posten und dort gemeldet werden.
Und der Bogofilter sieht nach dem gleichen Prinzip (mit den gleichen
Schwächen) die der Algorithmus des TO aus. Ohne eine Sinnerkennung im
Text wird das mittel/langfristig nichts bringen.
> Man sollte übrigenz im Hinterkopf behalten, das man hier als Troll nur> dank der Gutmütigkeit der Forenbetreiber die Zeit seiner Mitmenschen> verschwenden darf.
hier hat jeder offenbar seine eigene Definition von Troll, die da
lautet:
'Jeder ist ein Troll, der nicht meine Meinung vertritt' .... schön
krank; logischerweise muß man hier bisweilen einige Gurus durch den
Kakao ziehen, eine ganz normale Reaktion.
> Ich persönlich hätte einfach eine Registrierungspflicht eingeführt und> fertig.
es gibt 1000 andere Foren, die genau das machen - läuft es da wirklich
besser?
Natürlich nicht und deshalb ist das hier gut so wie es ist.
In jeden Pipifax-Forum besteht mittlerweile Registrierungsplicht, auch
wenn man nur eine Frage hat und sich ansonsten dort nie wieder blicken
läßt!
Mega krank und nichts wird sich mit Registrierung bessern.
> Damit lässt sich ja ein Hausverbot ganz gut durchsetzen. Und wer> jetzt schreit, dass so eine Pflicht das Forum kaputt macht, dem erkläre> ich gern mal warum beim Trollen nur die Taten zählen und nicht die> Absicht.
die wirklichen Trollbeiträge werden doch schon von Mods gelöscht - wo
ist denn Dein Problem?
Soll ich es Dir verraten?
Das ist Intoleranz gegenüber anderen Meinungen und natürlich in erster
Linie eine absolute Selbstherrlichkeit, die stellenweise kaum noch zu
überbieten ist - und genau da setzt Trolling an; wenn nur noch
Einheitsbrei herrscht, dann wird es a) gefährlich und b) ziemlich
langweilig.
Ein Trollgenerator, wie oben vorgeschlagen, ist gut für Leute mit
Cliquenbewußtsein - und sonst für nichts.
ohne Account schrieb:> jeder offenbar seine eigene Definition von Troll, die da> lautet:> 'Jeder ist ein Troll, der nicht meine Meinung vertritt'
Ganz frei nach deiner, sich selbst widersprechenden, Verallgemeinerung
nehme ich deinen Trollbeitrag als Bestätigung meiner "Intoleranz
gegenüber anderen Meinungen".^^
> Ganz frei nach deiner, sich selbst widersprechenden, Verallgemeinerung> nehme ich deinen Trollbeitrag als Bestätigung meiner "Intoleranz> gegenüber anderen Meinungen".^^
das Trolling ist hier weder stärker noch schwächer als in anderen Foren
und wird gut von den Moderatoren weggelöscht;
insofern sollte man sich auch mal fragen, ob der Fehler nicht vielleicht
auch bei einem selbst liegt :p
@ Robin M.
Falls du die Zeit haben solltest, würde es mich doch interessieren was
dein Filter zu diesem Beitrag
(Beitrag "Re: Erkennung von Trollen")
sagt. Ohne jetzt über den Inhalt/Aussage diskutieren zu wollen sind mir
direkt mehrere Signalwörter aufgefallen, welche ich meist von bekannten
Namen lese. (2x krank, Intoleranz, Selbstherrlichkeit, gefährlich)
Bitte einen Namen eingeben (nicht "Gast") oder ein schrieb im Beitrag
#5528892:
> Würde hier also nur etwas nützen wenn die Trolle ihre Beiträge erst in> anderen Foren posten und dort gemeldet werden.
Nö, ich hab mir das so vorgestellt daß die Mods zuerst wie bisher
manuell klassifizieren in (troll / nicht-troll), die Daten liegen also
vielleicht sogar bereits schon vor, und dann wird einmal pro Nacht der
Filter mit dem gesamten Datenbestand des Forums und aller je dagewesener
Trollposts trainiert.
Der Filter klassifiziert von da an automatisch und auch das was er nur
um Haaresbreite als Troll/Spam erkannt hat landet ebenfalls in seinem
Datenbestand fürs nächste Training, manchmal muß ein mod vielleicht noch
nachhelfen und korrigieren aber irgendwann lernt er es weil seine
Trainingsdaten ja immer aktualisiert werden.
Irgendwann sitzen die mods da, lehnen sich zurück und sehen dem Filter
bei der Arbeit zu wie er mit chirurgischer Präzision vollautomatisch
ihre Vorgaben umsetzt.
Jetzt müsste man sich halt mal schlau machen was es außer Bogofilter
noch so für Werkzeuge aus dem Machine-Learning Umfeld gibt die sich für
Textklassifizierung eignen.
Eine Klassifizierung der Beiträge geht ja schon über ein einfaches
Blacklisting, wie ich bei Spam angeführt habe, hinaus.
Als Problem an deinem Ansatz sehe ich bloß folgendes:
1. Klasifizieren
2. Trainieren
3. ...
4. Profit
Es fehlt der entscheidente Teil. Die Frage ist ja, nach welchen Kriteren
kann der Filter entscheiden was Troll ist und was nicht. Eine einfache
statistiche Analyse würde sicherlich bei einem Szenario funktionieren,
bei dem dieses Forum nicht das Hauptziel ist. Allerdings sehe ich die
Situation hier so, dass wenige Individuen versuchen nur dieses Forum
nach besten Möglichkeiten für ihre Zwecke zu nutzen. Damit besteht ein
hohes Bestreben, alle Schutzmechanismen genaustens auf Schwachstellen zu
untersuchen und diese auszunutzen.
Vlt. noch ein eher theoretischer Gedanke dazu:
Erkannt werden sollen ja im Prinzip nicht die Worte an sich, sondern die
beansichtigte Wirkung. Eine wortbasierte Analyse ist sehr eingeschränkt,
da die Anzahl der möglichen Sätze für eine Aussage unendlich ist. Es
gibt keine Komplexitätsobergrenze im Satzbau (besonders im deutschen^^).
Und die Erkennung von Textinhalten ist aktueller Forschungsgegenstand.
Solange es dafür keine Lib gibt, wird hier wahrscheinlich niemand die
erforderlichen Ressourcen aufbringen können/wollen.
Bitte einen Namen eingeben (nicht "Gast") oder ein schrieb im Beitrag
#5529003:
> Die Frage ist ja, nach welchen Kriteren> kann der Filter entscheiden was Troll ist und was nicht.
Indem er das trainierte Modell auf das neu hereinkommende Posting
anwendet.
> Eine einfache> statistiche Analyse würde sicherlich bei einem Szenario funktionieren,> bei dem dieses Forum nicht das Hauptziel ist.
Deshalb schrieb ich ja es lohnt sich vielleicht sich mal umschauen was
es da mittlerweile an ausgeklügelten Verfahren zur Textklassifizierung
aus dem Bereich des Machine Learning gibt im Jahre 2018, vielleicht auch
mal nen separaten Thread aufmachen indem nicht Trollpostings
thematisiert werden sondern ganz wertfrei nach trainierbaren
Klassifizierern speziell für Text fragen. Trader jagen ausgeklügelte
Algorithmen über die News um Millisekunden nachdem was über den
Nachrichtenticker reinkommt gezielte Kauf/Verkauf-Signale zu erhalten,
die Forschung ist in diesem Themengebiet bestimmt nicht stehengeblieben.
Und man könnte zum Spaß - quasi als Benchmark - auch mal den bogofilter
drüberjagen, nur um zu sehen wie der sich im Vergleich dazu schlägt, da
steckt ja schließlich auch schon mehr Entwicklungszeit und Forschung
drin als drei Tage / 90 Zeilen Python.
Horst S. schrieb:> Bernd K. schrieb:>> Irgendwann sitzen die mods da, lehnen sich zurück und sehen dem Filter>> bei der Arbeit zu wie er mit chirurgischer Präzision vollautomatisch>> ihre Vorgaben umsetzt.>> Irgendwann sitzen die Fahrer nur noch in Ihren Autos und schauen dem> Autopiloten beim Fahren zu.> https://www.n-tv.de/mediathek/videos/panorama/Video-zeigt-toedlichen-Uber-Unfall-article20349359.html> Q.e.d.>> Ich glaube, bei solch technikgläubigem Gedankengut wird selbst mir> schlecht...
Es läuft darauf hinaus, dass der Filter definiert, was ein Troll ist.
Wer so etwas toll findet, mag sich daran begeistern. Leider läuft das
Ganze darauf hinaus, dass der Filter ab einem Zeitpunkt vermeintliche
Merkmale nicht mehr nur "erkennen", sondern selbst zuschreiben wird.
Percy N. schrieb:> Es läuft darauf hinaus, dass der Filter definiert, was ein Troll ist.
Nur wenn der Forenbetreiber jedes andere Denken einstellt. Oder
definiert Google Maps neuerdings was der Weg zwischen A und B ist?
Solche Werkzeuge sagen einfach nur aus, dass z.B. Muster T zu 80%
übereinstemmt. Was du dann mit dieser Info machst ist allein deine
Sache. Wer sich natürlich erhofft durch Algorithmen auch die letzte
Denkarbeit einstellen zu können, hat zurecht Angst aber auch ganz andere
Probleme.
Martin H. schrieb:> Ja, Machine-Learning ist 'ne feine Sache
Das eine KI bei bestimmten Eingangsdaten, welche weit außerhalb der
Trainingsdaten liegen, ein scheinbar überraschendes Muster erzeugt ist
eigentlich bekannt. Es stimmt das darauf beim Einsatz geachtet werden
muss, ein "Bedienungsfehler" ist aber kein Zeichen für eine mangelnde
Qualität der KI.
Percy N. schrieb:> Es läuft darauf hinaus, dass der Filter definiert
Nein, niemand anders als Mods definieren das, namlich indem sie dem
Filter die richtige Auswahl an Beispielen vorlegen damit der Filter sich
selbst beibringen kann anhand welcher Merkmale die beiden Arten von
Postings sich am besten unterscheiden lassen.
Und indem sie bei Fehleinschätzungen diese von Hand richtig
klassifizieren und dem Filter dies mitteilen auf daß er Gelegenheit hat
sein Erkennungsmodell nochmal zu überdenken und entsprechend zu
verfeinern.
A. P. schrieb:> Sheeva P. schrieb:>> Könnten wir dann jetzt wohl bitte wieder zum Thema zurückkommen? Danke.>> Hast Du gestern als Gast gepostet ?
Nein, ich poste hier nicht als Gast, nur mal ganz am Anfang, bevor ich
mich angemeldet hatte. Aber seitdem habe ich keinerlei Veranlassung,
mich hinter einem Gastnick zu verstecken.
Bitte einen Namen eingeben (nicht "Gast") oder ein schrieb im Beitrag
#5528746:
> Ich persönlich hätte den Ansatz der statistischen Wortanalyse als wenig> zielführend eingeschätzt. Der Zusammenhang zwischen Signalwörtern und> Trollbeiträgen kann statt einer Kausalität genauso eine Korrelation> sein. Insbesondere da die Datenbasis wirklich recht gering erscheint.> Zudem kann durch die häufigen Reposts auch eine Art Überanpassung> zustande kommen.
Gute Argumente. Trotzdem glaube ich, daß man mit statistischer
Korrelation schon relativ weit kommen kann, schließlich will der Troll
seine spezielle Botschaft loswerden und kommt daher kaum um ein
bestimmtes und statistisch signifikantes Vokabular herum, so daß
tatsächlich eine gewisse Kausalität bestehen dürfte.
> Diese Punkte sind natürlich spekulativ und können nur mit einer größeren> Datenbasis be- oder widerlegt werden.
Natürlich. Deswegen ist es vermutlich das Beste, zunächst ein konkretes
Konzept auszuarbeiten, es dem Betreiber dieser Seite vorzustellen und es
bei einem Interesse seinerseits anhand eines anonymisierten Ausschnitts
seiner vorhandenen Daten zu überprüfen.
> Nichts desto trotz hat das Verfahren ein paar systematische Schwächen,> welche leicht ausgenutzt werden können. So verfügen die Trolle ja auch> über eine Lernfähigkeit und der Zusammenhang zwischen manchen "starken"> Worten und dem Nichterscheinen des Threads ist sicher schnell> hergestellt. Insbesondere da Threads mit einzelnen Worten den Filter> sofort auslösen, sobald diese in der Bad-Liste auftauchen.
Wie von mir und anderen bereits bemerkt, ist das Verfahren des TO bisher
noch vergleichsweise einfach und verbesserungsbedürftig. Aber es ist ein
erster Ansatz, der trotz seiner Einfachheit und geringen Datenbasis
recht beeindruckende Ergebnisse liefert.
Neben verschiedenen Möglichkeiten, das Verfahren des TO durch moderne
Algorithmen aus der Statistik und des Natural Language Processing zu
verfeinern, sind aber natürlich auch diverse Ansätze denkbar, wie sie
beispielsweise Spamfilter wie SpamAssassin oder dspam einsetzen. Zudem
könnten auch die Metadaten zur Berechnung der Trollwahrscheinlichkeit
herangezogen werden, als entlastende oder belastende Merkmale.
Ein paar Beispiele: Merkmal "Nutzer ist bereits lange registriert" wäre
sicherlich ein entlastendes Merkmal, "Nutzer kommt über TOR-Exitnodes"
hingegen ein belastendes Merkmal. Dies in Verbindung mit einer ständig
aktualisierten Statistik, die Stopwords ignoriert, Stammformreduktion,
sowie ggf. eine Lemmatisierung und eine Gewichtung der benutzten Terme
(Sätze, N-Gramme, ...) betreibt und über die Faktoren einer Gewichtung
einfließt, ließe sich recht einfach implementieren und mit nur wenigen
manuellen Eingriffen betreiben und feingranuliert einstellen.
Klar, einen hundertprozentigen Schutz kann es auf solch einer Basis
nicht geben. Aber es würde ja reichen, die Aufwände der Trolle
langfristig so zu erhöhen, daß sie immer größere Ressourcen an Zeit und
Arbeit benötigen und dadurch zunächst nicht mehr so viele Trollposts
verfassen können, und dann idealerweise irgendwann die Lust verlieren.
> Genauso gibt es aber auch einen simplen Trick um mit einem beliebigen> Beitrag deinen Test zu bestehen. Du verwendest ja notweniger weise das> Verhältnis aus Bad/God-Wörtern für die Entscheidung. Damit kann aber das> Scoring einfach durch das Anfügen einer langen Liste aus z.B.> ["der","die","das"] oder anderen häufig vorkommenden neutralen Wörtern> nach unten "korrigiert" werden.
Ach komm, das Ignorieren von Stopwords ist ein Standardverfahren, und es
dürfte auch kein Problem sein, Worte zu ignorieren, deren Stammform sich
nicht in den einschlägigen Lexika finden läßt. Für so etwas hat Pythons
Natural Language Toolkit bereits Funktionen, Textkorpora und Lexika, die
zudem durch Lexika einschlägiger Fachbegriffe ergänzt werden können. Wir
befinden uns hier immerhin in einem Forum, in dem häufig fachsprachliche
Begriffe verwendet werden.
> Solange man kein Verfahren findet, welches sich nicht in 5 Minuten> überlisten lässt ist das zwar nett gemeint, wird dem Forum aber nicht> viel helfen.
Natürlich. Darum diskutieren wir über solche Verfahren oder
Kombinationen davon, die mit wenig Aufwand realisiert und betrieben
werden können. Denn eine Lösung, die vom Betreiber oder den Moderatoren
einen höheren Aufwand erfordert als die vorhandene Situation, wäre
natürlich auch keine Lösung, sondern im Gegenteil eine Verschlechterung.
Leider veröffentlich der TO jedoch nur die gelöschten Beiträge. Um eine
sinnvolle Analyse zu starten, müßten auch die nicht gelöschten Beiträge
vorliegen und über boolsche Marker als "gelöscht" oder "nicht gelöscht"
markiert sein.
Bitte einen Namen eingeben (nicht "Gast") oder ein schrieb im Beitrag
#5528827:
> Ich persönlich hätte einfach eine Registrierungspflicht eingeführt
Diese Diskussion poppt hier regelmäßig auf, aber eine
Zwangsregistrierung wird vom Betreiber der Seite ausdrücklich nicht
gewünscht. Bitte laßt uns seine Wünsche respektieren und deswegen darauf
verzichten, diese leidige Diskussion erneut anzustoßen. Danke.
Übrigens hat hier bereits jemand den Verdacht geäußert, daß hinter einem
der Trolle jemand stecken könnte, der selbst ein Forum mit
Registrierungspflicht betreibt und dieses Forum hier wegen seines
Erfolges beneidet, welchen er dem Fehlen einer solchen Pflicht
zuschreibt. Für manche Menschen könnte das ein Ansporn sein, dieses
Forum so lange zu stören, bis sich die Nutzer abwenden oder eine
Registrierungspflicht eingeführt wird, in der Hoffnung, daß er so einige
der frustrierten Abwanderer für sein Forum abgreifen kann. Ich halte das
zwar für eher unwahrscheinlich, aber leider trotzdem nicht für gänzlich
von der Hand zu weisen... Manche Leute kommen auf sehr kranke Ideen. ;-)
ohne Account schrieb:> hier hat jeder offenbar seine eigene Definition von Troll, die da> lautet:> 'Jeder ist ein Troll, der nicht meine Meinung vertritt' .... schön> krank; logischerweise muß man hier bisweilen einige Gurus durch den> Kakao ziehen, eine ganz normale Reaktion.
Das ist sicher bei den Wenigsten hier so, im Gegenteil. Ich, zum
Beispiel, schätze viele Teilnehmer dieses Forums besonders deswegen,
weil sie eine andere Meinung haben als ich, etwa Daniel A., Mani W. und
Possetitjel, um nur drei dieser wunderbaren Menschen zu nennen.
> die wirklichen Trollbeiträge werden doch schon von Mods gelöscht - wo> ist denn Dein Problem?
Da kann ich nur für mich sprechen: ich habe kein Problem. Aber mir
machen solche technischen Lösungen Spaß und ich möchte versuchen, die
Moderatoren und die Nutzer dieses Forums ein wenig zu entlasten.
> Soll ich es Dir verraten?> Das ist Intoleranz gegenüber anderen Meinungen und natürlich in erster> Linie eine absolute Selbstherrlichkeit, die stellenweise kaum noch zu> überbieten ist - und genau da setzt Trolling an; wenn nur noch> Einheitsbrei herrscht, dann wird es a) gefährlich und b) ziemlich> langweilig.
Richtig, und deswegen schätze ich Leute, die andere Meinungen haben als
ich und sie sachlich und argumentativ vertreten können, ganz
außerordentlich. Sie helfen mir, meine Sinne zu schärfen und mich
weiterzuentwickeln, und ein ums andere Mal auch, meine eigene Meinung zu
ändern.
Auf Menschen wie "Mathis", der hier regelmäßig seinen akademischen
Dünkel pflegt und dabei nicht minder regelmäßig Unsinn äußert, die
Mitbürger mit ausländischen Wurzeln verunglimpfen und verächtlich macht,
kann ich dabei aber gerne verzichten. Ebenso auf den selbsternannten
"Widerstandskämpfer" der den Betreiber dieses Forums und seine
Moderatoren mit der DDR-Diktatur gleichsetzt, der jedes Thema, das ihm
nicht gefällt, mit penetranten, immer denselben wiederkehrenden
Phrasen, Provokationen und Sticheleien stört und obendrein die
Artikelsammlung sabotiert hat, bei deren Erstellung sich eine Menge
Leute viel Arbeit und große Mühe gemacht haben.
Auf solche Leute kann ich wunderbar verzichten. Sie bringen niemanden
auch nur das geringste Bisschen weiter, und sie vertreten auch keine
Meinungen, schon gar nicht sachlich oder gar argumentativ. Es geht ihnen
hier offenbar auch nicht um den Austausch mit anderen, sondern ganz
offensichtlich (und mittlerweile im Falle des "Widerstandskämpfers"
sogar erklärtermaßen) nur darum, dieses Forum, seinen Betreiber, seine
Moderatoren und seine Nutzer zu nerven und zu stören.
Anscheinend bin ich auch nicht der Einzige, der das so sieht. Deswegen
hat der "Widerstandskämpfer" ein Hausverbot erhalten. Daß er dieses
ignoriert und stattdessen weiterhin riesige Mengen an Zeit und Arbeit
investiert, um den Forenbetrieb zu stören, zeigt wohl deutlich genug,
wes Ungeistes Kind dieser Mensch ist und wie wenig Respekt er vor
anderen Menschen, ihrem Eigentum und ihrer Arbeit hat.
Bernd K. schrieb:> Nö, ich hab mir das so vorgestellt daß die Mods zuerst wie bisher> manuell klassifizieren in (troll / nicht-troll), die Daten liegen also> vielleicht sogar bereits schon vor, und dann wird einmal pro Nacht der> Filter mit dem gesamten Datenbestand des Forums und aller je dagewesener> Trollposts trainiert.
Wenn ich der Forenbetreiber wäre, der ich aber leider nicht bin, würden
die Postings bereits in meiner Datenbank liegen und jeweils als
"gelöscht" oder "nicht gelöscht" markiert sein, eventuell angereichert
durch Metadaten wie Uhrzeit, IP-Adresse und weitere. Da die Löschungen
bisher manuell nach der Sichtung durch die Moderatoren erfolgt sind,
würde es also bereits einen hervorragenden Bestand an Trainings- und
Testdaten geben.
> Der Filter klassifiziert von da an automatisch und auch das was er nur> um Haaresbreite als Troll/Spam erkannt hat landet ebenfalls in seinem> Datenbestand fürs nächste Training, manchmal muß ein mod vielleicht noch> nachhelfen und korrigieren aber irgendwann lernt er es weil seine> Trainingsdaten ja immer aktualisiert werden.
Einen Filter mit sich selbst zu trainieren, führt nahezu zwangsläufig zu
einer selbsterfüllenden Prophezeihung. Daher war und ist mein Vorschlag,
als Trollposts erkannte Beiträge nicht sofort, sondern erst nach einer
manuellen Prüfung durch die Moderatoren zu veröffentlichen. Das kann dem
Benutzer übrigens auch gleich nach dem Absenden des Beitrages mitgeteilt
werden, wie das verschiedene andere Foren machen: "Ihr Beitrag wird nach
einer Prüfung durch die Moderatoren freigeschaltet". Nicht als
Trollposts erkannte Beiträge können dann trotzdem sofort oder nach einer
minimalen Zeitverzögerung veröffentlicht werden, und niemand würde
wissen, ob der Beitrag gerade von einem schlaflosen Moderator
freigeschaltet worden ist oder ob er den Trollfilter bestanden hat. ;-)
Percy N. schrieb:> Es läuft darauf hinaus, dass der Filter definiert, was ein Troll ist.
Genau das gilt es zu vermeiden. Deswegen soll der Filter nicht
entscheiden, sondern den Moderatoren nur eine Entscheidungshilfe bieten
und eventuell bei offensichtlichen Trollposts, die Veröffentlichung bis
zu einer Entscheidung durch die Moderatoren verzögern.
Vorteil 1: Eine Nichtveröffentlichung ist und bleibt immer nur die Folge
einer bewußten Moderatorenentscheidung.
Vorteil 2: Die Moderatorenentscheidung kann dann sofort für das weitere
Training des Filters genutzt werden, um diesen weiter zu verbessern.
Vorteil 3: Wenn der Filter einen Beitrag als Trollpost erkannt hat, wird
er nicht veröffentlicht, was dem Troll seine Befriedigung versagt.
Ich sehe an so einem halbautomatischen Verfahren einige Vorzüge, welche
die Aufwände des Trolls erhöhen, ihm die Genugtuung versagen und ihn
dadurch so frustrieren, bis er sich leichtere Opfer (oder professionelle
Hilfe) sucht. ;-)
Sheeva P. schrieb:> A. P. schrieb:>> Sheeva P. schrieb:>>> Könnten wir dann jetzt wohl bitte wieder zum Thema zurückkommen? Danke.>>>> Hast Du gestern als Gast gepostet ?>> Nein, ich poste hier nicht als Gast, nur mal ganz am Anfang, bevor ich> mich angemeldet hatte. Aber seitdem habe ich keinerlei Veranlassung,> mich hinter einem Gastnick zu verstecken.
Nein, ich meinte unter deinem Namen nur als Gast - Du wurdest vom Troll
übernommen...
Gestern ist mir aufgefallen, dass der Löschtroll nicht sehr kreativ ist
- deswegen antwortet er nur versteckt...
Danke.
>>>>>> Hast Du gestern als Gast gepostet ?>>>> Nein, ich poste hier nicht als Gast, nur mal ganz am Anfang, bevor ich>> mich angemeldet hatte. Aber seitdem habe ich keinerlei Veranlassung,>> mich hinter einem Gastnick zu verstecken.>> Nein, ich meinte unter deinem Namen nur als Gast - Du wurdest vom Troll> übernommen...>> Gestern ist mir aufgefallen, dass der Löschtroll nicht sehr kreativ ist> - deswegen antwortet er nur versteckt...
Bevor hier Chaos ausbricht - ich habe gepostet - sorry
3.14159265359 schrieb:> Nein, ich meinte unter deinem Namen nur als Gast - Du wurdest vom Troll> übernommen...
Mein Beitrag dazu fiel unter Kollateralschaden, da schrieb ich
so ungefähr, dass das nicht von Sheeva P. stammen kann, weil
sich dieser User ganz anders ausdrückt...
Ja, das war ein falscher (Gast)...
3.14159265359 schrieb:> Nein, ich meinte unter deinem Namen nur als Gast - Du wurdest vom Troll> übernommen...
Weiß ich -- ist doch schön, daß er mich so bewundert, daß er meinen
Nickname kopiert. Ich poste hier jedenfalls nur angemeldet und unter
diesem Namen.
Horst S. schrieb:> technikglHorst S. schrieb:> Bernd K. schrieb:>> Irgendwann sitzen die mods da, lehnen sich zurück und sehen dem Filter>> bei der Arbeit zu wie er mit chirurgischer Präzision vollautomatisch>> ihre Vorgaben umsetzt.>> Irgendwann sitzen die Fahrer nur noch in Ihren Autos und schauen dem> Autopiloten beim Fahren zu.> https://www.n-tv.de/mediathek/videos/panorama/Video-zeigt-toedlichen-Uber-Unfall-article20349359.html> Q.e.d.>> Ich glaube, bei solch technikgläubigem Gedankengut wird selbst mir> schlecht...
LMAO, die KI hatte Alles richig gemacht und ein nötiges Notbremsen
erkannt.
Notbremsen war aber auf OFF gestellt...
>The RADAR, LIDAR, and cameras DID detect and classify pedestrian bicycle
correctly.
>The system DID determine that emergency braking was required.>But Uber disabled the systems emergency braking feature in autonomous mode.>Uber also disabled Volvo’s inbuilt pedestrian safety detection system.>https://www.eevblog.com/2018/06/24/eevblog-1088-uber-autonomous-car-accident-report/
Robin M. schrieb:> Ich werde nun noch ein wenig experimentieren und dann Details zu meinem> Verfahren sowie den Code als eine Art Spende für das Forum bekanntgeben.> Der gesamte Python Code, also die Datenbankaktionen, Erstellung der> Kriterien, die Bewertung von Threads sowie die Überprüfung, ob ein> Thread korrekt klassifiziert wurde nimmt derzeit gerade einmal 90 Zeilen> in Anspruch.
Super! Endlich mal jemand der was macht.
Sheeva P. schrieb:> Daher war und ist mein Vorschlag,> als Trollposts erkannte Beiträge nicht sofort, sondern erst nach einer> manuellen Prüfung durch die Moderatoren zu veröffentlichen. ...> .... Nicht als> Trollposts erkannte Beiträge können dann trotzdem sofort oder nach einer> minimalen Zeitverzögerung veröffentlicht werden, und niemand würde> wissen, ob der Beitrag gerade von einem schlaflosen Moderator> freigeschaltet worden ist oder ob er den Trollfilter bestanden hat. ;-)
Möglichder Nachteil dieses Verfahrens: Verwirrungen durch Änderung der
chronologischen Reihenfolge von Beiträgen.
Mark B. schrieb:> Super! Endlich mal jemand der was macht.
Danke für das Lob. Denn es ist durchaus nicht so, dass bisher keiner
was macht: die fraglichen Posts/Threads löschen sich nicht von selbst.
Es ist aber auch so, dass wir hier mit dem derzeitigen "Löschverfahren"
offenbar ein lokales Maximum erreicht haben. Und jeder Aufwand, der den
jetzigen Aufwand bei nicht wesentlich besseren Ergebnissen übersteigt,
ist zu viel Aufwand. Zu viel Aufwand allein für (bzw. gegen) sinnloses
Getrolle.
Denn die Threads/Posts von Matthis und Moby und anderen
(vorübergehenden) Dautertrollen sind eigentlich leicht zu finden und zu
entfernen.
Spannender wird es doch bei "alltäglichen" Trollen. Also solchen, die
recht "normal" einen Thread (vielleicht sogar mit einer realen Situation
und einer resultierenden Frage) beginnen und dann tatsächlich andere
Nutzer an der Nase herumführen.
Robin M. schrieb:> sammle ich Daten über gelöschte Threads hier im Forum
Das Problem sind eigetnlich nicht "zu löschende Threads", sondern viel
mehr "zu löschende Posts" in ansonsten völlig harmlos verlaufenden
Threads.
Oder verwechsle ich hier was?
> Ich verwende derzeit alle Threads, die ich bis zum 11.08.2018> aufgezeichnet habe als Referenz
Ab wann?
Threads zu welchen Themen aus welchen Foren?
> 'total': 528
Denn ich komme allein für einen Tag (gestern Mo. 20.8.18) auf mehr als
1300 neue Posts.
Bin verwirrt... :-|
> Dagegen wurden 70% aller Trolle korrekt erkannt, sodass deren Threads> niemals veröffentlicht worden wären.> ...> Ein Troll dessen Beiträge nicht mehr veröffentlicht werden, wird den> Spaß am trollen verlieren.
Du setzt "Thread = Post"?
> der Mehraufwand für die Moderation ist also gleich Null.
Der Mehraufwand für die Erstellung, der Programmierung und (vor Allem)
der Pflege des Tools wurde in dieser Rechnung aber einfach ebenfalls mit
0 angesetzt?
> Dagegen wurden 70% aller Trolle korrekt erkannt, sodass deren Threads> niemals veröffentlicht worden wären.
Da klingelt es bei mir: Pareto-Prinzip?
Muss ich diese Zahl etwa so betrachten: die 70% automatisch gelöschten
Posts brauchen derzeit 30% der "Löschzeit" (also Lesen und Erkennen,
dass der Post Müll ist) und die verbleibenden 30% der noch zu löschenden
Posts brauchen 70%?
Dann hätten wir 30% Moderationszeit "eingespart".
> Es gab kein einziges false positive
Es wird aber sicher kommen. Selbst menschliche Moderatoren bekommen
sowas hin. Und dann möchte ich den Zinnober und das "Zensur,
Zensur"-Geschrei beim ersten "false positive" hören, wenn es "Das
System" war und nicht jemand, auf den man zeigen könnte.
> Ich werde nun noch ein wenig experimentieren und dann Details zu meinem> Verfahren sowie den Code als eine Art Spende für das Forum bekanntgeben.
Das gefällt mir. Ich bin gespannt... ;-)
Aber wie gesagt: das Problem sind im Prinzip nicht die paar Threads,
die von Trollen neu aufgemacht werden (da haben wir gerade halt ein
paar Problemfälle, aber das geht vorüber...), sondern vorrangig einzelne
Posts, die von beliebigen, temporären (und damit lexikalisch und
verbal unabhängigen) Trollen in störerischer Absicht in bestehende
Threads eingebracht werden.
M.A. S. schrieb:> Verwirrungen durch Änderung der chronologischen Reihenfolge von Beiträgen.
Doch noch einer drauf gekommen... ;-)
Lothar M. schrieb:> Mark B. schrieb:>> Super! Endlich mal jemand der was macht.> Danke für das Lob. Denn es ist durchaus nicht so, dass bisher /keiner/> was macht: die fraglichen Posts/Threads löschen sich nicht von selbst.
So war es freilich nicht gemeint. Ich meinte: Endlich mal jemand, der
eine Lösung in Software für das Trollproblem entwickelt.
Ja und das versteh ich eben auch nicht: Wieso erkennt die Foren-Software
nicht, dass jemand zweimal oder dreimal hintereinander den exakt selben
Text postet? Sowas ist doch nun wirklich leicht zu erkennen.
EDIT:
Diese Beiträge wurden nun durch einen Moderator gelöscht. Aber genau das
wäre gar nicht nötig - man könnte die Lösung des Problems eben
automatisieren.
Lothar M. schrieb:> Aber wie gesagt: das Problem sind im Prinzip nicht die paar Threads,> die von Trollen neu aufgemacht werden (da haben wir gerade halt ein> paar Problemfälle, aber das geht vorüber...)
Dein Optimismus in Ehren, aber das geht nun schon seit etlichen Monaten
so.
Von daher vermag ich die Einschätzung "aber das geht vorüber" nicht so
recht zu teilen.
Mark B. schrieb:> Super! Endlich mal jemand der was macht.
Also das finde ich jetzt ziemlich unfair gegenüber den Mods die sich
hier den Arsch für uns aufreissen. Die müssen unzumutbares Zeug lesen,
löschen, sich aufs Übelste beschimpfen lassen - und sich jetzt von Dir
auch noch anhören, daß sie nichts tun würden? Wie unverschämt!
Karl Käfer schrieb:> Mark B. schrieb:>> Super! Endlich mal jemand der was macht.>> Also das finde ich jetzt ziemlich unfair gegenüber den Mods die sich> hier den Arsch für uns aufreissen. Die müssen unzumutbares Zeug lesen,> löschen, sich aufs Übelste beschimpfen lassen - und sich jetzt von Dir> auch noch anhören, daß sie nichts tun würden? Wie unverschämt!
Kannst Du bitte richtig lesen und nicht nur selektiv? Danke.
Mark B. schrieb:> So war es freilich nicht gemeint. Ich meinte: Endlich mal jemand, der> eine Lösung in Software für das Trollproblem entwickelt.
Wie wärs jeder Nutzer könnte einen persönlichen Threshold einstellen für
den Score-Wert des Postings und alle Beiträge die einen schlechteren
Score haben werden durch ein kleines Aufklapp-Symbol ersetzt, inclusive
aller Beiträge die direkt oder indirekt drauf geantwortet haben?
Dann müsste es in den vom Thema abschweifenden Seitenästen eines Threads
wesentlich ruhiger werden weil weniger Leute es sehen und dadurch auf
die Palme getrieben werden und sich genötigt sehen zu antworten und
selbst wenn welche antworten sieht man es nicht weil man den ganzen
Seitenast einfach ausgeblendet hat.
Und dann kann auch keiner mehr "Löschmod" schreien, denn er wird ja
nicht gelöscht.
Sheeva P. schrieb:> Bernd K. schrieb:>> Der Filter klassifiziert von da an automatisch und auch das was er nur>> um Haaresbreite als Troll/Spam erkannt hat landet ebenfalls in seinem>> Datenbestand fürs nächste Training, manchmal muß ein mod vielleicht noch>> nachhelfen und korrigieren aber irgendwann lernt er es weil seine>> Trainingsdaten ja immer aktualisiert werden.>> Einen Filter mit sich selbst zu trainieren, führt nahezu zwangsläufig zu> einer selbsterfüllenden Prophezeihung.
Genau darauf zielte mein letzter Beitrag ab.
> Daher war und ist mein Vorschlag,> als Trollposts erkannte Beiträge nicht sofort, sondern erst nach einer> manuellen Prüfung durch die Moderatoren zu veröffentlichen.
Ich weiß, Du meinst es technisch, gleichwohl ist die Wortwahl "erkannt"
gleichermaßen unpassend wie bezeichnend; "vermutet" träfe es
möglicherweise besser.
Ich halte es zudem für möglich, dass der Filter die Mods trainiert,
unmerklich und unbemerkt. Sicher, das ginge nur gaaanz langsam. Aber ich
möchte nicht darauf vertrauen müssen, dass es nicht geschieht!
Selbsterfüllende Prophezeihung trifft es übrigens nicht genau. Eine
solche läge zB dann vor, wenn ein Mod einen User immer wieder (auch ohne
Gund) des Trollens ziehe und dieser dann tatsächlich zu trollen begänne.
Statistiker schrieb:> Gepostete Beiträge: 209> Gelöschte Beträge: 112> Löschquote: > 50 Prozent
...gefühlt sogar mehr. :)
Das ist aber kein Wunder, wenn sich hier Trollbots herumtreiben, die
jeden "Beitrag" vielfach senden.
(Wie schon jemand weiter oben schrieb: Vielfach-Posts müssten doch
wirklich leicht automatisch unterdrückt werden können, oder?!)
M.A. S. schrieb:> Sheeva P. schrieb:>> Daher war und ist mein Vorschlag,>> als Trollposts erkannte Beiträge nicht sofort, sondern erst nach einer>> manuellen Prüfung durch die Moderatoren zu veröffentlichen. ...>> .... Nicht als>> Trollposts erkannte Beiträge können dann trotzdem sofort oder nach einer>> minimalen Zeitverzögerung veröffentlicht werden, und niemand würde>> wissen, ob der Beitrag gerade von einem schlaflosen Moderator>> freigeschaltet worden ist oder ob er den Trollfilter bestanden hat. ;-)>> Möglichder Nachteil dieses Verfahrens: Verwirrungen durch Änderung der> chronologischen Reihenfolge von Beiträgen.
Das ist korrekt, allerdings wird ja vor allem nachts ein signifikanter
Anteil der Threads von den bekannten Trollen eröffnet. Man könnte
allerdings auch alle Folgepostings in die Zeitschleife schicken, aber
das gefällt mir irgendwie auch nicht.
Wie dem auch sei: mir geht es zunächst einmal um die Identifizierung von
Trollposts. Wie dann mit identifizierten Trollposts umgegangen wird,
steht auf einem anderen Blatt.
Wenn ein Trollpost von einem Mod gelöscht wird, und während dieser
Zeit schon Antwortposts erschienen sind, dann haben wir ja das
Selbe, wie wenn ein Trollpost automatischt gelöscht wurde...
Sämtliche Antworten oder Folgeposts, die gespeichert werden sollten,
um den Zusammenhang zu wahren, wären nur eine weitere Belastung für
die Mods...
Auch werden nachträglich oft sinnlose Kommentare gelöscht, die
auch nachträglich niemand mehr lesen kann, trotzdem oft aber
ein Kommentar zu lesen ist, der scheinbar ohne Bezug im Raum steht...
Aber das lässt sich nicht vermeiden, falls ein Thread schon vorher,
ohne Eingreifen der Mods im Abgrund versunken wäre...
Es ist schlicht unmöglich, nach einigen (zu Recht) gelöschten
Beiträgen immer den darauf folgenden Sinn zu erhalten...
Ich denke, mit dem müssen wir leben!
Hm, schade, wir scheinen den TO verloren zu haben. BlackUC/Robin, wenn
Du noch hier mitliest: würde es Dir etwas ausmachen, alle Deine Daten
mit je einem Marker Gelöscht/Nicht gelöscht zu veröffentlichen, damit
auch andere damit herumexperimentieren können? Lieben Dank!
Robin M. schrieb:> Wie im Thread Beitrag "Transparenz für uC Net" bereits angedeutet,> sammle ich Daten über gelöschte Threads hier im Forum und versuche> daraus Methoden abzuleiten, um Trollthreads frühzeitig zu erkennen und> ihre Veröffentlichung zu verhindern.
Das ist ein nobles Ziel, aber letztendlich zum Scheitern verurteilt:
denn wenn der Troll das merkt, dann aendert er eben seine Muster, bis
hin zum Posten von unverstaendlichem Kauderwelsch.
Mit Trollen muss man einfach bis zu einem gewissen Grad leben. Der
Aufwand fuer das Loeschen ist ca. 1/100stel von dem was der Troll fuer's
Posten investieren muss, damit koennen wir auch laengerfristig leben.
Was hilft ist letztendlich nur der alte Rat: Trolle bitte nicht
fuettern.