Reddit Ads: wenn die Community zur Anzeige wird
Reddit will Marken dorthin bringen, wo Kaufentscheidungen wirklich fallen: und zwar mitten in die Community-Gespräche. ...
- 24 Juni, 2026
- 0 Kommentare
Google testet neues System gegen massenhaften KI-Spam im Internet.
Ein Forscherteam von Google hat in einer neuen Arbeit das neue S-CTS (Scalable Cluster Termination System) vorgestellt. Dieses soll gegen großflächig generierten KI-Spam in den SERPs und auf Plattformen wie YouTube helfen. Das S-CTS zielt auf ein häufiges Muster: Angreifer schreiben ein Basisskript und lassen daraus tausende leicht variierte Versionen erzeugen, die über viele Konten verteilt veröffentlicht werden. So entsteht eine Flut von Beiträgen, die sich im Wortlaut unterscheiden, inhaltlich aber nahezu identisch sind. Die meisten Filter stufen sie dennoch als unterschiedliche Texte ein. S-CTS setzt bei der Bedeutung des Textes und beim Verhalten der beteiligten Konten an.
Besonders zum Tragen kommt das Verfahren bei reinem Text-Spam. Anders als bei Video oder Audio entfällt hier der Zwischenschritt über Transkripte, da der Inhalt schon in Textform vorliegt. Um die Bedeutung der Inhalte zu verstehen und zu differenzieren, nutzten die Forscher in ihrer Arbeit Text-Embeddings, wie sie ein Modell vom Typ Sentence-BERT (SBERT) liefert.
Die SBERT-Modelle können Inhalte in mehreren Sprachen gemeinsam analysieren lassen. Internationale Website- oder Plattform-Betreiber können damit ähnliche Spam-Muster über Sprachgrenzen hinweg erkennen - ohne für jede Sprache ein eigenes, vollständig getrenntes System pflegen zu müssen.
Das Verfahren basiert auf dem Sprachmodell BERT, das den Wortsinn aus dem Kontext folgert. Statt reine Wortketten zu vergleichen, präsentiert SBERT jeden Beitrag in einem Vektorraum. Texte, die inhaltlich sehr ähnlich sind, liegen dort nah beieinander und werden in Clustern zusammengefasst. Parallel analysiert das System, ob mehrere auffällige Beiträge von einem Verbund verbundener Accounts stammen oder andere gemeinsame Muster zeigen.
Die Google-Forscher betonen, dass S-CTS nicht entscheiden soll, ob ein Text generell "von KI geschrieben" ist oder gegen die Google Webmaster Guidelines verstößt. Das Modell beantwortet lediglich die Frage, ob zwei Inhalte semantisch ähnlich sind. Allein das ist aber noch kein Beweis für Spam: Texte seriöser Nachrichten-Portale, die über dieselben Ereignisse berichten, liegen im Embedding-Raum ebenfalls nah beieinander.
S-CTS kombiniert deshalb zwei Ebenen: Erst werden inhaltlich ähnliche Beiträge gruppiert, dann wird geprüft, ob ein verdächtiges Verhaltensmuster vorliegt – etwa eine große Zahl nahezu bedeutungsgleicher Texte aus einem Geflecht von Accounts. Die Schwellen für automatische Maßnahmen sind laut Team bewusst konservativ gewählt, um Fehlalarme gering zu halten und legitime Inhalte zum gleichen Thema nicht zu blockieren.
Ein häufiges Problem vieler KI-Detektoren ist ihre Abhängigkeit von bestimmten Modellgenerationen: Wird ein Filter auf typische Muster eines konkreten Generators trainiert, verliert er mit dem nächsten Modellwechsel schnell an Wirkung.
S-CTS geht anders vor. Weil es nicht nach der Signatur eines bestimmten Modells sucht, sondern nach wiederkehrenden Bedeutungsstrukturen im Text. Ob ein Skript von einem älteren oder neueren Sprachmodell stammt, spielt dann keine Rolle.
Gleichzeitig hat der Ansatz Grenzen: Je stärker künftige Modelle Inhalte thematisch streuen oder gezielt Rauschen einbauen, desto kleiner und unauffälliger werden die Cluster. Angreifer könnten das ausnutzen, indem sie irrelevante Elemente mischen, um die Embeddings auseinanderzuziehen. Das Forscherteam reagiert darauf nach eigener Darstellung mit kontinuierlichen Anpassungen an neue Spam-Trends und prüft zusätzliche Signale – etwa kryptografische Herkunftsnachweise (C2PA) oder Wasserzeichenverfahren wie SynthID – als ergänzende Bausteine.
"Meaning over wording" gewinnt an Relevanz. Für SEO bzw. GEO bedeutet das: Lieber wenige, wirklich differenzierte Seiten mit klaren Zusatzinfos statt zahlreiche nahezu identische KI-Textklone. Für AI Overviews und Co. sind hochwertige, eigenständige Informationen wertvoller denn je.
Manu ist seit Oktober 2020 Teil des Backlinked-Teams und leitet seit Oktober 2022 die Redaktion. Der gelernte Technik-Journalist hat in den vergangenen Jahren vor allem Erfahrung in den Bereichen (Automobil)Versicherung, Buchhaltung/Inkasso und Jobvermittlung gesammelt. Er schreibt für User, nicht für Suchmaschinen: Seine SEO-Texte haben immer den Mehrwert der Nutzer im Fokus.
Reddit will Marken dorthin bringen, wo Kaufentscheidungen wirklich fallen: und zwar mitten in die Community-Gespräche. ...
Als ich eben den Page Speed Insights Report von backlinked.com gecheckt habe, ist mir im Bereich der Scorings ein neuer Wert aufgefallen. Google scheint die llms.txt nun ...
Wer von Google manuell abgestraft wird, verliert nicht nur Rankings in der klassischen Suche, sondern auch Sichtbarkeit in KI-Tools wie ChatGPT. Das zeigt ein aktueller F...
Kommentar hinzufügen
Ihre E-Mail-Adresse wird nicht veröffentlicht.