DarkBERT ist mit Daten aus dem Darknet trainiert – ChatGPTs dunkler Bruder?
Forscher haben ein KI-Modell entwickelt, das mit Daten aus dem Darknet trainiert ist – DarkBERTs Quelle sind Hacker, Cyberkriminelle, politisch Verfolgte.
Ein südkoreanisches Forscherteam hat das Tor-Netzwerk durchkämmt für einen Datensatz zum Training großer Sprachmodelle (Large Language Models, kurz LLM). Die auf unkonventionelle Weise beschafften Daten stammen ausschließlich aus dem Darknet, also potenziell von Hackern, Cyberkriminellen und Betrügern – sowie von politisch Verfolgten und anderen, die die Anonymität schätzen, sei es für undurchsichtige Geschäfte oder zum unbeobachteten Austausch von Informationen etwa unter einem repressiven Regime.