Viele Daten aus LinkedIn Ungeschützte Datenbank mit 4,3 Milliarden Datensätzen offengelegt

Von Melanie Staudacher 3 min Lesedauer

Anbieter zum Thema

Cybernews entdeckte eine ungeschützte MongoDB-Datenbank mit über 4,3 Milliarden Datensätzen. Diese 16 Terabyte große Sammlung von personen- und unternehmensbezogenen Daten könnte für Phishing- und Betrugs­angriffe missbraucht werden.

Die ungeschützte Datenbank enthält über 4,3 Milliarden Datensätze, darunter persönliche Informationen wie Namen, E-Mail-Adressen, Telefonnummern, Berufshistorie und LinkedIn-URLs, die teilweise von LinkedIn stammen.(Bild: ©  Tee11 - stock.adobe.com)
Die ungeschützte Datenbank enthält über 4,3 Milliarden Datensätze, darunter persönliche Informationen wie Namen, E-Mail-Adressen, Telefonnummern, Berufshistorie und LinkedIn-URLs, die teilweise von LinkedIn stammen.
(Bild: © Tee11 - stock.adobe.com)

Milliarden von Datenschätzen und Terabytes an personenbezogenen Informationen: Das For­schungs­team von Cybernews berichtet, eine ungeschützte Datenbank im Netz entdeckt zu haben, die mehr als vier Milliarden Datensätze enthielt. Diese Datensätze hätten das Ziel der Leadgenerierung gehabt, denn darunter seien 16 Terabyte an beruflichen wie auch unter­neh­mens­bezogenen Daten gewesen, wie zahlreiche LinkedIn-URLs und Profilnamen.

Gut strukturierte, personenbezogene Daten

Das Forschungsteam weist darauf hin, dass solch große Kontaktdatenbanken Unternehmen zwar viel Zeit sparen können, aber auch ein großes Sicherheitsrisiko bergen. Denn sind diese Datenbanken ungeschützt, gefährden sie die Privatsphäre von Millionen Menschen. Genau dies sei nun passiert, als das Cybernews-Team am 23. November 2025 eine MongoDB-Instanz mit 16,14 Terabyte an beruflichen und unternehmensbezogenen Daten ungeschützt im Netz fand. Die Forscher hätten knapp 4,3 Milliarden, gut strukturierte, Dokumente entdeckt. Cybernews geht davon aus, dass die Datenbank aufgrund menschlicher Fehler keine ausreichende Au­then­tifizierung besaß.

In dem Datensatz seien neun Sammlungen entdeckt worden, wobei der jeweilige Name die Art der darin enthaltenen Informationen vermuten ließ. Cybernews identifizierte folgende Samm­lungen:

  • „intent“: ​​2.054.410.607 Dokumente (604,76 GB)
  • „profiles“: 1.135.462.992 Dokumente (5,85 TB)
  • „unique_profiles“: 732.412.172 Dokumente (5,63 TB)
  • „people“: 169.061.357 Dokumente (3,95 TB)
  • „sitemap“: 163.765.524 Dokumente (20,22 GB)
  • „companies“: 17.302.088 Dokumente (72,9 GB)
  • „company_sitemap“: 17.301.617 Dokumente (3,76 GB)
  • „address_cache“: 8.126.667 Dokumente (26,78 GB)
  • „intent_archive“: 2.073.723 Dokumente (620 MB)

Zwei Tage nach der Entdeckung habe der Betreiber der Datenbank diese abgesichert. Wie lange die Instanz tatsächlich schon ungeschützt war, sei nicht bekannt. Auf jeden Fall ist so eine große Datenbank ein attraktives Ziel für Cyberkriminelle, die mit den vielen persönlichen In­for­ma­tionen groß angelegte Angriffe durchführen können.

Drei der Sammlungen, die fast zwei Milliarden Datensätze enthielten, hätten teils personenbezogene Informationen enthalten, darunter:

  • Vollständige Namen
  • E-Mail-Adressen und Telefonnummern
  • LinkedIn-URLs und Profilnamen
  • Berufsbezeichnungen, Arbeitgeber, beruflicher Werdegang
  • Ausbildung, Abschlüsse, Zertifizierungen
  • Standortdaten
  • Sprachen, Fähigkeiten, Funktionen
  • Social-Media-Konten
  • Bild-URLs (eindeutige Profile)

Die identifizierten Daten in den Sammlungen sowie die Datenbanksturktur deuten laut Cy­ber­news darauf hin, dass die Datenbank mittels LinkedIn-Scraping erstellt wurde. Dies ist eine Methode, bei der Profil-, Unternehmens- und Jobdaten von LinkedIn automatisch extrahiert werden. Meist, um sie später für Marketing, Rekrutierung oder Marktforschung zu verwenden. Ob die Datensätze aktuell sind, sei nicht einfach zu bestimmen. Ein Aktualisierungsstempel der Datenbank deute darauf hin, dass die Informationen aus LinkedIn bis 2025 erfasst und/oder aktualisiert worden seien. Doch bereits 2021 behaupteten Cyberkriminelle, Hunderte Millionen LinkedIn-Datensätze extrahiert zu haben. Die nun offengelegte MongoDB-Datenbank könnte also auch ältere Datensätze aus 2021 enthalten.

Wem gehören die geleakte Daten?

Wem die Datenbank gehört, kann Cybernews derzeit nicht mit Sicherheit sagen. Allerdings gebe es Hinweise auf den Eigentümer. Wie das Team entdeckt habe, enthielt die Datenbank Sitemap-Sammlungen, die die Sammlungen „/people“ und „/company“ mit der Webseite eines Unter­neh­mens für Leadgenerierung verknüpften.

Warum ist das Datenleck gefährlich?

Ungeschützte Datenbanken, die personen- und unternehmensbezogene Daten gut strukturiert be­reit­stellen, sind ein gefundenes Fressen für Cyberkriminelle, um die Daten für gezielte Phi­shing-Angriffe zu nutzen. Die Angreifer könnten gezielt CEOs aus den Datensätzen auswählen und Betrugsangriffe durchführen. Außerdem könnten die Akteure die Infor­ma­tionen über Unternehmen nutzen, um Schwachstellen zu finden, um in deren Systeme einzudringen.

(ID:50656647)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung