Risiken und Schutzmaßnahmen bei der Nutzung von Retrieval Augmented Generation

Agentic AI – handelnde KI Sicherheitsstrategien für Retrieval Augmented Generation

24.02.2025 Ein Gastbeitrag von Dr. Morton Swimmer 4 min Lesedauer

Anbieter zum Thema

TREND MICRO Deutschland GmbH

fsas-afc-horizontal-2-positive-rgb-nov24 (Fsas)

Fsas Technologies GmbH

FAST LTA GmbH

FTAPI Software GmbH

Mit steigendem KI-Einsatz wächst der Bedarf an individuellen Lösungen. Retrieval Augmented Generation (RAG) adressiert dies, birgt aber Risiken durch ungeschützte Vektorspeicher und LLM-Hosting-Plattformen, die Datenlecks und unbefugte Zugriffe begünstigen.

Die Zukunft der KI liegt in agentenbasierten Systemen, die LLMs, Speicher und Workflows miteinander integrieren. Diese Systeme bieten neue Möglichkeiten, erfordern jedoch auch erweiterte Sicherheitsstrategien. (Bild: Naseem - stock.adobe.com) — Die Zukunft der KI liegt in agentenbasierten Systemen, die LLMs, Speicher und Workflows miteinander integrieren. Diese Systeme bieten neue Möglichkeiten, erfordern jedoch auch erweiterte Sicherheitsstrategien.
(Bild: Naseem - stock.adobe.com)

Mit dem zunehmenden Einsatz von Künstlicher Intelligenz (KI) in Unternehmensprozessen wächst die Nachfrage nach maßgeschneiderten KI-Lösungen, die firmenspezifischen Anforderungen gerecht werden können. Hier kommt Retrieval Augmented Generation (RAG) ins Spiel: Mit der Technologie können Unternehmen individuelle und kosteneffiziente Anwendungen auf Basis privater Daten entwickeln. Doch die Implementierung von RAG-Systemen birgt erhebliche Sicherheitsrisiken, wie ungeschützte Vektorspeicher und LLM-Hosting-Plattformen, die Datenlecks und unbefugte Zugriffe begünstigen. Eine umfassende Sicherheitsstrategie ist daher unerlässlich.

RAG kombiniert Vektorspeicher und Large Language Models (LLMs), um relevante Informationen effizient abzurufen und zu verarbeiten. Vektorspeicher, wie ChromaDB und Weaviate, speichern wiederum Textbausteine und helfen, relevante Daten zu finden. LLMs, wie llama.cpp und Ollama, verarbeiten diese Daten anschließend weiter. Beide Komponenten sind jedoch anfällig für Sicherheitslücken: Fehler bei der Datenvalidierung und Denial-of-Service-Angriffe sind häufig – und der schnelle Entwicklungszyklus von RAG-Systemen erschwert die Behebung von Schwachstellen.

Die Implementierung von LLMs birgt Gefahren, aber es gibt effektive Strategien, um sowohl interne als auch externe Risiken zu reduzieren. (Bild: scaliger - stock.adobe.com)

Exponierte Systeme und ihre Gefahren

Die Sicherheitslücken in RAG-Systemen sind vielfältig und betreffen sowohl die Infrastruktur als auch die Datenverarbeitung. Ungeschützte Vektorspeicher können beispielsweise sensible Informationen preisgeben, die für unbefugte Dritte zugänglich sind. Dies betrifft insbesondere personenbezogene Daten und geschäftskritische Informationen, die in den Vektorspeichern abgelegt sind. Ein weiteres Risiko besteht in der Manipulation der gespeicherten Daten, was die Integrität der generierten Ergebnisse gefährden kann.

Untersuchungen von Trend Micro zeigen, dass viele RAG-Komponenten ungeschützt im Internet zugänglich sind, wobei Deutschland im internationalen Vergleich auf Rang 3 der Länder mit den meisten exponierten RAG-Systemen steht und somit besonders stark betroffen ist. Insgesamt wurden bei den Untersuchungen 80 exponierte llama.cpp-Server identifiziert, von denen 57 keine Authentifizierung erforderten. Ollama-Server waren noch stärker betroffen, mit über 3.000 frei zugänglichen Instanzen. Angreifer können hier selbst ohne ausreichende Authentifizierung auf die Modelle zugreifen, sie manipulieren oder sogar löschen, was verheerende Folgen haben kann – insbesondere, wenn die Modelle in geschäftskritischen Anwendungen eingesetzt werden. Die Möglichkeit, Modelle zu kopieren oder zu löschen, stellt demnach ein erhebliches Risiko für das geistige Eigentum eines Unternehmens dar.

In den Open-Source-LLMs ChuanhuChatGPT, Lunary und LocalAI finden sich schwerwiegende Sicherheitslücken. (Bild: Dall-E / KI-generiert)

Sicherheitsmaßnahmen für RAG-Systeme

Um die Sicherheit von RAG-Systemen zu gewährleisten und sich gegen Risiken zu wappnen, sollten Unternehmen eine Reihe von Maßnahmen ergreifen. Dabei muss sowohl die Kommunikation zwischen Frontend und Backend angemessen geschützt werden, als auch der Zugriff der Benutzer auf das System.

Um die Kommunikation innerhalb des Systems zu sichern, sind folgende Maßnahmen zu empfehlen:

Starke Authentifizierung: Die Implementierung robuster Mechanismen wie einer Multi-Faktor-Authentifizierung (MFA) zwischen Front- und Backend kann eine zusätzliche Sicherheitsebene bieten und so unbefugten Zugriff verhindern. Um eine solche Maschine-zu-Maschine-MFA umzusetzen, kann beispielsweise zusätzlich zu einem Token (wie JSON Web Token) ein Client-Side-Zertifikat genutzt werden. Damit kann der Server anhand zweier verschiedener Kriterien feststellen, ob es sich um eine legitime Verbindung handelt.

TLS-Verschlüsselung: Durch den Einsatz von Transport Layer Security (TLS) kann die Kommunikation zwischen den Komponenten verschlüsselt werden. Dies schützt die Daten während der Übertragung vor unberechtigtem Zugriff und Manipulation.

Mit der Verbreitung KI-gestützter Tools sehen sich Unternehmen mit einem deutlichen Anstieg ihrer Cyberrisiken konfrontiert – sowohl in Qualität, als auch, was deren Quantität betrifft. (Bild: Grandpas - stock.adobe.com)

Um den Zugriff von Usern auf RAG-Systeme sicher zu gestalten, helfen Maßnahmen wie:

Zero-Trust-Ansatz: Die Einführung eines Zero-Trust-Sicherheitsmodells, bei dem jede Verbindung als potenziell unsicher betrachtet wird, bietet zusätzlichen Schutz. Nur autorisierte Verbindungen sollten zugelassen werden, was durch strikte Zugangskontrollen und kontinuierliche Überwachung erreicht werden kann.

Sicherheitsbewusstsein und Schulung: Mitarbeiterschulungen für den verantwortungsvollen Umgang mit sensiblen Daten und die Erkennung von Sicherheitsbedrohungen sind zudem unverzichtbar. Nur ein gut geschultes Team kann potenzielle Risiken frühzeitig erkennen und darauf reagieren.

Datenzugriffskontrollen: Strenge Zugriffskontrollen für Vektorspeicher und LLMs stellen sicher, dass nur autorisierte Benutzer Zugriff auf sensible Daten erhalten. Außerdem sollten alle Zugriffe protokolliert und überwacht werden.

Zudem können durch regelmäßige Sicherheitsaudits und Penetrationstests Schwachstellen identifiziert und behoben werden. Dies hilft außerdem, um die Sicherheitslage kontinuierlich zu verbessern.

Chatbots, die auf Large Language Models (LLMs) basieren sind vielfach eine „Black Box“. Diese Intransparenz macht die Systeme anfällig für Angriffe. (Bild: Somchai - stock.adobe.com)

Fazit

Die Zukunft der KI liegt in agentenbasierten Systemen, die LLMs, Speicher und Workflows miteinander integrieren. Diese Systeme bieten neue Möglichkeiten, erfordern jedoch auch erweiterte Sicherheitsstrategien. Unternehmen müssen sicherstellen, dass ihre Daten und Systeme vor Missbrauch geschützt sind, um die Vorteile von GenAI-Technologien voll auszuschöpfen.

RAG bietet erhebliche Vorteile für die Entwicklung effizienter Anwendungen, birgt jedoch auch Sicherheitsrisiken. Unternehmen müssen daher umfassende Sicherheitsstrategien implementieren, um ihre Systeme und Daten zu schützen. Die Integration von Zero-Trust-Prinzipien und die Sicherstellung einer robusten Authentifizierung sind dabei entscheidend, um die Integrität und Vertraulichkeit von RAG-Systemen zu gewährleisten. Die strategische Bedeutung von RAG für die IT-Branche liegt in der Balance zwischen Innovation und Sicherheit.

Über den Autor: Dr. Morton Swimmer ist Principal Threat Researcher bei Trend Micro.

(ID:50326021)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zur IT-Sicherheit

Geschäftliche E-Mail

Bitte geben Sie eine gültige E-Mailadresse ein.

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Stand: 08.12.2025

Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.

Einwilligung in die Verwendung von Daten zu Werbezwecken

Ich bin damit einverstanden, dass die Vogel IT-Medien GmbH, Max-Josef-Metzger-Straße 21, 86157 Augsburg, einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von Newslettern und Werbung nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.

Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.

Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.

Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.

Recht auf Widerruf

Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung.