Künstliche Intelligenz und maschinelles Lernen

KI und ML in der Cybersecurity

| Autor / Redakteur: Klaus Nemelka / Peter Schmitz

Künstliche Intelligenz, maschinelles Lernen und Deep Learning werden oft miteinander verwechselt und für das Gleiche gehalten.
Künstliche Intelligenz, maschinelles Lernen und Deep Learning werden oft miteinander verwechselt und für das Gleiche gehalten. (Bild: gemeinfrei / Pixabay)

Künstliche Intelligenz (KI), maschinelles Lernen (ML) und Deep Learning (DL) haben das Potenzial, die Produktivität in vielen Branchen zu steigern. Die drei Begriffe werden oft synonym verwendet, aber worin unterscheiden sie sich wirklich? Wo werden sie gegenwärtig und wahrscheinlich zukünftig eingesetzt? Wie funktionieren sie und welche Vor- und Nachteile gibt es?

Künstliche Intelligenz, maschinelles Lernen und Deep Learning werden oft miteinander verwechselt und für das Gleiche gehalten. Sie haben ähnliche Eigenschaften, unterscheiden sich aber: Einfach ausgedrückt ist Deep Learning eine Teilmenge des maschinellen Lernens, das wiederum eine Teilmenge der künstlichen Intelligenz ist.

Das übergeordnete Thema oder Ziel der künstlichen Intelligenz ist die Entwicklung von Computerprogrammen, die in der Lage sind, intelligente, menschenähnliche Funktionen auszuführen. Im Folgenden werden wir nun präziser auf die Elemente eingehen, die ML, DL und KI voneinander unterscheiden – nach bestem Wissen und Gewissen, denn gibt es teilweise unterschiedliche Auffassungen der Technologie- und Wissenschaftswelt darüber, wo die Trennlinien verlaufen.

Wie funktioniert künstliche Intelligenz?

Wie bereits erwähnt, ist künstliche Intelligenz Computerprogrammierung mit der Fähigkeit, wie ein menschliches Gehirn zu arbeiten. Das ist eine äußerst schwierige Aufgabe und die meisten würden zustimmen, dass wir noch lange nicht dieses Niveau der Programmierung erreicht haben. Aufgrund der verschwommenen Grenzen, die KI definieren, ist es schwer zu sagen, wann die erste KI-Programmierung konzipiert wurde, aber das Interesse, die Verbindung zwischen menschlicher und maschineller Intelligenz zu finden, lässt sich bis in die späten 1940er Jahre und Anfang der 1950er Jahre zurückverfolgen.

Eine große Entwicklung in der KI war John McCarthys Einführung der Lisp (List Processing) -Programmiersprache im Jahr 1958. Sie ist nach Fortran die zweitälteste Programmiersprache, die noch verbreitet ist, und wird insbesondere von denen verwendet, die mit KI arbeiten. Die derzeit größte Annäherung an künstliche Intelligenz verkörpert durch einen programmierten Humanoiden ist wohl Sophia, die bei ihrer Vorstellung 2017 für große Wellen sorgte: Sie imitiert menschliche Gestik und Mimik[ und kann bestimmte Fragen beantworten und einfache Gespräche führen.

Ein grundlegendes Problem der KI liegt darin, dass es noch immer Teile des menschlichen Gehirns gibt, die wir noch nicht verstehen, was es in der Folge schwierig (bis unmöglich) macht, eine perfekte Replik dessen zu erstellen. Nichtsdestotrotz gibt es bereits jetzt einige nützliche Erscheinungsformen, die mittlerweile tagtäglich genutzt werden:

  • Spracherkennung und das verstehen von Sprachen
  • Smart-Home-Geräte, die selbstständig arbeiten
  • Routenplaner, die mit Hilfe von KI Straßen und Verkehr scannen und so eine möglichst effiziente Route erstellen

Wie funktioniert maschinelles Lernen?

Maschinelles Lernen ist ein Ansatz der künstlichen Intelligenz. ML unterscheidet sich unter anderem dadurch von anderen Arten der Programmierung, dass es mittels (von Menschen entwickelten) Algorithmen aus großen Datenmengen lernen kann, um so bestimmte Aufgaben zu erfüllen. Die Algorithmen sind somit in der Lage, zu lernen und sich an neue Daten anzupassen, so dass die Maschine (fast) wie ein Mensch denken und handeln kann. Die Algorithmen kann man dabei in zwei Gruppen unterteilen:

  • Überwachtes Lernen: Der Computer erhält Parameter oder Beispiele, mit denen er Dateneingaben vergleichen kann.
  • Unüberwachtes Lernen: Der Computer erhält nur Daten und findet bzw. erkennt die Beziehungen zwischen ihnen selbstständig.

Arthur Samuel, einer der Vorreiter des ML, erklärte in seinem IBM-Papier von 1959, dass „die Programmierung von Computern, die aus ihrer Erfahrung lernen, letztendlich die Notwendigkeit eines Großteils dieses detaillierten Programmieraufwands beseitigen sollte.“ ML-Programme verbessern sich selbständig auf der Grundlage neuer Dateneingaben und vergangener Datenmuster, erfordern aber eine gewisse menschliche Führung, um ihre allgemeine Verbesserungsfähigkeit zu erhöhen. Maschinelles Lernen wird in den verschiedensten Bereichen eingesetzt, u.a. hier:

  • Cybersicherheitsalgorithmen, die unnötige Zugriffe und andere Sicherheitsrisiken identifizieren.
  • Musikgenerierende Algorithmen, die die beste Songauswahl für einen Benutzer basierend auf seinen Präferenzen vorhersagen.
  • GE setzt ML ein, um den Wartungsbedarf seiner Anlagen und andere Optimierungsmetriken vorauszusagen und auf diese Weise einen reibungslosen Betrieb zu ermöglichen.

Maschinelles Lernen vs. Statistik

Kritiker werfen gerne die Frage auf, ob die ML-Prozesse revolutionär sind oder nur grundlegende Mathematik und Statistik verwenden. Zweifellos gehen maschinelles Lernen und Datenwissenschaft Hand in Hand, aber was unterscheidet ML von der Statistik, wenn sie beide Datenmuster verwenden, um die Wahrscheinlichkeit oder Unwahrscheinlichkeit verschiedener Situationen aufzuzeigen?

Es ist leider zu konstatieren, dass der Marketinghype die Realität und den praktischen Nutzen seit Jahrzenten übertrifft. Die Kombination aus schnellerer Hardware, besseren Modellen und einem besseren Verständnis, wofür maschinelle Lernsysteme geeignet sind, führt oft auch dazu, dass Softwareanwendungen, die letztlich nur Basis-Statistik verwenden, gerne als „Artificial Intelligence-Driven“ vermarktet werden. All das macht natürlich eine Beurteilung der Technologie und die Frage nach ihren Auswirkungen sehr schwierig. Prinzipiell muss ja nicht alles mittels maschinellem Lernen gelöst werden, wenn es auch (einfacher) mittels Statistik geht. Systeme des maschinellen Lernens und der künstlichen Intelligenz sollten das letzte Mittel sein, das nur dann eingesetzt werden sollte, wenn traditionelle Organisationsmethoden, Musterabgleiche und Statistiken nicht ans Ziel geführt haben.

Künstliche Intelligenz, maschinelles Lernen und Cybersecurity

Im Bereich der IT-Sicherheit spielt vor allem maschinelles Lernen eine Rolle. Und obwohl beim ML auch einige Deep Learning-Techniken angewendet werden, ist die Zeit von Deep Learning als Ganzes eher vorbei. Auch wenn die Marketingbotschaften und teilweise die Berichterstattung etwas anderes suggerieren mag: Maschine Learning ist kein Security-Allheilmittel, kann aber den Sicherheits- und IT-Teams viel Unterstützung bieten. Zwar hat ML noch einen langen Weg vor sich, bevor es ohne menschliches Zutun für die Gefahrenerkennung eingesetzt werden kann, aber es gibt viele Aufgaben, die es bewältigen kann, um die Sicherheit zu erhöhen. Zu den Vorteilen zählen:

  • Klassifizierung: Programme klassifizieren Daten basierend auf vorgegebenen Parametern.
  • Clustering: Für Daten, die nicht zu den voreingestellten Parametern passen, gruppiert ML Daten basierend auf ihren Ähnlichkeiten oder Anomalien.
  • Empfehlungen: Programme lernen aus früheren Entscheidungen, Inputs und Assoziationen, um Ansätze und Entscheidungen zu empfehlen.
  • Generative Frameworks: Basierend auf früheren Dateneingaben generieren Programme Möglichkeiten, die auf Daten angewendet werden können, die bislang noch nicht in diesem Kontext einbezogen wurden.
  • Prognosen: Programme erstellen Vorausschauen auf der Grundlage von Daten und vergangenen Ereignissen.

Vorteile und Einsatzgebiete

Cybersicherheit muss angesichts gesetzlicher Vorgaben wie der DSGVO und immer ausgefeilteren Angriffen zur Top-Priorität von Unternehmen werden. Datenschutzverletzungen, Datendiebstähle und andere Angriffe werden immer häufiger und können zu enormen finanziellen Schäden und Geschäftsausfällen führen. Abhängig von der Größe und den Anforderungen eines Unternehmens kann ML-basierte Sicherheitssoftware eine sinnvolle Nutzung des Cybersicherheitsbudgets sein. Gerade angesichts eingeschränkter Budgets und unterbesetzter IT-Sicherheitsteams kann ML zu einer wesentlichen Entlastung führen. Zahlreiche sicherheitskritische Prozesse können dank ML wesentlich schneller und präziser durchgeführt werden als es durch eine manuelle Bearbeitung der Fall wäre. So sind fortschrittliche Datensicherheitslösungen in der Lage, einen „Normalzustand“ für jeden Benutzer in einem Unternehmen zu erstellen, indem sie die Arten von Daten, auf die er zugreift, abbildet und überwacht. Nach einer gewissen Zeit erkennt das System automatisch, wenn jemand keinen Zugang mehr zu sensiblen Informationen benötigt und empfiehlt den Entzug der Zugriffsrechte. Die Software entwickelt diese Empfehlungen nicht nur, weil der spezifische Nutzer diese Daten nicht verwendet hat, sondern bezieht auch Vergleiche mit anderen Nutzern mit ein.

Neben schlüsselfertigen Lösungen gibt es aber auch Ansätze, die Unternehmen dabei helfen, ihre eigenen ML-Modelle zu erstellen, zu trainieren und zu verwalten, etwa Azure Machine Learning von Microsoft.

In welchen konkreten Bereichen lassen sich Cybersicherheits-Aufgaben durch den Einsatz von maschinellem Lernen vereinfachen und verbessern? Hier einige Beispiele:

  • Phishing- und Spam-Filterung: ML kann Ihrem Team helfen, interne Daten, Spam und bösartige Aktivitäten mit vorgegebenen Parametern entsprechend zu klassifizieren.
  • Forensische Analyse: ML hilft mittels Clustering, Aufschluss über die Angriffsmethode und -ziele zu erlangen. Clustering sammelt Daten und gruppiert diese, wodurch das Team die Elemente des Angriffs einfacher zusammensetzen kann.
  • Vorfallsreaktion und Risikomanagement: Durch ML lernt die Software aus den verschiedenen Aktionen, die bei verschiedenen Arten von Vorfällen durchgeführt werden. ML kann Muster und Assoziationen erkennen und darauf basierend Empfehlungen zur Risikominderung und zur Reaktion auf Vorfälle abgeben.
  • Pentesting: Ähnlich wie ein Pentester nach Schwachstellen suchen würde, können Programme Eingaben generieren, um Systeme auf Schwachstellen zu testen.
  • Präventions- und Bedrohungsmodellierung: Durch ML werden Daten gesammelt und analysiert, um betrügerische Aktivitäten vorherzusagen. Dies hilft den Sicherheitsteams, Gefahren zu erkennen, bevor sie zu einem schwerwiegenden und teuren Datenschutzverstoß oder -diebstahl werden.

Wir sehen also, dass es viele Cybersicherheitsaufgaben gibt, die durch die Implementierung von ML-Algorithmen einfacher oder effizienter gestaltet werden können. Bei optimaler Nutzung kann diese Technologie die Arbeitsbelastung massiv senken und gleichzeitig menschliche Fehler und Fehleinschätzungen reduzieren. Ein weiterer Vorteil dieser adaptiven Ansätze und Techniken ist, dass sie an die spezifischen Anforderungen eines Unternehmens oder einer Organisation angepasst werden können.

Gleichwohl kommen die meisten heute verwendeten ML-Methoden nicht ohne menschliche Eingriffe aus. Dies liegt u.a. auch daran, dass Hacker um den Einsatz von ML-Software wissen und versuchen, diese mit ihren eigenen Mitteln zu schlagen und sie in die Irre zu führen, ihre Malware so zu tarnen, dass sie auch durch ML nicht als solche identifiziert wird oder selbst ML einsetzen, um (kriminelle) Aufgaben zu erledigen.

Die Zukunft von maschinellem Lernen in der Cybersecurity

KI und ML sind längst integrale Bestandteile der Cybersicherheit und werden dies in Zukunft noch stärker sein. Die Algorithmen und Techniken verbessern nicht nur den Sicherheitsstatus des Unternehmens, sondern entlasten auch die IT-Abteilungen, die sich auf diese Weise anderen wichtigen Aufgaben widmen können.

Zudem zwingen gesetzliche Vorgaben wie die DSGVO Unternehmen dazu, ihre Cybersicherheit und ihr Datenmanagement nachhaltig zu verbessern. Die Lehre aus den ersten eineinhalb Jahren DSGVO ist, dass ein frühes Erkennen von Bedrohungen und ein profundes Reporting entscheidend sind – ML kann in beiden Bereichen die Verantwortlichen effektiv unterstützen. Auf der anderen Seite birgt das Recht auf Vergessen für KI und ML eine gewisse Problematik, da auch personenbezogene Daten in die Algorithmen einfließen und schwerlich entfernt werden können. Dieses Spannungsfeld wird noch weiter anwachsen und Politik, Wissenschaft und Gesellschaft müssen hier noch Antworten finden.

Über den Autor: Klaus Nemelka ist Technical Evangelist bei Varonis Systems.

Kommentare werden geladen....

Kommentar zu diesem Artikel

Der Kommentar wird durch einen Redakteur geprüft und in Kürze freigeschaltet.

Anonym mitdiskutieren oder einloggen Anmelden

Avatar
Zur Wahrung unserer Interessen speichern wir zusätzlich zu den o.g. Informationen die IP-Adresse. Dies dient ausschließlich dem Zweck, dass Sie als Urheber des Kommentars identifiziert werden können. Rechtliche Grundlage ist die Wahrung berechtigter Interessen gem. Art 6 Abs 1 lit. f) DSGVO.
  1. Avatar
    Avatar
    Bearbeitet von am
    Bearbeitet von am
    1. Avatar
      Avatar
      Bearbeitet von am
      Bearbeitet von am

Kommentare werden geladen....

Kommentar melden

Melden Sie diesen Kommentar, wenn dieser nicht den Richtlinien entspricht.

Kommentar Freigeben

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

Freigabe entfernen

Der untenstehende Text wird an den Kommentator gesendet, falls dieser eine Email-hinterlegt hat.

copyright

Dieser Beitrag ist urheberrechtlich geschützt. Sie wollen ihn für Ihre Zwecke verwenden? Kontaktieren Sie uns über: support.vogel.de/ (ID: 46495013 / Monitoring und KI)