Was ist überhaupt… Deep Learning?
Lange scheiterten künstliche Intelligenzen noch an vielen Aufgaben, die wir -Menschen intuitiv erfassen. Sogar beim Erkennen von Gesichtern oder Objekten, dem sicheren Verstehen von Sprache oder der Erkennung von Handschriften lagen die Maschinen hinten. Doch dank Methoden wie Deep Learning holen sie auf.
Um was geht´s?
Vor etwa zehn Jahren fütterten Forscher bei Google das Google Brain, ein Netzwerk aus 1000 Computern, mit Standbildern aus Youtube-Videos. Sie liessen dem Netzwerk Zeit, nach Kategorien in den Bildern zu suchen. Nach drei Tagen lieferte Google Brain sein Ergebnis: Neben menschlichen Gesichtern und Körpern hatte es Katzen eindeutig als Kategorie erkannt. Obwohl nicht alle Menschen von dem Versuch an sich gehört haben dürften, den daraus geborenen Begriff «Cat Content» kennen die meisten. Trotzdem war die Erkenntnis, dass es im Internet viele Katzenbilder gibt, nicht das eigentlich bahnbrechende an dem Versuch. Das Interessante war, dass Google Brain das herausgefunden hatte, ohne dass es speziell mit Katzenbildern gefüttert worden ist. Google Brian hatte sozusagen selbst erkannt, dass Katzen eine eigene Kategorie bilden und hatte kombiniert, dass es sich bei der Kategorie um Katzen handelte. Eine Leistung, die Computern bis dahin nicht gelungen war.
Schon lange können Rechner Probleme lösen, die dem menschlichen Intellekt schwer fallen. Meist handelt es sich dabei um mathematisch lösbare Aufgaben, für die die Maschinen mit Formeln gefüttert werden, die sie dann weit zuverlässiger und schneller als jedes menschliche Gehirn berechnen. Ganz anders sah es dagegen lange bei Aufgaben aus, für die man Gelerntes in einen Kontext setzen oder neu kombinieren muss. Denn dafür müssen die Rechner aus Erfahrungen und Fehlern lernen und in der Lage sein, bekannte Muster auf neue Entscheidungsfälle anzuwenden. Kurz: Rechner müssen eigenständig dazulernen können. Damit sie das können, setzen Forscher weltweit auf Deep Learning.
«Zuverlässiger und schneller als jedes menschliche Gehirn.»
Wie funktioniert´s?
Deep Learning ist ein Teilbereich des maschinellen Lernens. Seine Basis bilden neuronale Netze, die es bereits seit den 1940er Jahren gibt. Doch sie konnten erst durch die grossen Datensammlungen heutiger Zeit und die gestiegene Rechenkraft ihr volles Potenzial entfalten.
Maschinelles Lernen:
Beim maschinellen Lernen wird ein Computer mit Algorithmen und Daten ausgestattet, die es ihm ermöglichen, Erfahrungswissen zu erlangen. Er wird zum Beispiel mit mathematischen Formeln gefüttert und erkennt, welche er wann anwenden muss. Oder er wird mit Katzenbildern gefüttert, bis er eine Katze erkennen kann. Diese Methode gehört zu den grundlegendsten im Bereich der künstlichen Intelligenz und sie hat an sich schon enorme Kraft entfaltet, seit die Datenmengen gestiegen sind. Denn es ist heute ein Leichtes, Rechner mit zigtausenden Katzenbildern zu versorgen.
Neuronale Netze:
An komplizierteren Fragen, wie zum Beispiel der, ob auf einem Bild eine Katze oder ein Hund ist, scheiterten die Rechner lange. Der Durchbruch kam erst, als maschinelles Lernen mit neuronalen Netzen kombiniert wurde. Künstlich erzeugte neuronale Netze sind Algorithmen, die nach dem Vorbild des menschlichen Gehirns modelliert sind. Mit ihrer Nutzung kann ein Computer in die Lage versetzt werden, einmal erworbenes Wissen auch für ganz neue Problemstellungen zu verwenden.
Ein neuronales Netz besteht dabei aus vielen miteinander verbundenen künstlichen Neuronen, die in Schichten (Layers) angeordnet sind. Zwischen der ersten Schicht, dem Input-Layer, und der letzten Schicht, dem Output-Layer, befinden sich beliebig viele so genannte Hidden-Layers. Der Input-Layer erhält die Eingabedaten, bei den Katzenbildern zum Beispiel die einzelnen Bildpixel. Jedes Neuron analysiert die ihm zugewiesene Eingabe und erzeugt dann selbst eine Ausgabe, zum Beispiel Bildpixel hell oder dunkel, schwarz oder braun. Die Ausgabe wird dann an die jeweils nächste Schicht weitergegeben. In der letzten Schicht, dem Output-Layer, gibt der Rechner an, zu welchem Ergebnis er kommt. Mithilfe von neuronalen Netzen kann ein Computer nicht nur Katzenbilder wiedererkennen, sondern zum Beispiel auch lernen, Hunde von Katzen oder Menschen zu unterscheiden.
Deep Learning:
Die beschriebenen neuronalen Netze können beliebig viele Schichten haben. Je mehr Schichten zwischen Input- und Output-Layer sind, als umso tiefer werden sie bezeichnet. Und meistens sind die Netze mit besonders vielen Schichten die, die die besten Ergebnisse liefern. Denn sie enthalten Informationen so vieler Neuronen und Schichten, dass sie kaum noch Fehler machen und zudem immer sicherer werden. Sie werden deshalb tiefe Netze genannt und unter dem Begriff Deep Learning zusammengefasst.
Je mehr Schichten ein tiefes neuronales Netz enthält, umso rechenintensiver ist seine Arbeit und umso länger dauert es, bis es trainiert ist. Es enthält komplexe algorithmische Architekturen und Millionen von Modell-Parametern. Deshalb dauert es oft Monate, bis ein solches Netz ausreichend trainiert ist, um gute Vorhersagen und Entscheidungen treffen zu können.
Wo wird es benutzt?
Bisher sind die Anwendungsfälle von Deep Learning meist noch recht einfach und zielgerichtet. Sie kommen bei der Bilderkennung, dem Textverständnis oder auch bei Chatbots zum Einsatz. Konkrete Anwendungsbeispiele aus diesen Bereichen sind das Bild- und Objekterkennungssystem von Google, das Textverständnis von Alexa und Siri oder das Übersetzungsportal DeepL. Es gibt allerdings auch schon so genannte Expertensysteme, die zum Beispiel in der automatisierten Erfassung eingesetzt werden. Diese Systeme lernen von ihren vorangegangenen Entscheidungen, indem sie zum Beispiel registrieren, wann manuell eingegriffen werden musste und dies bei künftigen Entscheidungen berücksichtigen. Diese Systeme nutzt zum Beispiel Tesla im Bereich des automatisierten Fahrens. Aber sie kommen auch schon in einigen Unternehmen zum Einsatz, zum Beispiel beim Überwachen von Lagerbeständen und bei automatisierter Beschaffung.
Macht´s auch Probleme?
Deep Learning funktioniert am besten, wenn die Datenmengen sehr gross sind. Wenn diese Basis fehlt, kommt das beste neuronale Netz nicht besonders weit. Die Voraussetzung für Deep Learning ist deshalb das Sammeln von Daten – und das ist vor allem in datenschutzsensiblen Bereichen ein Problem. Im medizinischen Bereich zum Beispiel könnte Deep Learning bei der Unterstützung von Diagnosen und der Entscheidung über Behandlungsmethoden hilfreich sein. Doch medizinische Daten sind sehr heikel und zu Recht streng geschützt. Es gilt also, gut abzuwägen, welche Daten in welcher Form benutzt werden und wie man dafür sorgen kann, dass sie nicht in falsche Hände geraten.