KI: Unterschied zwischen den Versionen

Aus TopoWiki
Zur Navigation springen Zur Suche springen
Zeile 131: Zeile 131:
 
{{c|Die Methoden des maschinellen Lernens sind Methoden der Korrelationssuche. Das heißt, sie suchen nach Eigenschaften, die mit der vorherzusagenden Eigenschaft sehr oft gemeinsamen auftreten (und weniger oft auftreten, wenn ein Datenpunkt die vorherzusagende Eigenschaft nicht hat).|KZ-AKT 194}}
 
{{c|Die Methoden des maschinellen Lernens sind Methoden der Korrelationssuche. Das heißt, sie suchen nach Eigenschaften, die mit der vorherzusagenden Eigenschaft sehr oft gemeinsamen auftreten (und weniger oft auftreten, wenn ein Datenpunkt die vorherzusagende Eigenschaft nicht hat).|KZ-AKT 194}}
  
=== Ergebnis: statistisches Modell ===
+
=== Ergebnis: trainiertes statistisches Modell ===
 
{{c|Im Gegensatz zum klassischen Algorithmendesign, wo die Modellbildung (Definition des mathematischen Problems) vor dem Entwurf und Einsatz des Algorithmus liegt, baut jetzt der Algorithmus aus den Daten das Modell der Welt.|KZ-AKT 44}}
 
{{c|Im Gegensatz zum klassischen Algorithmendesign, wo die Modellbildung (Definition des mathematischen Problems) vor dem Entwurf und Einsatz des Algorithmus liegt, baut jetzt der Algorithmus aus den Daten das Modell der Welt.|KZ-AKT 44}}
  

Version vom 29. September 2020, 17:10 Uhr

  • Künstliche Intelligenz
  • Artificial Intelligence
  • 人工知能

Fragen

  • Lohnt es sich, ein System unter ethischer Perspektive zu evaluieren? -> Algoskop

Algoskop

Algoskop.png

»Algorithmen«. Diese Fokussierung auf ethisch relevante algorithmische Entscheidungssysteme nenne ich das Algoskop. (KZ-AKT 24)

  • Software
    • Algoritmische Entscheidungssysteme
      • mit lernender Komponente
        • die über Menschen entscheidet
  • AES sind unkritisch, wenn über Dinge entschieden werden soll, die keinen direkten Bezug zu Menschen oder zur Gesellschaft haben.
  • AES sind kritisch:
    • wenn es um Menschen geht
    • wenn es um die Teilhaber an der Gesellschaft geht
    • wenn es um Zugang zur wichtigen Ressourcen geht

Ergo: Nur eine relativ kleine Klasse von Softwaresystemen braucht unter ethischer Perspektive betrachtet werden.

Diese sind primär solche, die aus Daten lernen, wie sich Menschen in der Vergangenheit verhalten haben, um daraus Schlüsse über das mögliche zukünftige Verhalten von anderen Menschen zu ziehen und solche, die über den Zugang zu gesellschaftlichen Ressourcen entscheiden. (SZ-GT, Pos3631)

OMA-Prinzip

OMA.png

Operationalisierung

Messbarmachung

  • der modellierten Objekte
  • das, was eine gute Entscheidung ist

Modell der Welt

Die Modellierung eines Problems ist auch immer schon selbst ein Problem. -> Explikation

Unterschied zwischen

  • Land und Landkarte
  • Situation und Konstellation
  • echte Situation und künstliche Repräsentation

Wenn die Modellierung nicht mit dem Algorithmus abgestimmt ist, rechnet dieser zwar etwas aus, dies lässt sich aber nicht sinnvoll interpretieren. (KZ-AKT 80)

Das Problem ist, dass wir Menschen in den meisten Situationen so viele Regeln intuitiv berücksichtigen, dass es unmöglich erscheint, all dieses Wissen strukturiert abzulegen. (KZ-AKT 127)

Es stellte sich aber heraus, dass es sehr mühsam ist, all das implizite Wissen abzulegen. (KZ-AKT 127)

Das Modell der Welt muss abgeglichen werden mit den erfolgten Operationalisierungen und dem Algorithmus. (KZ-AKT 172)

Ich habe zuerst betont, dass die wichtigste Gestaltungsleistung bei klassischen Fragestellungen die Modellierung der Alltagssituation darstellt, also ihre Vereinfachung, sodass einer der vielen klassischen Algorithmen ganz ohne maschinelles Lernen eine optimale Lösung berechnen kann. (KZ-AKT 201)

Algorithmus

AlgoMaschine.png
  • Input: Daten
  • Nutzung vorhandener Algorithmen
  • Output: Daten -> Bedetungsgebung -> Interpretation

Denn nicht alle Algorithmen lernen von Daten. Die allermeisten sind »klassische« Algorithmen und somit auch einigermaßen beherrschbar. Und die Algorithmen, die aus Daten »lernen«, sind selbst statisch – sie verändern sich nicht. (KZ-AKT 129)

Lange Kette der Verantwortlichkeiten

Risikomatrix

  • 5 Kategorien an technischer Regulation

Kein Algorithmen-TÜV sondern systemischer Blick

Ganzheitliche Betrachtung des soziotechnischen Gesamtsystems

Im Nachhinein ist mir aber auch bewusst geworden, dass das systemische Denken, das ich aus der Biochemie kannte, in der Informatik weitgehend fehlt – etwas, das wir jetzt gut gebrauchen könnten, wo Algorithmen die Gesellschaft immer stärker beeinflussen! (KZ-AKT 64)

Big Data

  • Volume (Masse)
  • Velocity (Geschwindigkeit)
  • Variety (Vielfältigkeit)

Big Data wird dann genutzt, wenn vorhanden:

  • Mehrwert (Value)
  • Validität (Validity)

Maschinelles Lernen

TwoAlgos.png

Der Prozess ist weit weniger objektiv und selbstgesteuert, als Sie es vermuten würden. (KZ-AKT, 23)

Es ist aber auch klar geworden, dass künstliche Intelligenz mit einer lernenden Komponente immer nur Plan B ist. (KZ-AKT 193)

Prinzip:

  • Input: Regel
  • Output: Feedback gegenüber Grundwahrheit -> stärkt oder schwächt die Regel

Maschinelles Lernen kann also im Wesentlichen dort erfolgreich sein, wo die folgenden Bedingungen erfüllt sind:

  1. Es gibt eine ausreichend große und gute Trainingsdatenmenge (Input).
  2. Es gibt eine sehr gut messbare Grundwahrheit, also das, was vorherzusagen ist (Output).
  3. Es gibt kausale Zusammenhänge zwischen dem Input und dem vorherzusagenden Output.

Algorithmen des maschinellen Lernens sind uns in diesem Fall klar überlegen, da sie:

  1. nahezu beliebig große Datenmengen nach Korrelationen durchsuchen können.
  2. nach sehr vielen verschiedenen Arten von Korrelation suchen können.
  3. auch schwache Korrelationen noch gewinnbringend in die statistischen Modelle einfließen lassen können.

...

Die Ergebnisse maschinellen Lernens werden dann für uns glaubhaft, wenn zusätzlich das Folgende gilt:

  1. Der kausale Zusammenhang zwischen dem Input und dem vorherzusagenden Output ist so weit bekannt, dass es eine klar definierbare Menge an Inputdaten gibt, auf die sich alle beteiligten Akteur:innen leicht einigen konnten.
  2. Es gibt möglichst viel Feedback für beide Fehlertypen (falsch-positiv und falsch-negative Entscheidungen). Damit kann die Qualität fortlaufend gemessen und das statistische Modell dynamisch nachgebessert werden.
  3. Es gibt ein klar definierbares Qualitätsmaß, auf das sich alle beteiligten Akteur:innen leicht einigen konnten.
(KZ-AKT 196)

Maschinelles Lernen versucht, Zusammenhänge zwischen Inputdaten und einem beobachteten Ergebnis (Output) zu identifizieren. Es werden Algorithmen verwendet, die Korrelationen, die sie in einem Trainingsdatensatz gefunden haben, in Form von Entscheidungsregeln in einer von mehreren möglichen Strukturen abspeichern (zum Beispiel Entscheidungsbäume, mathematische Formeln, Support Vector Machines, neuronale Netzwerke). Dabei gibt es viele Hyperparameter (Knöpfe, Schieber, Regler), die einzustellen sind. Zudem kann durch das Verändern der Eingangsdaten (feature engineering) die Qualität der Vorhersage verändert werden. (KZ-AKT 202)

Durchführung 1. Algo: Maschinelle Lernalgorithmus

  • Algorithmen des maschinelles Lernens
  • Input: viele vorhandene Daten mit bekanntem Ergebnis
  • Ziel: Der Computer soll anhand von konkreten Beispielen und vorhandenen Grundwahrheiten möglichst generalisierte Regeln lernen.

Algorithmen des maschinellen Lernens sind sehr datenhungrig. (KZ-AKT 172)

Zweig, Katharina. Ein Algorithmus hat kein Taktgefühl: Wo künstliche Intelligenz sich irrt, warum uns das betrifft und was wir dagegen tun können (German Edition) (S.173). Heyne Verlag. Kindle-Version.

Das ist maschinelles Lernen: Automatisiertes Lernen an Beispielen, in denen Entscheidungsregeln gesucht und in einem statistischen Modell abgelegt werden. (KZ-AKT 132)

Denn auch der erste Algorithmus hat nichts Magisches, er ist auch nicht »objektiv« im allgemeinen Sinne. (KZ-AKT 133)

Ich erkläre skizzenhaft, wie Algorithmen oder Heuristiken diese Regeln jeweils aus den Daten lernen und wie sie dann in einem statistischen Modell gespeichert werden:

  1. Der Baum der Erkenntnis: Entscheidungsbäume
  2. Der Holzspießtest aka Support Vector Machines
  3. Und – sehr skizzenhaft – neuronale Netzwerke (KZ-AKT 134)

Grundsätzlich versucht man beim maschinellen Lernen, nicht zu viel in das vorliegende Datenset hineinzuinterpretieren – falls das doch passiert, nennen wir das »Overfitting«. (KZ-AKT 140)

Die Methoden des maschinellen Lernens sind Methoden der Korrelationssuche. Das heißt, sie suchen nach Eigenschaften, die mit der vorherzusagenden Eigenschaft sehr oft gemeinsamen auftreten (und weniger oft auftreten, wenn ein Datenpunkt die vorherzusagende Eigenschaft nicht hat). (KZ-AKT 194)

Ergebnis: trainiertes statistisches Modell

Im Gegensatz zum klassischen Algorithmendesign, wo die Modellbildung (Definition des mathematischen Problems) vor dem Entwurf und Einsatz des Algorithmus liegt, baut jetzt der Algorithmus aus den Daten das Modell der Welt. (KZ-AKT 44)

Die vom Computer gefundenen Muster werden in Form von Entscheidungsregeln oder Formeln in einer geeigneten Struktur abgespeichert. Diese Struktur nennen wir auch das statistische Modell. (KZ-AKT 132)

... viele der Methoden des maschinellen Lernens sind aber eben solche Heuristiken. (KZ-AKT 80)

Von den Daten her gesehen ist es genau das, was maschinelles Lernen leisten können soll: Versteckte Entscheidungsregeln offenlegen, auch wenn diese nicht zu 100 Prozent das Handeln leiten und weitere Eigenschaften eine Rolle spielen könnten. (KZ-AKT 145-6)

Die meisten Algorithmen des maschinellen Lernens sind nur Heuristiken, also Handlungsanweisungen, die versuchen, überhaupt eine Lösung zu finden, aber nicht garantieren können, dass es die optimale ist. (KZ-AKT 194)

Entscheidungsbäume können relativ schnell aus Daten gelernt werden. Die Algorithmen dahinter sind im Wesentlichen simpel, aber nicht trivial, da so viele Entscheidungen getroffen werden müssen. Viele dieser Entscheidungen führen zu Handlungsanweisungen, die technisch gesehen keine Algorithmen mehr sind, sondern nur Heuristiken. Das ist bei den allermeisten Methoden des maschinellen Lernens der Fall. (KZ-AKT 147)

Wenn es aber nicht möglich ist, eine hundertprozentig gültige Regel zu finden, müssen die verschiedenen Fehler einer Entscheidung gegeneinander abgewogen werden. (KZ-AKT 158)

Offensichtlich kommt es bei maschinellem Lernen aber nie dazu, dass die von der Maschine festgestellten Hypothesen auf ihre Kausalität überprüft werden. (KZ-AKT 194)

Wurde die Struktur aufgebaut, sprechen wir vom trainierten statistischen Modell. Neue Daten werden dann mithilfe eines zweiten, sehr einfachen Algorithmus durch das statistische Modell geleitet – es kommt als Entscheidung eine einzige Zahl heraus. Diese kann eine Klassifikation oder eine Risikobewertung repräsentieren. (KZ-AKT 202)

  • Modell der Welt
  • gelernte Regeln, Heuristiken
  • in einem statistischen Modell abgelegte Entscheidungsregeln

Durchführung 2. Algo: Entscheidungsalgorithmus

  • einfacher Algorithmus

Und der zweite Algorithmus, der die gefundenen Regeln abläuft und die eigentliche Entscheidung trifft, enthält nur einfache Multiplikationen, Additionen und »Wenn-dann«-Entscheidungen. Er bedarf weder einer Regulierung noch einer Überprüfung durch einen TÜV. (KZ-AKT 133-134)

Der eigentliche Qualitätstest besteht also darin, wie gut die gefundenen Regeln auf den Teil der Daten anwendbar sind, die der Algorithmus nicht zur Verfügung hatte. (KZ-AKT 143)

Korrelation und Kausalität

Als Kausalkette bezeichne ich dabei eine Aneinanderreihung von Fakten, die erklären, wieso es zu einer bestimmten Beobachtung kommt. Das maschinelle Lernen verspricht nun genau dies: dass die reine Korrelation von Daten mit beobachtetem Verhalten ausreichend sein könnte, um Entscheidungen über neue Daten zu fällen. (KZ-AKT, 38)

Und daher gibt es wissenschaftstheoretisch auch kein Entrinnen: Eine reine Hypothese, die nicht getestet wurde, gilt nicht als Fakt. Erst mehrere überprüfte Hypothesen, die in Experimenten nicht widerlegt werden konnten, werden in einer Theorie zusammengefasst – und erst dann, wenn diese Theorie zu Vorhersagen führt, die sich in kontrollierten und wiederholbaren Experimenten oder in der freien Natur als korrekt erweisen und dies mehrfach, beginnen wir, von einem Fakt zu sprechen. (KZ-AKT, 40)

Qualitäts- und Fairnessmaße

Menschen müssen definieren, was eine gute Entscheidung ausmacht, damit das Resultat des maschinellen Lernens überhaupt gute Entscheidungen produzieren kann. Die Qualitätsmaße – und daneben auch etwas, das wir »Fairnessmaße« nennen – bestimmen maßgeblich, was der Computer lernt. Und glücklicherweise bedarf es wenig technischen Grundwissens, um hier mitreden zu können! (KZ-AKT 156)

Es ist einfach unwahrscheinlich, dass das Qualitätsmaß, mit dem das System trainiert wurde, der Situation in Ihrer Firma entspricht. (KZ-AKT 163)

Das Beispiel zeigt, dass die Wahl des Qualitätsmaßes immer auch eine moralische Abwägung enthält, nämlich die Frage, welche Fehlentscheidung schwerer wiegt. (KZ-AKT 165)

will: Wenn das Qualitätsmaß nicht zur Situation passt (Sommerreifen sind kein Garant für Fahrsicherheit), kann es so hoch sein, wie es will. (KZ-AKT 172)


Glossar

  • AES: Algorithmische Entscheidungssysteme