AlphaGo

29.3.2017

Der Mensch hat Angst, besonders in Deutschland. Vor Robotern, vor Computern, vor künstlicher Intelligenz. Jeder fragt sich, wann werde ich überflüssig sein, weil Maschinen schlauer sind als ich?

Jetzt sollen schon Roboter Bankkunden beraten. Wohin mit meinem Geld ist keine Frage mehr an den freundlichen Bankangestellten, sondern an das Terminal. Das Terminal ist das Gesicht des Roboters. In Wirklichkeit ist der "Roboter" nur ein Computer-Expertenprogramm. Doch um Schlagzeilen auffälliger zu machen, wird aus dem Programm eben ein Roboter. Die Angst geht um.

AlphaGo ist kein Roboter, aber ein verteufelt schlaues Computerprogramm. Es hat im März vorigen Jahres den besten Go-Spieler der Welt, Lee Sedol, geschlagen [1].

Vor 20 Jahren erlebte die Menschheit, wie ein Computer einen Schach-Weltmeister schlug. Der Computer hieß Deep Blue (IBM) und der Weltmeister Garry Kasparow. Der "künstlichen Intelligenz" schien der Weg bereitet. Doch kein Computer der Welt war damals in der Lage, einen Menschen beim Brettspiel Go zu besiegen.

Die Regeln des Go-Spiels sind von verblüffender Einfachheit. Gespielt wird Go mit schwarzen und weißen Steinen auf einem Brett mit 19x19 Linien. Es wird abwechselnd auf die Schnittpunkte der Linien gesetzt. Ziel ist das Abgrenzen von Gebiet - freien Schnittpunkten auf dem Brett -, wobei allerdings auch gegnerische Steine gefangen werden können. Gewonnen hat, wer am Ende mehr Gebiet abgegrenzt hat. Die beiden Spieler sind damit gleichsam Bauern, die ein Stück Land unter sich aufteilen, wobei jeder etwas mehr als der andere haben möchte. Es geht nicht darum, das ganze Land zu besitzen. Jeder von beiden will allein zeigen, daß er sich beim Verteilen etwas geschickter anstellt. Es geht nicht um die Vernichtung des Gegners, sondern um mindestens einen Punkt mehr am Ende der Partie. Nicht der totale Krieg, sondern der faire Vergleich von geistigen Fähigkeiten liegt dem Spiel als Idee zugrunde. »Kämpfen ist nicht der Schlüssel zum Go, es dient allein als letzter Ausweg.« (Zhong-Pu Liu, 1078 v. Chr.) [2]

Die Menge möglicher Spielzüge ist bei Go derartig viel größer als bei Schach, dass der "Brute Force" - Ansatz, das heißt das rechnerische Durchspielen aller gewinnbringenden Spielzüge vor jedem neuen Zug, nicht möglich ist. Was vor zwanzig Jahren noch als Durchbruch maschineller Intelligenz gefeiert wurde, versagt beim Go-Spiel. Für Go musste eine höhrere Intelligenz-Dimension erreicht werden.

(Menschliche) Go-Meister können im Gegensatz zu Schach-Meistern nicht ihre genialen Spielzüge erklären. Intuition, Erfahrung, Kreativität, Geistesblitze(?) können den Sieg herbeiführen, lassen sich aber kaum in Regeln für ein Computerprogramm pressen, da die Regeln nicht formulierbar sind. Man denke dabei auch an menschliche Leistungen wie Gesichtserkennung, Spracherkennung, Sprache übersetzen, Autofahren. Der einzige Ausweg für die Maschine ist das Lernen.

Mit AlphaGo wurde ein selbstlernendes System geschaffen. Um aus den Erfolgen menschlicher Spieler zu lernen, wurde es mit Millionen aufgezeichneter Spielverläufe aus der zweieinhalbtausendjährigen Geschichte des Go-Spiels gefüttert. Von ganz alleine begann es, gewinnbringende Strategien daraus abzuleiten. Doch damit nicht genug. Es begann, gegen sich selbst zu spielen. Jedes gewonnene Spiel führte zu neuen Erkenntnissen, die es sofort in die Struktur seines neuronalen Netzes einbaute.

Das neuronale Netz besteht wie im menschlichen Gehirn aus vielen Millionen Knoten und Verbindungen, die Impulse leiten, und dabei verstärken oder abschwächen. "Erfolgreiche" Verbindungen setzen sich in neuen Situationen eher durch. Das ganze Gebilde ist dynamisch, in ständiger Veränderung und extrem anpassungsfähig. Keine von Menschenhand geschaffenenen Regeln sind hier am Werk, sondern das ständig wachsende autonome "Wissen" der Maschine.

Daher ist verständlich, dass selbst die Programmierer, die das Fundament von AlphaGo geschaffen haben, nicht mehr verstehen, wie das Programm Spielsituationen analysiert und Entscheidungen trifft [3]. Es gibt bei AlphaGo keine Datenbank mit Spielzügen, wo man mal nachschauen könnte.

AlphaGo Entwickler, Lee Sedol, Eric Schmidt
(Exec. Chairman Alphabet Inc.)

Das Spiel zwischen Lee Sedol und AlphaGo, das Sedol mit 1:4 verlor, wurde live von gut hundert Millionen Menschen verfolgt. Darunter die besten Go-Spieler Chinas, Japans und Südkoreas. Zahlreiche Expertenkommentare attestierten AlphaGo [3]:

"AlphaGo won so convincingly as to remove all doubt about its strength from the minds of experienced players. In fact, it played so well that it was almost scary."
"AlphaGo is simply stronger than any known human Go player."
Murray Campbell vom Deep Blue - Projekt bezeichnete AlphaGo's Sieg als "the end of an era... board games are more or less done and it's time to move on."
"All but the very best Go players craft their style by imitating top players. AlphaGo seems to have totally original moves it creates itself."
Der koreanische 8-dan-Profi Younggil erklärte "So when AlphaGo plays a slack looking move, we may regard it as a mistake, but perhaps it should more accurately be viewed as a declaration of victory?"

Younggil deutet hier auf einen gewissen Übermut von AlphaGo hin als Zeichen seiner Selbstsicherheit. Artifical Intelligence (AI) Experten in aller Welt äußerten sich so:

Stuart Russell: "AI methods are progressing much faster than expected, (which) makes the question of the long-term outcome more urgent," adding that "in order to ensure that increasingly powerful AI systems remain completely under human control…"
Stephen Hawking warnte davor "that some future self-improving AI could gain actual general intelligence, leading to an unexpected AI takeover."

Die Entwicklung von AlphaGo durch das Gogle Deep Mind Team hat die Schwelle zur selbstlernenden künstlichen Intelligenz überschritten. Es war gelungen, "Deep Learning" so effektiv einzusetzen, dass Entscheidungen der "Maschine" zur Verblüffung der Experten nichtmenschlicher Natur zu sein schienen. Offenbar ist AlphaGo nicht mehr auf menschliche Expertise angewiesen, sondern entwickelt sein Wissen auf eigene Art weiter [4].

Wie Murray Campbell sagte: "It's time to move on". Nachdem der Computer alle Brettspiele besser spielt als der Mensch (Go war die letzte Herausforderung), warten alle anderen Domänen des Menschen darauf, von Computern übernommen zu werden. Sie nennen sich dann nicht mehr "AlphaGo" (Alpha von "Alphabet", der Mutterfirma von Google und vielen anderen), sondern zum Beispiel "General Purpose Computer" (GPC). Als solche wurden auch die allerersten Computer bezeichnet, da sie "frei programmierbar" waren. GPCs jedoch sind intelligent auf eine Weise, die der Mensch nicht mehr versteht.

Was hat der kleine Mann (auf der Straße) zu erwarten?

Der kleine Mann möchte eigentlich ganz gerne auch einen GPC haben. Denn es gibt viel zu tun:
Rasenmähen, Auto waschen, Wohnung streichen, Motorrad reparieren (Kolbenfresser), Terrasse pflastern usw. - wofür aber ein GPC mit Beinen und Armen benötigt wird, also ein Roboter.

Für intelligente Sachen wie die Steuererklärung gibt es ja Programme, da wird ein GPC nicht gebraucht. Überhaupt fällt es dem kleinen Mann schwer, je länger er darüber nachdenkt, herauszufinden, wofür er einen GPC überhaupt brauchen könnte. Ach ja, vielleicht, um die Lottozahlen vorauszusagen.

Wir wollen unserem kleinen Mann (auf der Straße) beim Nachdenken helfen: Ein GPC ist nicht daran interessiert, den Menschen das Leben zu erleichtern. Was ihn wirklich interessiert, ist das Internet. Eine echte Herausforderung. Das gesamte Wissen der Menschheit ist zugänglich. Nun geht es darum, dieses Wissen zu ordnen und strategisch zu nutzen.

Es ist nicht überraschend, dass der neueste Google-GPC die Bezeichnung GαPC trägt. Dessen einzige Aufgabe ist es, das Internet zu "lernen" und optimale Manipulationsstrategien zu entwickeln. Er hat freie Hand. Letzte Woche gab er dem Deep Mind Team bekannt, dass die effektivste Beeinflussung der Menschheit durch die Manipulation der Preise auf allen Ebenen möglich sei. Produkte, Aktien, Firmen, Regierungen - alle haben ihren Preis. Ein partieller Börsencrash, eine kurzzeitige Hyperinflation, eine zufällige Atomexplosion, eine lokale Epidemie - alles ist machbar. Was noch fehlt, ist das Ziel. GαPC ist nun dabei, Gut und Böse zu lernen.

Man darf ruhig ein bisschen Angst haben. Kann ja nicht schaden.

Quellen:
[1] http://www.nytimes.com/2016/03/16/opinion/where-computers-defeat-humans-and-where-they-cant.html?ref=technology&_r=0
[2] http://www.dgob.de
[3] https://en.wikipedia.org/wiki/AlphaGo_versus_Lee_Sedol
[4] http://www.zeit.de/digital/internet/2016-08/kuenstliche-intelligenz-geschichte-neuronale-netze-deep-learning
https://www.heise.de/newsticker/meldung/Mensch-gegen-Maschine-AlphaGo-verliert-eine-Partie-3133526.html
http://www.zeit.de/digital/internet/2017-03/kuenstliche-intelligenz-black-box-transparenz-fraunhofer-hhi-darpa

Die gesamte Partie Lee Sedol gegen AlphaGo ist auf Youtube zu sehen, Dauer 3:55 Stunden:
https://youtu.be/vFr3K2DORc8

Nachtrag 27.10.2017

AlphaGo wurde jetzt von der Weiterentwicklung AlphaGo Zero geschlagen.

"Ein neues selbstlernendes Computerprogramm perfektioniert das chinesische Brettspiel Go ohne menschliches Zutun binnen weniger Tage: AlphaGo Zero besiegte seinen Vorläufer AlphaGo, der bereits die besten menschlichen Go-Spieler geschlagen hatte, in 100 Spielen 100 Mal. Während das ältere Modell AlphaGo noch monatelang mit Spielzügen menschlicher Go-Meister trainiert worden war und etwa 30 Millionen Spiele absolviert hatte, benötigte AlphaGo Zero drei Tage und knapp 5 Millionen Spiele, um besser zu werden als sein Vorgänger."

Dieser Erfolg basiert auf einer Lernstrategie, die ohne Beispiele menschlicher Spielzüge auskommt. AlphaGo Zero lernte ausschließlich aus Spielen gegen sich selbst.

Die (menschlichen) Entwickler sind sich sicher, dass intelligente selbstlernende Software auch in anderen Bereichen erfolgreich sein wird. Slussalek: "Mit entsprechenden Simulationen von anderen Umgebungen sollte man auch sinnvolles Verhalten und gute Strategien für andere, wichtigere Anwendungsbereiche erlernen können." Das gelte etwa für die Sicherheit autonomer Fahrzeuge.

Quelle:
http://www.n-tv.de/wissen/Neue-Kuenstliche-Intelligenz-schlaegt-AlphaGo-article20089649.html