Urs Heckmann - Geborene Automaten

Embodiement

Die Methode *

Kein Modell, keine Repräsetation *

LowTech *

Squirt *

Genghis *

Weitere ´Moboter´ *

Serviceroboter *

Domänenunabhängigkeit III *

Mindstorms *

Mondotronics und Robocup *

Schlußfolgerung Embodiement *

Unter Embodiement versteht man die These, daß eine künstliche Intelligenz nur innerhalb eines Körpers funktionieren kann, der mit der realen Welt unter realen Bedingungen interagiert. Sie wurde in der zweiten Hälfte der 80er Jahre von dem Australier Rodney Brooks formuliert, der mittlerweile das Artificial Intelligence Lab am MIT leitet.

Brooks bezieht sich auf die biologische Evolution und legt dar, daß die Entstehung der kognitiven Mechanismen erheblich weniger Zeit gekostet hat, als die Entstehung grundlegender Eigenschaften von Lebewesen, wie zum Beispiel Mobilität, Triebe oder Reflexe. Man müsse also zunächst diese basalen Merkmale vorgeben, um es der biologischen Evolution gleichzutun. Das Ziel einer Künstlichen Intelligenz steht am Ende dieser Entwicklung.

Brooks Thesen wurden zunächst skeptisch betrachtet, doch seine Erfolge, die er mit autonomen, mobilen Robotern (´Moboter´) seit nunmehr über zehn Jahren feiert, sprechen für sich. Inzwischen werden viele Laboratorien und selbst Haushalte von Robotern nach Brooks’ Schema bevölkert.

Wegen seiner Methode, viele, äußerst einfache Mechanismen zu einem Automaten mit komplexen Verhalten zusammenzufügen, wird diese Herangehensweise ebenfalls dem Konnektionismus zugesprochen, wenngleich sie viel heterogener ist als die Parallelität von gleichen Teilen eines zellulären Automaten.

Die Methode

Um ein komplexes Verhalten zu erzeugen, muß man es zunächst in einzelne Verhaltensebenen, sogenannte ´Layer´, zerlegen. Diese Ebenen sind hierarchisch gestaffelt und beschreiben jeweils Prioritäten, die ihre Wichtigkeit für das ´Überleben´ charakterisieren.

Wenn man ein Layer erfolgreich in einen Roboter eingebaut hat, kann man das nächsthöhere in Angriff nehmen. Damit ist sichergestellt, daß die tieferliegenden Verhaltensebenen, die für das autonome Verhalten existentieller sind, funktionieren, und daß auftretende Mängel im Verhalten von seiner jeweils höchsten Repräsentanzstufe herrühren. Der Mangel wird ausgebügelt (´debugged´), bis das neue Layer funktioniert. – Selektion wird von Hand betrieben.

In der Regel besteht die tiefste Verhaltensstufe daraus, Bewegung zu realisieren, also Beinarbeit zu koordinieren oder Räder anzutreiben. Darüber sitzt die Ebene, die dafür sorgt, daß der Roboter nicht mit Objekten, die sich nähern, kollidiert (´avoid´) und stattdessen lieber ausweicht. Wenn ein Hindernis auftaucht, muß er entsprechend stehenbleiben.

In höheren Stufen werden Ausweichmanöver berechnet, Wege gesucht, Strecken geplant, Orte erkannt, Objekte identifiziert, Handlungen mit Objekten vollzogen etc.

Die hierarchische Anordnung von Verhaltensebenen, die Wahrnehmungen direkt in Aktionen umsetzt, nennt man ´Subsumption Architecture´. – Höhere Ebenen unterdrücken solche mit niederer Priorität, wenn sie zur Aktion veranlaßt werden.

Kein Modell, keine Repräsentation

Das gewissermaßen Ketzerische an diesem Ansatz ist, daß die Roboter keine zentrale, symbolische Repräsentation der Welt besitzen. – Sie müssen nicht erkennen, was da gerade auf sie zugestürmt kommt, sie müssen nur rechtzeitig ausweichen.

Frühere Roboter ´lebten´ wie SHRDLU (siehe Teil 2: Natural Language Processing) in orthogonalen Räumen, in denen es farbige Würfel, Quader und Pyramiden gab. Auf dem Boden waren Hilfsmarkierungen zur leichteren Orientierung aufgemalt. Trotz dieser vereinfachten Welt brauchten diese Roboter oft Stunden, um sich einen halben Meter fortzubewegen. Wenn man von außen eingriff und ein Objekt verrückte oder durchs Sichtfeld es Roboters lief, war alles aus und der Roboter verlor die Orientierung.

Brooks‘ autonome Maschinen leben in der Echtzeit und in unaufgeräumten, chaotischen Umwelten. Das Geheimnis ihres Erfolges ist, daß sie die Realität als naturgetreuestes Modell ihrer selbst nehmen. Der vermeintliche Nachteil dieser Technik ist, daß die Roboter absolut nichts über ihre Umwelt wissen. Sie haben keinen Speicher, mit dem sie sich an Erlebnisse des Vortags erinnern können, sie unterscheiden nicht zwischen Teppich oder Linoleum. Sie sind prä-paläolithisch, denn sie bilden keine Begriffe. – Sie haben nichtmal eine Vorstellung davon, was sie in der übernächsten Sekunde tun werden. Ihre Verhaltensebenen bestimmen jede Zehntelsekunde oder noch öfter aufs Neue, wie sie reagieren sollen.

LowTech

Dabei ist die verwendete Mechanik, die Sensorik und die Rechentechnologie sehr einfach, wenn nicht primitiv. Die ersten Roboter aus Brooks‘ Labor bestanden aus Lego, Readymades, Spielzeugautos, Kupferkabeln statt geätzten Platinen und einfachen 8-Bit Mikroprozessoren (heute arbeiten Mikroprozessoren mit 32 oder 64 Bit, was erheblich mehr Leistung bedeutet). Sie wurden geklebt, gelötet und verschraubt. Robotik ist ein Reich der Provisorien.

Die Module, die die einzelnen Aufgaben erfüllten, um daraus ein komplexes Verhalten emergieren zu lassen, waren von vornherein sehr simpel. Man nennt sie ´Augmented Finite State Machines´, also Module, die wie die Zellen eines zellulären Automaten diskrete Zustände annehmen. Diese können einfache Chips oder programmierte Simulationen sein.

Die Unterdrückung von niederen Layers durch höhere passiert oft einfach dadurch, daß den niederen Layers der Strom abgeschaltet wird...

Im Folgenden möchte ich einige ältere Roboter beispielhaft vorstellen, bevor ich zu neueren, komplexeren Typen übergehe.

Squirt

Squirt ist ein Roboter mit einem äußerst primitiven Verhalten. Er hat einen tennisballgroßen, halbkugelförmigen Körper, vier motorisierte Räder, von denen sich eins nur vorwärts dreht, einen Lichtsensor und zwei Mikrophone. Seine Steuerung übernimmt ein 8-Bit-Prozessor.

Sein Verhalten besteht darin, helle Orte zu vermeiden, sich in der Dunkelheit niederzulassen und Geräuschen nachzugehen.

Das unterste Layer beobachtet die Signale vom Lichtsensor. Wenn ein gewisser Schwellenwert überschritten wird, versetzt Squirt seinen Motor in Rückwärtsbewegungen. Durch das eine blockierende Rad folgt Squirt spiralförmige Bahnen. Wenn das unterste Layer feststellt, daß es dunkel genug ist, unter einem Schrank oder in einer düsteren Ecke, geht Squirt in den Lauschmodus über.

Der Lauschmodus wird vom zweiten Layer kontrolliert, solange Squirt sich im Dunkeln befindet. Sollte sich irgendwo ein Geräusch ereignen, ortet Squirt dies mit seinen beiden Mikrophonen und wartet eine Weile ab. Wenn es wieder ruhig geworden ist, versucht Squirt, sich im Rückwärtsmodus auszurichten, um dann vorwärts geradlinig in die Nähe der Geräuschquelle zu gelangen. Dort angekommen verzieht er sich wieder in die Dunkelheit.

Diese beiden Verhaltenslayer ergeben ein Verhalten, das komplex genug ist, daß Menschen es als zielgerichtet wahrnehmen (Animismus!). Es wurde mit nur 1300 Bytes Programmcode realisiert, was in etwa ein Zehntausendstel dessen ist, was durchschnittliche Anwendungen auf Computern für ihre Funktionalität benötigen.

Genghis

Ghengis ist ein Roboter, der sich strukturell an Insekten orientiert. Er ist etwa 30 Zentimeter lang, hat sechs motorbetriebene Beine, zwei Fühler, sechs Wärmedetektoren und einen Steigungsmesser.

Das Interessante an Genghis ist, daß er sich wie ein Insekt bewegt, obwohl es keine koordinierende Instanz gibt, die den Beinen sagt, was sie tun sollen. Jedes Bein hat seine eigene Steuerung und denkt somit nur für sich selbst. Untereinander sind die Beine nicht verbunden. Dies ist bei Insekten auch so, da ihre Beine eigene, nicht verkoppelte Neuronen haben. Wie bei Insekten läuft Genghis normal weiter, wenn ein Bein ausfällt.

Jedes Bein hat ein Verhaltenslayer, das es bei einer hohen Belastung (wenn andere Beine angehoben sind) nach hinten bewegt, und das es bei geringen Belastungen anhebt und nach vorne schwingen läßt. Lediglich die Modi vorwärts, rückwärts und anhalten werden für beide Seiten getrennt von höheren Layern angewiesen.

Genghis bewegt sich nur, wenn Menschen in der Nähe sind (Wärmesensoren) und versucht dann, ihnen hinterherzulaufen. Wenn etwas im Weg liegt (Fühler), versucht Genghis, es zu umrunden (´avoid´ und ´pathplanner´).

So entsteht ein sehr komplexes Verhalten aus einer ziemlich einfachen Architektur von Regeln. Dies erinnert ein wenig an Simulationen von Schwarmverhalten (siehe Teil2), nur daß die Elemente der Subsumption Architecture heterogen sind. Kein Modul gleicht einem anderen, da jedes Modul andere Aufgaben erfüllt.

Weitere ´Moboter´

Herbert ist ein tonnenförmiger Roboter mit einem Greifarm. Nachts wandert er umher, betritt Räume und sucht Sodaflaschen. Wenn er eine Sodaflasche entdeckt, bleibt er vor ihr stehen. Wenn Herbert vor einer Sodaflasche stehenbleibt, wird der Greifarm aktiv. Er ergreift die Flasche, prüft ihr Gewicht (ist sie wirklich leer?) und nimmt sie mit auf der Suche nach einem Getränkekasten...

Tom und Jerry sind zwei motorisierte Spielzeugautos mit jeweils drei Infrarotabstandsmessern im Frontbereich und einem weiteren hinten. Sie reagieren auf bewegte Objekte und versuchen, diesen in einem gewissen Abstand zu folgen. Wenn sie einem Menschen folgen, und dieser bleibt stehen, verlieren sie das Interesse und fahren ziellos umher, bis sich wieder etwas bewegt. Die meiste Zeit verbringen Tom und Jerry damit, sich selbst zu jagen...

Toto demonstriert, wie mittels der Subsumption Architecture eine räumliche Orientierung möglich ist, ohne daß eine Karte oder räumliche Struktur repräsentiert wird. Immer, wenn er sich in einer Umgebung befindet, in der er noch nicht war, wird eine neue, simulierte Augmented Finit State Machine (AFSM) zu den bestehenden hinzugefügt. Diese wird aktiv, wenn das Profil aller Sensoren (Laserabtaster, Sonare, Infrarotmesser) wieder einen annähernd identischen Zustand annimmt wie zur Zeit seiner Entstehung. Zusätzlich muß ein Layer, das zuvor oder später aktiv war (entspricht einem benachbarten Ort), ebenfalls aktiv gewesen sein. Wenn also keine ortsbezogene AFSM aktiv ist, wird eine neue kreiiert, weil Toto sich dann an einem bislang unbekannten Ort befindet. Sollte sich ein Ort leicht verändert haben, dann wird das Profil seiner zugeordneten AFSM entsprechend modifiziert. Daher spielen verrückte Stühle, umgestellte Schreibtische, umherlaufende Personen und plötzlich auftauchende Coladosen keine verheerende Rolle.

Wenn Toto einen bestimmten Ort aufsuchen soll, kann das Wegplaner-Layer anhand der Verknüpfung der Orts-AFSMs bestimmen, in welcher Reihenfolge Toto die bekannten Orte ablaufen soll, um zum Ziel zu gelangen. So wird eine sehr exakte Orientierung ermöglicht, ohne daß ein symbolisches Wissen über räumliche Strukturen, Karten oder ähnliches repräsentiert werden muß!

Serviceroboter

Tatsächlich sind inzwischen viele Roboter mit solcher Architektur auf dem Markt erhältlich. Die meisten bieten die wesentlichen Grundfunktionen zur Mobilität und Orientierung an und haben Schnittstellen, auf denen weitere Verhaltensmuster in Form von Funktionselementen und Software aufgesetzt werden können.

Im Gegensatz zu Industrierobotern, die ein komplett vorprogrammiertes Verhalten besitzen, das sie stupide abfahren, nennt man diese neue Generation von nützlichen autonomen Robotern ´Serviceroboter´.

Serviceroboter treten grundsätzlich mit Menschen in Kommunikation, beispielsweise als Boten, Haushaltshilfen oder bei der Ausführung von Arbeiten an unzugänglichen Orten wie Kanalisation, radioaktiv verstrahlter Räume etc. Deshalb müssen sie wie jedes Produkt eine Art Benutzeroberfläche haben, die sowohl in ästhetischer als auch in operationaler Hinsicht gestaltet werden muß. Bei Robotern, die autonom mit ihrer Umwelt interagieren, kommt eine weitere Stufe der Gestaltung hinzu, die ich allgemein die Gestaltung des Produktverhaltens nenne, die im Falle von Robotern besonders plausibel erscheint. Soll ein Roboter sachlich, freundlich, emotional, technoid oder fremdartig handeln? – Soll er der Kunst oder der Natur zugerechnet werden?

Domänenunabhängigkeit III

Robotik ist inzwischen kein Gebiet mehr, das akademischen Forschungseinrichtungen und High-Tech-Abteilungen von Großkonzernen vorbehalten ist. Vielmehr hat sich die Robotik ihren provisorischen Bastelstatus erhalten. Viele Gründe sprechen dafür, daß die Grundlagen der Robotik, beispielsweise die beschriebene Subsumption Architecture in absehbarer Zukunft, wahrscheinlich schon in wenigen Jahren genauso in das kollektive Allgemeingut der Kultur eingeht, wie dies heute im Falle des Umgangs mit Computern schon geschehen ist. Roboter in die Kultur zu integrieren, heißt, ihr Verhalten bestimmen zu können. – Sie zu bauen ist einfach und billig!

Es gibt bereits Bücher, die Bauanleitungen für Roboter beinhalten, die man aus Küchengeräten herstellen kann. Es gibt Tips und Tricks, beispielsweise im Internet, welche Teile, die sich in konventionellen Produkten befinden, besonders gut für bestimmte Aufgabenstellungen der Robotik geignet sind. Ein praktisches Beispiel dafür stellen die Sonare von Polaroidkameras dar. Professionelle und hobbyistische Robotiker haben immer die ganze Kamera auf dem Gebrauchtmarkt erwerben müssen, um den Sonar auszubauen. Inzwischen vertreibt Polaroid die Sonare einzeln als Robotikzubehör.

In den folgenden Abschnitte möchte ich zwei weitere Beispiele anführen, die belegen, daß Robotik und Gestaltung von Verhalten ihren Einzug in den Alltag finden werden.

Mindstorms

Zusammen mit Brooks’ Arbeitsgruppe am MIT hat Lego eine Baukastenreihe entwickelt, die Sensoren, Motoren und Steuerelemente nach dem Prinzip der Subsumption Architecture beinhält. Mit diesen Baukästen lassen sich bereits autonome Roboter (und natürlich auch andere Dinge) von recht beeindruckender Komplexität bauen.

Im Lieferumfang enthalten ist eine CD mit einer entsprechenden PC-Software. Diese Software bietet ein graphisches Interface an, mit dem die einzelnen Verhaltensbausteine bequem in Form eines Puzzles zusammengesetzt werden können. Wenn das Verhalten fertig programmiert ist, wird es per Datenkabel in den intelligenten Legostein transferiert. Ab dann ist die Konstruktion autonom, vorausgesetzt, das Verhaltensprogramm und die Struktur des Legogebildes sind funktional aufeinander abgestimmt.

Auf mich wirkt diese Entwicklung genauso wie der erste Computer, den ich mir vor beinahe zwanzig Jahren gekauft hatte. – Das Wissen um Methoden und Strategien einer technologischen Schlüssel-domäne – dafür halte ich die Robotik – wird schon in jugendlichen Generationen Verbreitung finden. Dies begründet vielleicht meine Auffassung, daß die Robotik in wenigen Jahren ein wichtigerer Markt und gesellschaftlicher Faktor werden wird als die PC-Technik.

Mondotronics und Robocup

Die Firma Mondotronics vertreibt elektronische Bauteile. Einer ihrer wichtigsten Kataloge ist der ´Robot Store´. Man erhält dort alles, was man zum Bau von einfachen bis komplexen Robotern braucht. Es gibt Sensoren, Attraktoren, Muskeln, Pneumatiken, Mikrochips, Programmierelemente jeglicher Art und Qualität. Selbst an kompletten Roboterbaukästen, zur Zeit etwa 160 unterschiedliche, mangelt es im Programm nicht. Es gibt fertig vorkonfigurierte Roboter, an die man Staubsauger andocken kann, die aber auch Rasen mähen können.

Der Katalog ist Ausdruck einer weltweiten Bewegung von Menschen mit unterschiedlichstem Hintergrund, die Roboter bauen, sei es aus wissenschaftlichem Interesse oder um in Roboterwettkämpfen eine gute Figur zu machen.

Allein in Deutschland finden jährlich fünf bis zehn internationale Veranstaltungen statt, in denen privat oder akademisch gebaute Roboter in diversen Disziplinen, beispielsweise Ringen oder Fußball (Robocup), gegeneinander antreten.

Schlußfolgerung Embodiement

Die Methode des Embodiement, intelligentes Verhalten als kontextabhängig aufzufassen, scheint meiner Ansicht nach ein vielversprechender Ansatz zu sein. Sogar Herbert A. Simon, der sich Intelligenz als eigenständige, körperlose Instanz vorgestellt hat, beschreibt die unmittelbare Kontextabhängigkeit von intelligentem Verhalten. Daß der Kontext untrennbar mit einem im Raum wahrnehmbaren Selbst, mit der Interaktion zwischen Subjekt und Objekt verbunden ist, ist erst durch Rodney Brooks populär geworden.

Ich halte die Auflösung der Endowelt, des Modells von Wirklichkeit zugunsten der Hinnahme eines realen Kontextes für eine existentielle Grundlage bei der Schaffung einer künstlichen Intelligenz. – Gleichzeitig rückt das Design mit in das Zentrum des Geschehens, da es sich nicht mehr nur um Probleme der Informatik handelt, sondern um die Frage von kultureller Einbindung. Künstliche Intelligenz ist sehr wohl gegenständlich, was schon Robokoneko zeigt, und diese Gegenständlichkeit befindet sich in dieser Welt, nicht in einer hermetisch abgeschlossenen Endowelt wie es der virtuelle Raum oder das Internet darstellt.

Im Folgenden Kapitel beschreibe ich daher weniger Methoden und Merkmale von Künstlicher Intelligenz, sondern zum Teil recht junge Entwicklungen, die Komponenten des bisher gesagten vereinen und daraus neue Qualitäten im realen Raum emergieren lassen, die meine zum Teil – hoffentlich – provoka