Impressum Kontakt Haftungsausschluss

Public Computing

Menschen wieder mit der Wissenschaft verbinden

Dr. David P. Anderson
Space Science Laboratory, University of California - Berkeley


Abstrakt

Die Majorität der weltweiten Computerkapazitäten befinden sich nicht mehr in Supercomputer-Zentren und institutionellen Maschinenräumen. Statt dessen sind sie jetzt auf Hunderten von Millionen Personal Computern überall auf der Welt verteilt. In nur wenigen Jahren könnten andere Geräte der Unterhaltungselektronik wie Spielekonsolen und SetTop Boxen fürs Fernsehen einen großen Teil der gesamten Rechenleistung enthalten.

Diese Veränderung ist entscheidend für Wissenschaftler deren Forschungen extreme Computerleistungen benötigen. Projekte wie SETI@home und Folding@home haben Millionen Teilnehmer angezogen, die auf Ihrem Heimcomputer Zeit für wissenschaftliche Bemühungen spenden. Es sind Arbeiten im Gange um ähnliche Projekte in vielen anderen Bereichen zu schaffen und wissenschaftliche Forschungen zu ermöglichen die vorher unmöglich waren.

Die Implikationen dieses "Public Computing" Paradigmas sind sowohl sozial als auch wissenschaftlich. Es bietet eine Basis für globale Gemeinschaften, ausgerichtet auf öffentliche Interessen und Ziele. Es motiviert die Öffentlichkeit aktuelle wissenschaftliche Forschungen kennen zu lernen. Letztlich gibt es der Öffentlichkeit mehr direkte Kontrolle über die Richtung des wissenschaftlichen Forschritts.

1) Einleitung

Die Computertechnologie hat die Wissenschaft revolutioniert. Wissenschaftler haben genaue mathematische Modelle des physischen Universums entwickelt. Mit diesen Modellen programmierte Computer, können der Wirklichkeit in vielen Auflösungen nahe kommen: ein Atomkern, ein Proteinmolekül, die irdische Biosphäre oder das gesamte Universum. Mit diesen Programmen können wir die Zukunft voraussagen, Theorien bestätigen oder widerlegen und "virtuelle Labors" betreiben, die chemische Reaktionen ohne Reagenzgläser erforschen.

Im allgemeinen erlaubt größere Rechenleistung eine größere Annäherung an die Wirklichkeit. Dies hat die Entwicklung von Computern angetrieben, die so schnell wie nur möglich sind. Ein Weg, Berechnungen zu beschleunigen, ist sie zu "parallelisieren" - sie in Stücke aufzuteilen, an denen unterschiedliche Prozessoren gleichzeitig arbeiten können. Die meisten modernen Supercomputer arbeiten so, mit vielen Prozessoren in einem Gehäuse.

Die ökonomischen Kräfte, welche die Technologie formen, bevorzugen große Dimensionen. Ein Unternehmen kann mehr für die Entwicklung eines CPU Chips aufwenden, wenn es Millionen davon verkaufen wird. So haben die Chips, die in den Heimcomputern benutzt werden (wie der INTEL - Pentium und der Motorola Power-PC) sich schnell entwickelt; tatsächlich haben sie ihre Geschwindigkeit etwa alle 18 Monate verdoppelt. Eine Tendenz, die als "Moor's Gesetz" bekannt ist.

In den neunziger Jahren geschahen zwei wichtige Dinge. Erstens wurden PC, aufgrund von "Moor's Gesetz", so schnell wie Supercomputer nur einige Jahre vorher. Zweitens erweiterte sich das Internet in Richtung Konsumentenmarkt. Plötzlich gab es die Millionen der schnellen Computer, verbunden durch ein Netzwerk. Bei vielen Leuten kam, unabhängig voneinander, die Idee auf, diese Computer wie einen parallelen Supercomputer zu nutzen. Zwei Projekte dieser Art tauchten 1997 auf: GIMPS, das nach großen Primzahlen sucht, und Distributed.net, das verschlüsselte Botschaften dechiffriert. Diese Projekte haben Tausende von Teilnehmern angezogen.

1999 wurde ein drittes Projekt - SETI@home - gestartet, mit dem Ziel, von intelligenten Zivilisationen außerhalb der Erde ausgestrahlte Radiosignale zu ermitteln [1]. SETI@home arbeitet als Bildschirmschoner, läuft nur wenn der PC untätig ist und bietet eine graphische Anzeige der Arbeit die gerade getan wird. SETI@home fand Anklang über die Hobbyisten hinaus, es sprach Millionen von Teilnehmern von überall auf der Welt an. Es spornte eine Anzahl von anderen akademischen Projekten sowie einige Firmen an, die versuchten, das Paradigma des Public Computing zu kommerzialisieren.

2) Die Kraft des Public Computing

Public Computing kann mehr Rechenleistung bereitstellen als jeder Supercomputer, Cluster oder Grid und der Unterschied wird mit der Zeit noch wachsen. SETI@home läuft z.Z. auf ungefähr 1 Million Computer. Diese liefern eine Verarbeitungsleistung von 60 TeraFLOPS (Billionen Gleitkommaoperationen pro Sekunde). Dem gegenüber liefert der größte herkömmliche Supercomputer, der IBM ASCI White, ungefähr 12 TeraFLOPs. Die 1 Million Computer von SETI@home stellen einen kleinen Bruchteil der weltweit ungefähr 150 Millionen mit dem Internet verbundenen PC's dar. Diese letzte Zahl wird bis 2015 auf eine Milliarde anwachsen. So hat das Public Computing das Potential viele PetaFLOPS an Rechenleistung zur Verfügung zu stellen.

Moor's Gesetz erklärt, dass die Geschwindigkeit von CPU Chips sich alle 18 Monate verdoppelt. Die Steigerungsrate für grafische Coprozessoren, Chips welche 3D Grafik in PC und Spielkonsolen abwickeln, ist sogar noch höher. Ihre Verdopplungszeit beträgt etwa 8 Monate und aktuelle Grafik Chips haben eine vielfach höhere Geschwindigkeit bei der rohen Gleitkomma Arithmetik als die CPU des Rechners. Diese Grafik Chips werden programmierbarer und flexibler und Forscher untersuchen aktiv ihren Nutzen für wissenschaftliche Berechnungen. Weil Grafik Chips in modernen PC's integriert sind bevorzugt diese Entwicklung Public Computing gegenüber anderen Paradigmen.

Die meisten zu berechnenden Aufgaben benötigen Speicherkapazität (Plattenplatz) ebenso wie das Rechnen. Auch hier können öffentliche Quellen beispiellose Kapazitäten zur Verfügung stellen. Heute liefert ein typischer PC ungefähr 80 Gigabytes Speicherplatz, was in den meisten Fällen mehr ist, als vom PC Besitzer verwendet wird. Wenn 100 Millionen Computerbenutzer jeweils 10 Gigabyte Speicherplatz zur Verfügung stellen würden, würde die Summe ein Exabyte (10 hoch 18) sein - größer als die Kapazität jedes zentralen Speichersystems.

3) Die sozialen Aspekte von Public Computing

Public Computing ist nur effektiv wenn viele Menschen daran teilnehmen. SETI@home ist in dieser Hinsicht sehr erfolgreich gewesen; wir haben 4,6 Millionen Teilnehmer angezogen, von denen ungefähr 600.000 aktiv bleiben.

Die Menschen erfuhren von SETI@home über verschiedene Mechanismen. Die Massenmedien haben SETI@home herausgestellt, ebenso die Internet-News-Foren wie Slashdot [2]. Die SETI@home Bildschirmschonergrafiken sind ein leistungsfähiger Promotionsmechanismus: In den Büros und in der Schule, wo Computer von vielen Menschen gesehen werden, ist ein Computer, auf dem SETI@home läuft eine höchst sichtbare Werbung.

Wer nimmt an SETI@home teil und warum? Um diese Frage zu untersuchen führten wir eine Online-Umfrage durch, auf die ungefähr 130.000 Teilnehmer reagiert haben. Unsere Webseite erlaubt Benutzern Onlineprofile einzurichten die sie selbst beschreiben; über 50.000 haben das gemacht. Wir richteten Online-Foren mit vielen tausend Teilnehmern ein und wir haben die anekdotenhaften Informationen einer Email-Kommunikation mit Tausenden von Benutzern.

Unsere Umfrage zeigt, dass 92% der SETI@home Benutzer männlich sind und dass die meisten von ihnen hauptsächlich durch ihr Interesse an der zugrunde liegenden Wissenschaft motiviert werden: Sie wollen wissen, ob intelligentes Leben außerhalb der Erde existiert. Ein anderer Hauptmotivationsfaktor ist öffentliche Anerkennung. SETI@home verfolgt den Beitrag jeden Benutzers (d.h. die Menge der durchgeführten Berechnungen) und bietet zahlreiche webbasierte "Ranglisten", wo Benutzer nach ihren Beträgen angeordnet werden. Benutzer können auch Teams bilden, die wieder ihre eigenen Ranglisten haben. Der Team-Mechanismus erwies sich als sehr effektiv zur Gewinnung neuer Teilnehmer.

Einige SETI@home Teilnehmer versuchen zu "cheaten" - Anerkennung für Berechnung zu erhalten, die nicht wirklich durchgeführt wurden. Sogar noch problematischer sind Benutzer, die absichtlich falsche Informationen zurückliefern und die Berechnungen im wesentlichen zerstören. Diese Probleme können adressiert werden, indem man die Berechnungen redundant durchführt und die Ergebnisse vergleicht.

Die SETI@home Teilnehmer haben noch mehr als CPU Zeit beigetragen. Freiwillige haben die SETI@home Webseite in 30 Sprachen übersetzt und viele Arten von Zusatzsoftware und untergeordneten Webseiten entwickelt. Wir glauben, dass es wichtig ist Kanäle für diese Art von Beiträgen zur Verfügung zu stellen.

Verschiedene "Gemeinschaften" haben sich um SETI@home gebildet. Es gibt eine einzelne weltweite Gemeinschaft, die durch die SETI@home Webseite interagiert. Ebenso gibt es nationale oder sprachenspezifische Gemeinschaften, mit ihren eigenen Internetauftritten und Foren. Die SETI@home Benutzergruppe in Deutschland hält seit mehreren Jahren Treffen ab. Mindestens drei Paare haben sich durch die SETI@home Gemeinschaften kennen gelernt und geheiratet.

4) Die technischen Aspekte von Public Computing

Die Durchführung eines Public Computing Projektes erfordert das Anpassen von Anwendungsprogrammen an verschiedene Plattformen, die Einrichtung von Serversystemen und Datenbanken, die Überwachung von Benutzerkonten und Credits, das Beschäftigen mit redundanten Berechnungen und Fehlerbedingungen und andere Aufgaben, zu zahlreich um hier aufgelistet zu werden.

Wir entwickeln zur Zeit eine Software mit dem Namen "Berkeley Open Infrastructure for Network Computing (BOINC)" welche die meisten der genannten Probleme lösen soll oder helfen soll sie zu lösen. BOINC macht es ziemlich einfach und preiswert, eine vorhandene Anwendung in ein Public Computing Projekt umzuwandeln. BOINC Projekte sind autonom; jedes behält seine eigenen Server und Datenbanken und ist nicht von anderen abhängig.

Teilnehmer können sich bei mehreren Projekten anmelden und steuern, wie ihre Ressourcen aufgeteilt werden. (Zum Beispiel könnte ein Benutzer 60% seiner Computerzeit dem Studium der globalen Erwärmung widmen und 40% SETI@home.

Einige BOINC basierte Projekte, einschließlich SETI@home, sind im Kommen, ein biochemisches Projekt genannt Folding@home [4] und ein Klimastudien-Projekt mit Namen Climateprediction.net [3]. BOINC ist eine Ergänzung zu den "GRID" Systemen, die Ressourcenteilung nur innerhalb oder zwischen Instituten zulassen, aber kein Public Computing unterstützen [5].

5) Anwendungen für Public Computing

Um für Public Computing geeignet zu sein, muss eine Aufgabe in unabhängige Stücke teilbar sein deren Verhältnis von Berechnungen zu Daten hoch ist. (Andernfalls könnten die Kosten für den Datentransport im Internet die Kosten für eine zentrale Berechnung übersteigen) Viele Arten von Berechnungen haben diese Eigenschaften:

6) Zusammenfassung

Carl Sagan hat beobachtet, dass die Einstellung der Öffentlichkeit gegenüber der Wissenschaft zunehmend eine von Entfremdung und sogar Feinseligkeit ist [7]. Public Computing könnte helfen diese Tendenz umzukehren. Wenn Computerbesitzer ihre Ressourcen jedem beliebigen, aus einem breiten Bereich von Projekten spenden können, werden sie diese Projekte studieren und prüfen, ihre Ziele, Methoden und Erfolgschancen kennen lernen. Dieser Prozess könnte weiter angeregt werden durch die Schaffung von "Entscheidungsmärkten", in denen die Öffentlichkeit virtuelle Wetten oder Investitionen tätigen kann, basierend auf den Resultaten der wissenschaftlichen Projekte, analog zu politischen Entscheidungsmärkten [8].

Weil Computerbesitzer jedes Projekt ihrer Wahl unterstützen können, wird die Kontrolle über die Zuteilung von Ressourcen für die Wissenschaft weg von den Regierungsfinanzagenturen (mit den unzähligen Faktoren, die ihre politischen Linien steuern) in Richtung Öffentlichkeit verschoben. Das hat seine eigenen Gefahren: Die Öffentlichkeit könnte einfacher zu betrügen sein als ein Kontrollforum. Aber es bietet eine sehr direkte und demokratische Methode zum Festlegen der Forschungspolitik.

Wenn ein Wissenschaftler eine Idee für eine Berechnung hat und dann feststellt, dass diese eine Millionen Jahre Computerzeit benötigen würde, ist die normale Reaktion die Idee in einen Mülleimer zu werfen. Aber Public Computing macht solche Ideen durchführbar. SETI@home hat 1,5 Millionen Jahre CPU-Zeit verwendet. Wissenschaftler können nun die verworfenen Ideen wiederbeleben und erneut prüfen.

Referenzen

[1] D. P. Anderson, J. Cobb, E. Korpela, M. Lebofsky, and D. Werthimer. SETI@home: An experiment in public-resource computing. Communications of the ACM, Nov. 2002, Vol. 45 No. 11, pp. 56-61. See also http://setiathome.berkeley.edu
[2] http://www.slashdot.org
[3] http://climateprediction.net (offline)
[4] http://folding.stanford.edu/german/
[5] http://www.globalgridforum.com/
[6] R. Motwani and P. Raghavan. Randomized Algorithms. Cambridge University Press, 1995.
[7] C. Sagan. The Demon-Haunted World: Science As a Candle in the Dark. Random House, 1996.
[8] R. Forsythe, T. A. Rietz, and T. W. Ross. Wishes, expectations, and actions: A survey on price formation in election stock markets. Journal of Economic Behavior and Organization, 39:83--110, 1999.