Presseausgabe, 21. August 2002
Die Augen haben es in sich
Schnell schreiben ohne Tastatur
An der Universität Cambridge wurde ein neues Texteingabesystem
entwickelt, das den Umgang mit Computern revolutionieren könnte -
für Menschen, die nicht in der Lage sind, eine Tastatur zu bedienen.
Das Texteingabesystem nennt sich Dasher. Es wurde von David MacKay und
David Ward in der dortigen Fakultät für Physik entworfen und
kann über einen Eyetracker gesteuert werden - eine Kamera, die aufzeichnet,
auf welche Stelle des Bildschirms der Anwender gerade schaut.
"Die Software funktioniert wie ein Videospiel, wo der Anwender immer
tiefer in eine riesige Bibliothek hineinsteuert", erläutert Dr. MacKay.
"Mit dem eingesetzten Sprachmodell wird diese Bibliothek so gestaltet,
dass schnell und leicht die wahrscheinlichen Zeichenfolgen ausgewählt
und dass Buchstabierfehler erschwert werden."
Das System wird in der heutigen Nature-Ausgabe beschrieben (22. August
2002). Es ist viel schneller als alle anderen Schreibsysteme, die durch
Eyetracker gesteuert werden. Experimente haben gezeigt, dass Dasher bis
zu 25 Wörter pro Minute schreiben kann. Anwender die über einen
Eyetracker auf einer am Bildschirm agebildeten Tastatur schreiben, schaffen
nur 15 Wörter pro Minute. "Es ist nicht nur schneller als jedes alternative
Schreibsystem mit Eyetrackersteuerung - die Häufigkeit von Buchstabierfehlern
ist ungefähr fünfmal kleiner - und die Benutzung des neuen Systems
ist auch weniger stressig", fügt Dr. MacKay hinzu.
Die Arbeitsweise von Dasher ist besonders differenziert, weil es durch
natürliche Zeige-Gesten gesteuert wird. Es baut auf der natürlichen
menschlichen Fähigkeit auf, hochpräzise analoge Bewegungen auszuführen.
Auf einer Tastatur wird der Text mit Alles-oder-Nichts-Bewegungen eingegeben
und die genannte Fähigkeit wird nicht genutzt.
Dasher unterscheidet auch nicht zwischen kompletten Wörtern und
dem normalen Schreibvorgang. Andere Schreibsysteme schlagen auf einem separaten
Sektor des Displays Wörter vor, und der Anwender muss durch Schauen
oder Zeigen eine Auswahl treffen. Dashers Vorschläge sind wie selbstverständlich
in den Schreibprozess integriert. Das Sprachmodell passt sich an den individuellen
Schreibstil des Anwenders an, sodass mehrere Wörter manchmal auf einen
Blick geschrieben werden können.
Dasher ist besonders hilfreich für Computeranwender, die nicht
in der Lage sind, eine herkömmliche Tastatur zu bedienen. Weil es
über ein beliebiges Zeigehilfsmittel gesteuert werden kann - Maus,
Trackball, Touchpad, oder Eyetracker - ist es auch auf Handhelds oder Mobiltelefonen
einsetzbar, wo die Tastatur aus Platzgründen fehlt. Außerdem
besitzt es ein Potential als Eingabesystem für andere Sprachen, wie
z.B. Japanisch.
David MacKay und David Ward planen, Dasher als Open-Source-Software
vergleichbar mit GNU/Linux weiterzuentwickeln.
Hinweise für Herausgeber: Der Artikel "Fast hands-free writing
by gaze direction" (freihändig mit dem Blick Schnellschreiben), wurde
von David J. Ward und David J.C. MacKay in "Nature" am 22. August 2002
publiziert.
Nähere Informationen über Dasher einschließlich Videodemonstrationen
und Images erhalten Sie bei:
http://www.inference.phy.cam.ac.uk/dasher/.
Weitere Presseinformationen sind online verfügbar.
Falls Sie weitere Informationen wünschen, wenden Sie sich bitte
an:
David MacKay, Department of Physics, University of Cambridge.
Tel: 01223 339852; e-mail: mackay@mrao.cam.ac.uk
Alison McFarquhar, Press and Publications Office, University of Cambridge.
Tel: 01223 332300; e-mail: am353@cam.ac.uk
Cambridge
University's press office.
EndPage Alias QA.html FoldingPage Further Press Info
Presseinformation
Zugänglich ab 19:00 Uhr British Meaning Time / 1400
US Eastern Time, 21. August 2002
Einige häufig gestellte Fragen (FAQs)
-
Warum haben Sie Dasher erfunden?
Ich (David MacKay) war überzeugt, dass Standardtexteingabesysteme
(wie Zehnfingertastaturen) sehr ineffizient sind - sie besitzen nicht die
Vorhersagekraft der natürlichen Sprache und sie nutzen unsere Fähigkeit
zu hochpräzisen Gesten nicht aus.
I glaubte, dass wir auf einer bekannten Grundlage - nämlich der
Informationstheorie - vollständig neue Schreibsysteme mit weniger
Hardware als Tastaturen erhalten können, die trotzdem beinahe so schnell
arbeiten - und dass sie in Zeigeysteme wie z.B. Eyetracker integriert werden
könnten.
-
Für wen ist Dasher gedacht?
Unterschiedliche Gruppen werden Dasher hilfreich finden. Ihr gemeinsames
Interesse ist, eine Alternative zur regulären Zehnfingertastatur zu
finden.
Die Gruppe darunter sind Palmtopcomputerbenutzer, deren
Tastaturen nicht die vollen Abmessungen besitzen. Viele von denjenigen,
die sich die Pocket-PC-Version von Dasher heruntergeladenhaben, finden,
dass es leicht zu erlernen ist und Spaß macht.
Diejenige Gruppe, für die Dasher unserer Ansicht nach die größten
Vorzüge bietet, sind Personen mit besonderen Bedürfnissen.
Viele von denen, die keine Tastatur bedienen, wohl aber eine normale Maus,
Joystick, Trackball, Touchscreen oder Kopfmaus (und natürlich nur
diejenigen, die ihren Bildschirm sehen können), werden Dasher hilfreich
finden. Innerhalb von 10 Minutenkönnen diese Anwender mit Dasher 5
bis 15 Wörter pro Minute schreiben. Nach 60 Minuten Übung beträgt
die Schreibgeschwindigkeit 15 bis 25 Wörter pro Minute. Mit noch mehr
Übung kann man 39 Wörter pro Minute erreichen.
Für Schwerbehinderte, die mit den obengenannten Zeigesystemen
nicht umgehen können, wohl aber mit ihren eigenen Augebn, bietet Dasher
enorme Vorteile, wenn es zusammen mit einem Eyetracker verwendet
wird. Mit der entsprechenden Übung können Schreibgeschwindigkeiten
von 20-25 Wörtern pro Minute erzielt werden.
Eine weitere Gruppe, für die eine gewöhnliche "qwertz"-Tastatur
unpraktisch ist, sind Japanische Computerbenutzer. Viele von ihnen können
mit dem lateinischen Alfabet nicht umgehen. Es ist mühsam, Japanisch
mit einer lateinischen Tastatur zu schreiben. Dasher kann in fast jeder
Sprache verwendet werden, und wir haben einen japanischen Prototyp entwickelt,
der mit dem phonetischen Hiragana-Alphabet schreiben kann.
-
Wie kamen Sie auf die Idee der Schnittstelle mit invers-arithmetischer
Codierung?
Ich (David MacKay) saß Dezember 1997 mit Mike Lewicki im Bus zum
Flughafen Denver. Ich gab gerade etwas in meinen Minicomputer ein (ein
Psion 3a mit einer kleinen "qwerty"-Tastatur), und Mike kommentierte: "Ei
der daus, wie groß der Kasten doch ist!" Und nun dachten wir über
die Frage nach: "Wie könnten wir einen kleineren Minicomputer bauen,
vorausgesetzt die Tastatur sei der limitierende Faktor?" Unser Brainstorming
zur Schaffung eines Hilfsmittels mit einem niedlich kleinen Display mündete
in einer Brille und einem Eingabesystem nicht größer als 2cm
mal 2cm, das am Jackenzipfel befestigt werden kann und nur mit dem Finger
bedient wird.
Wir waren überzeugt, etwas effizienteres als eine herkömmliche
Tastatur zu machen. Aus zwei Gründen ist eine Tastatur ineffizient.
Erstens muss jeder Buchstabe durch eine eigene Fingerbewegung eingegeben
werden - aber ein normaler Text ist hochredundant und deshalb in hohem
Maß vorhersehbar. Der Informationsgehalt eines normalen Texts beträgt
nur ein bis 2 Bits pro Buchstabe. Deshalb nahmen wir uns vor, ein Sprachmodell
in das Herzstück des Texteingabewerkzeugs zu integrieren, um diese
Vorhersehbarkeit besser auszunutzen und die Belastung des Anwenders zu
reduzieren. Zweitens: Der lateinische Ausdruck ''digitis" für den
menschlichen Finger wird heute zwar heute auch als ''digit'' verwendet,
aber die Finger sind und bleiben analoge Werkzeuge mit ihrer besonderen
Fähigkeit zu feinen, kontinuierlichen Gesten. Die groben, klumpigen
Tasten missachten unsere Fähigkeit, hochpräzise Bewegungen auszuführen.
Stattdessen zwingen sie uns zu binären Bewegungen, indem wir die Tasten
drücken müssen. Nach unserer Einschätzung kann ein einzelner
Finger grundsätzlich Informationen mit einer Datenrate von circa 24
bit pro Sekunde anzeigen.
Wenn wir einen einzigen Finger (der Informationen mit einer Rate von
24 bit pro Sekunde weitergibt), mit einem guten Sprachmodell verknüpfen
könnten (das den Text zu einem Bit pro Buchstabenkomprimiert), dann
könnten wir vielleicht mit einer Geschwindigkeit von 24 Buchstaben
pro Sekunde schreiben!
Hier hatte ich die Idee, einen invers-arithmetischen Codierer zu konstruieren.
Der Anwender könnte die Schnittstelle durch zweidimensionale Zeichen
steuern, zum Beispiel auf einem 2D-Trackpad. Und weil der Anwender sieht,
wohin sich die Zeichen bewegen, brauchen wir nicht einmal den Trackpad:
Wir könnten genauso gut einen Eyetracker benutzen, um die gleiche
steuernde Information zu erhalten.
Damit war die Idee von 'Dasher' geboren. (Den Namen hat Mike vorgeschlagen.)
Mike dachte sich, dass man einen Prototyp am besten in Tcl schreiben sollte,
und als wir am Flughafen Denver ankamen, hatte Mike mir gerade soviel Tcl
beigebracht, dass ich eine einfache zoomende Schnittstelle zusammengezimmert
hatte.
Innerhalb einer Woche hatte ich den ersten Prototypen von 'Dasher' fertiggestellt.
Noch eine weiteres Motiv hatte mich beflügelt: Dasher ist
ein invers-arithmetischer Codierer - es würde ein praktisches Lehrmittel
abgeben, und zwar für arithmetische Codierung in meinem Fortgeschrittenenkurs
über Informationstheorie, Mustererkennung und Neuronale Netze.
Seit Januar 1998 habe ich alle Jahre wieder Dasher eingesetzt, um arithmetische
Codierung zu lehren.
-
Wie funktioniert die Texteingabe? Können Sie
sie so beschreiben, dass ich sie mir bildhaft vorstellen kann?
Mit Worten ist das schwer zu erklären -soger mit Bildern ist es
schwierig!
(Eine Online-Erklärung
mit Bildern gibt es hier) Am einfachsten lässt es sich
mit einer Live-Vorführung zeigen. Wie auch immer, versuchen wir's
mal:
Stellen Sie sich eine Bibliothek mit allen möglichen Büchern
vor. Alle Bücher seien auf einem einzigen Regalboden
alfabetisch geordnet. (Ja genau, ich meine alle möglichen
Bücher. Diese Bibliothek wird manchmal die Bibliothek von Babel gennannt.)
Bücher mit dem Anfangsbuchstaben "a" stehen links. Bücher mit
dem Anfangsbuchstaben "z" stehen
rechts. Das erste Buch in Abschnitt "a" liest sich wie "aaaaaaaaaaaa...";
irgendwo rechts davon befinden sich Bücher, deren Titel mit "all good
things must come to an end..." beginnt; ein kleines bisschen weiter rechts
befinden sich Bücher, deren Titel mit "all good things must come to
an enema..." beginnt.
Wenn jemand ein Textstück schreibt, dann wird er seinen nächsten
Textbaustein aus dieser "Bibliothek aller Bücher" auswählen
- nämlich dasjenige Buch, das genau den zu wählenden Textbaustein
enthält. Wie wird dieses Buch angewählt? Stellen wir uns
einmal vor, es soll "all good things..." geschrieben
werden...
Zuerst wandert unser Benutzer in den Abschnitt "a" der Bibliothek. Dort
wird er mit denjenigen Büchern konfrontiert, die mit
"aa", "ab", "ac,.... "az" beginnen. Sobald er dem "al" - Abschnitt
näher rückt, kann er schon Bücher sehen, die
mit "ala", "alb",... "alz" anfangen.
Der Schreibende rückt dem Regal immer näher und wird das Buch
finden, das genau den Text enthält, den er schreiben wollte.
Anstelle von "Schreiben" können wir den Vorgang beschreiben als
Hineinzoomen
in eine alfabetische Bibliothek, indem
wir in die richtige Richtung gehen.
Genauso funktioniert Dasher, mit einer tückischen Ausnahme: Wir
ändern die GRÖSSE der Stellfläche für jedes Buch entsprechend
der Wahrscheinlichkeit des zugehörigen Texts. Beispielsweise
werden nicht viele Bücher mit "x" beginnen. Deshalb können wir
"x..." weniger Platz zur Verfügung stellen - dafür gibt es mehr
Platz für die plausibleren Bücher, damit wir den wahrscheinlichen
Text leichter finden.
Im Endeffekt haben wir nicht das Gefühl, wie bei der Schreibmaschine
nur einzelne Buchstaben zu schreiben - sondern es kommt uns Anwendern so
vor, wie wenn uns ganze Silben, ganze Wörter, ja sogar ganze Sätze
entgegeneilten.
Der Anwender steuert sein Schreiben, indem er in die Richtung zeigt,
in die er gehen will. Die Anzeige zoomt weiter in die von ihm angedeutete
Richtung. Und weil jeder Anwender typischerweise in die Richtung schaut,
die er einschlagen will, ist es nicht einmal notwendig dorthin zu zeigen
- wir können einfach seine Augen verfolgen und die Blickrichtung als
Zeiger nutzen.
-
Wie funktioniert arithmetrische Codierung? Können
Sie sie so beschreiben, dass ich sie mir bildhaft vorstellen kann?
Arithmetische Codierung ist eine herrliche Methode zur Textkompression.
Normalerweise brauche ich zur Erklärung eine Vorlesungseinheit.
Stellen Sie sich ein Lineal vor, z.B. mit 30 cm Länge. Markieren
Sie es auf halber Länge. Markieren Sie die linke Hälfte "0" und
die rechte Hälfte "1". Nun halbieren Sie die linke Hälfte und
markieren die zwei Viertel "00" and "01". Genauso halbieren Sie die rechte
Hälfte und markieren die zwei Viertel "10" and "11". Jetzt haben wir
sechs Intervallbezeichnungen vergeben: "0" und "1" sowie "00", "01",
"10", und "11". Die letzten vier Intervalle können wir weiter unterteilen
und bekommen acht Intervalle wie: "000" and "101" usw. Es kann
also ein beliebiger Abschnitt (und ein beliebig kleiner Abschnitt!) mit
einer binären Zeichenfolge assoziiert werden.
Nun hängt die Textkompression natürlich davon ab, ob der Text
Redundanzen enthält, und eine beliebige Redundanz kann mit einem probabilistischen
Modell beschrieben werden, welches uns sagt, welcher Buchstabe in dem Dokument
wahrscheinlich
der erste ist, und welcher wahrscheinlich der zweite ist (unter
der Voraussetzung, der wahrscheinlichste erste sei es wirklich!) usw.
Arithmetische Codierung geht von der Annahme aus, dass Sie irgendwoher
solch ein Modell haben.
Wenden wir uns mal der Vorhersagen des probabilistischen Modells zu:
Nehmen wir mal an, die vorhergsagten Wahrscheinlichkeiten für den
ersten Buchstaben (a,b,c,...., oder z) seien P(a)=0.05;
P(b)=0.02; P(c)=0.03; ... P(e)=0.10; ... P(t)=0.20; ....
Wir können diese Wahrscheinlichkeiten nutzen, um das Lineal in
Stückchen zu teilen. Die 5% ganz links auf dem Lineal nennen wir "a",
die nächsten 2% nennen wir "b" usw.
Danach können wir die "a"-Portion des Lineals in "aa", "ab", "ac",...
unterteilen, jeweils entsprechend den einzelnen Wahrscheinlichkeiten, die
von dem probabilistischen Modell zugeordnet werden, sobald wir die Frage
stellen: ''Angenommen der erste Buchstabe sei ein "A", welcher Buchstabe
wird wahrscheinlich der zweite sein?''
So wird jede mögliche Zeichenfolge einem kleinen Abschnitt des
Lineals zugeordnet. Danach codiert die arithmetische Codierungsmethode
einfach die gegebene Zeichenfolge, indem sie kürzeste binäre
Zeichenfolge findet, die demselben Stück des Lineals entspricht.
-
Wie passt sich das Modell der Sprache des Schreibenden
an?
-
Wir verwenden ein Sprachmodell namens PPM (prediction by partial match,
dt.: Vorhersage durch teilweise Übereistimmung). Dieses Sprachmodell
erzeugt seine Vorhersagen, indem es zählt, wie oft jeder Buchstabe
im Trainingstext in einer ähnlichen Zusammenstellung vorkam. Das Modell
kann leicht adaptiert werden durch beliebige Eingaben des Anwenders in
die Übungstextdatenbank. Es funktioniert mit fast jeder Sprache.
-
Wie sehr ermüden die Augen bei dieser Methode?
Eine benutzerfreundlichere Methode, als mit den eigenen Augen zu schreiben,
können wir uns nicht vorstellen. Ähnlich wie beim Autofahren
verbringen Ihre Augen viel Zeit damit, dahin zu schauen, wohin Sie fahren.
Wir können uns deshalb grundsätzlich vorstellen, uns des Steuerrads
zu entledigen und das Auto einfach dahin fahren zu lassen, wohin Ihre Augen
gerade schauen. Diese freihändige Art zu fahren wäre für
die Augen des Fahrers überhaupt nicht anstrengender als das normale
Fahren.
Ein ähnliches Gefühl hat man beim Schreiben mit Dasher. Es
geht fast mühelos. Schauen Sie einfach auf dem Bildschirm nach der
ersten Silbe, die Sie schreiben wollten: sie zoomt an Ihnen vorbei, und
die nächsten möglichen Silben erscheinen; meistens können
Sie die nächste von Ihnen gewünschte Silbe leicht ausmachen.
Sie fixieren die Silbe, sie zoomt herbei, und die nächsten Optionen
erscheinen. Es wird keine bewusste Kontrolle der Augen benötigt.
Die Benutzung billiger und einfacher Eyetracker kann bei jeder Anwendung
ermüdend sein, weil solche Eyetracker leicht von einem blinkenden
Auge gestört werden oder schlecht kalibriert sind. Diese Probleme
beruhen aber nicht auf Dasher, sondern auf dem Eyetracker.
-
Wie schnell ist Ihre Methode im Vergleich zu anderen
Texteingabemethoden?
In unserer Publikation, "Schnelles
freihändiges Schreiben mit dem Blick", in Nature
vom 22. August 2002 vergleichen wir einen Eyetracker mit Bildschirmtastatur
mit Dasher, dessen Wortergänzung über einen Eyetracker gesteuert
wird. Dasher-Anwender konnten nach einer Übungsdauer von einer Stunde
bis zu 25 Wörtern pro Minute schreiben. Die Benutzer der Bildschirmtastatur
konnten nach der gleichen Übungszeit nur 15 Wörter pro Minute
schreiben. Außerdem betrug die Fehlerrate bei der Benutzung
der auf dem Bildschirm angezeigten Tastatur ungefähr dasd Fünffache
derer von Dasher. Es ist schwierig, unter Dasher Buchstabierfehler zu machen,
weil das Sprachmodell die Auswahl korrekter Schreibweisen erleichtert.
Zu Geschwindigkeit und Fehlerrate noch weitere wichtige Faktoren hinzu.
Anwender, die beide Systeme ausprobiert hatten, berichteten, dass sie die
Bildschirmtastaturaus zwei Gründen anstrengender fanden: Erstens ist
man sich unsicher, ob im aktuellen Wort ein Fehler vorliegt (die Ergänzungsautomatik
funktioniert nur, wenn keine Fehler gemacht wurden), denn ein Fehler kann
nur erkannt werden, wenn man nicht auf die Tastatur schaut. Zweitens
muss man bei jedem Buchstaben entscheiden, ob man die Wortergänzung
verwenden oder weiterschreiben soll. Nach dem Wortergänzungsfenster
zu schauen ist wie ein Gücksspiel, denn man kann sich nicht
sicher sein, ob das benötigte Wort dort wirklich angezeigt wird. Selbst
wenn es angezeigt wird - es ist zusätzliche mentale Aktivität
für das Suchen und Finden der richtigen Ergänzung nötig.
Demgegenüber sehen die Anwender von Dasher gleichzeitig die zuletzt
geschriebenen Buchstaben und die wahrscheinlichsten Optionen für
die nächsten. Und es ist Dasher egal, wie Sie schreiben wollen - es
braucht nicht zu unterscheiden zwischen Wortergänzung und normalem
Schreiben.
Auch haben wir das mausgesteuerte Dasher mit anderen Zeigegerät-basierten
Texteingabesystemen verglichen. Alle Anwender werden mit der Übung
schneller, und die Schreibgeschwindigkeiten der sehr Erfahrenen haben mit
der Maus 39 Wörter pro Minute erreicht. Das ist noch nicht
so schnell wie die Geschwindigkeit mit dem Zehnfingersystem auf einer voll
dimensionierten Tastatur, aber wir sind weder auf eine Tastatur mit Platzbedarf
angewiesen noch auf die zwei Hände, mit denen wir sie bedienen müssten.
Wir
brauchen nur einen Finger!
-
Wie lange braucht man, um mit Dasher englisch Schreiben
zu lernen?
Wir können zur mausgesteuerten Version von Dasher und zur Eyetrackerversion
nähere Angaben machen.
-
Mit der Maussteuerung: Innerhalb 10 Minuten können Dasher-Neulinge
auf Englisch mit 5 bis 15 Wörtern pro Minute schreiben. Nach 60 Minuten
Übung rangieren die Schreibgeschwindigkeiten bei 15 bis 25 Wörtern
pro Minute. Unser erfahrenster Dasheranwender, David Ward, schreibt mit
39 Wörtern pro Minute.
(Einige
experimentelle Ergebnisse können Sie hier online abrufen)
-
Mit dem Eyetracker können Neulinge auf Englisch nach 10 Minuten
mit 7 Wörtern pro Minute schreiben und nach 60 Munuten Übung
mit 12-15 Wörtern pro Minute. Erfahrenere Dasher-Anwender können
20-25 Wörter pro Minute schreiben.
Können Sie eine Person beschreiben, die sowohl
einige Sätze mit Ihrer Methode als auch mit einer Bildschirmtastatur
geschrieben hat?
Mit einer normalen bildschirmabgebildeten Tastatur müssen Sie den
ersten zu schreibenden Buchstaben eine vorgegebene Zeit lang anschauen
(diese sogenannte ''Verweilzeit - engl: dwell time'' ist im Sinne einer
Reaktionszeit Ihres Computers voreingestellt - zum Beispiel auf eine halbe
Sekunde). Danach schauen Sie auf den nächsten Buchstaben usw.
Das ist fürchterlich langsam und ermüdend. Das Ziel der Evolution
unserer Augen war nicht das ''Knöpfchendrücken''! Wenn
Sie die Reaktionszeit verringern, haben Sie immer noch das Gefühl
der Langsamkeit und Ermüdung, aber nicht mehr so schlimm wie bei der
ersten Einstellung. Nun aber führt die verringerte Reaktionszeit zu
Fehlern, weil Sie versehentlich bei den falschen Tasten ''verweilen''.
Zur Beschleunigung Ihres Schreibvorgangs haben Sie die Option, einige wenige
Sondertasten am oberen Rand der Tastatur anzuschauen. Diese bieten Ihnen
Wortergänzungen an. Weil Sie nur das lesen können, was Sie gerade
anschauen, werden Sie die angebotenen Wortergänzungen nur herausfinden,
indem Sie sich dazu entschließen, Ihren Blick auf das Wortergänzungsareal
zu richten. Dieses tasten Sie mit Ihrem Blick ab, während Sie gleichzeitig
versuchen, auf keinem der angezeigten Wörter zu lange zu verweilen.
Entweder müssen Sie jetzt das richtige Wort durch anschauen anwählen
(wenn Sie es denn finden) oder aufgeben zum Tastatur zurückkehren.
Sofern Sie zum Tastaturschreiben zurückkehren, sollten Sie sich jetzt
erinnern, bei welchem Buchstaben Ihr Schriftzug schon angelangt war! Den
zuletzt geschriebenen Buchstaben können Sie sich nur in Erinnerung
bringen, wenn Sie auf wieder ein anderes Bildschirmfeld schauen. Die Wortergänzung
ist hier weniger wertvoll, da sie nicht weiß, wann Ihren Augen ein
Tippfehler unterlaufen ist. Es läst sich wohl nicht vermeiden, dass
sie einige Wörter in Ihrem Satz falsch buchstabiert haben.
Wenn Sie für den gleichen Satz Dasher einsetzen, zeigt der Eingangsbildschirm
alle Schriftzeichen von a bis z vertikal an. Sobald sie auf den ersten
Buchstaben des Satzes blicken, zoomt die Anzeige in dieses Schriftzeichen
hinein. In diesem ersten Buchstaben erscheinen die möglichen Fortsetzungen.
Sie blicken Sie auf die Fortsetzung, die Sie wollen, und die Anzeige zoomt
dorthinein. Es handelt sich um einen kontinuierlichen Vorgang. Es gibt
keine abgestuften Auswahlstadien. Nur wenig links von der Stelle, auf die
man gerade blickt, sieht man die bereits augewählte Zeichenfolge.
Rechts kann man sehen, wie es wahrscheinlich weitergehen wird - geordnet
in alfabetischer Reihenfolge. Sie haben das Gefühl, Wortergänzungen
angeboten zu bekommen. Gleichzeitig tun Sie nichts anderes als zu schreiben,
indem Sie Buchstaben aus dem Alfabet aussuchen. Fehler werden seltener;
wenn Sie Dasher etwa eine Stunde lang geübt haben. Wenn Sie einmal
einen Fehler gemacht haben, merken Sie es typischerweise gleich danach,
weil das Modell dann die von Ihnen anschließend gewünschten
Zeichen nicht mehr richtig vorhersagt. Sie korrigieren die Fehler, indem
Sie zurückgehen -- blicken Sie auf die linke Seite des Bildschirms
statt
nach rechts -- danach blicken Sie wieder allmählich nach rechts.
Welche technischen Hindernisse waren zu überwinden,
damit Dasher funktioniert?
David Ward verdanken wir die Schwerarbeit, den Prototypen in eine
schnelle, brauchbare, effektive und schöne Software zu überführen
und sie zu prüfen. Besonders wichtige Beiträge waren Nichtlinearitäten
in der Darstellung des Bildes und Nichtlinearitäten in der Dasher
eigenen Dynamik. Nachdem die ursprüngliche lineare Version schon ganz
ordentlich funktionierte, schaffte es David, die Schreibgeschwindigkeit
wesentlich zu erhöhen, indem er klug Nichtlinearitäten einführte.
Die Schwachstelle in der Eyetrackerversion von Dasher ist die Auflösung
des Eyetrackers.
Was war an den Ergebnissen überraschend?
Wir waren hocherfreut darüber, dass man mit Dasher und einem Eyetracker
viel schneller schreiben kann, als es uns von vielen behinderten Anwendern
mit anderen Programmen berichtet wurde. Wir haben von einem Anwender erfahren,
der nur 6-9 Wörter pro Minute schreiben konnte. Hoffentlich versucht
er es mal mit Dasher. Wahrscheinlich wird seine Schreibgeschwindigkeit
damit verdreifacht.
Sie behaupten, Dasher verursache weniger Buchstabierfehler
als Standardmethoden. Aber - wie ernsthaft wurden die Fehler ausgewertet
und verglichen? Ein Buchstabierfehler wird vom Leser leicht erkannt. Ein
anderes Wort, das tweilweise zufällig ausgewählt wurde, kann
die ganze Bedeutung verändern. Haben Sie diesen qualitativen Gesichtspunkt
gründlich untersucht?
Eine gute Frage. Wir haben diesen Gesichtspunkt noch nicht einer formalen
Untersuchung unterzogen, aber ich kann Ihnen einige Rohdaten überlassen
und Ihnen einen vorläufigen Eindruck geben. Ich glaube, dass die meisten
Fehlbuchstabierungen der hier folgenden Textprobe nicht schwer wiegen und
dass viele von Ihnen aus Unsicherheit entstanden sind, wie man Jane Austens
Prosa überhaupt buchstabieren soll!
Den hier gezeigten Text schrieb ich in meiner neunten Sitzung mit dem
Eyetracker. Er angeblich 5 Fehler im Vergleich mit der Vorlage. [Interpunktion
und Großbuchstaben wurden damals grundsätzlich nicht berücksichtigt
mit der Ausnahme, dass die Satzenden mit doppeltem Unterstrich '__' gekennzeichnet
wurden.]
thewoodhouses_were_first_in_consequence_there__all_looked_up_to_them__she_had_ma
ny_acquaintance_in_the_place_for_her_father_was_universally_civil_but_not_one_am
ong_them_who_could_be_accepted_in_lieu_of_miss_taylor_for_even_half_a_day__it_wa
s_a_melancholy_change__and_emma_could_not_but_sigh_over_it_and_wish_for_impossib
le_things_till_her_father_awoke_and_made_it_ncessary_to_be_cheerful__his_spirits
_required_support__he_was_a_nervous_man_easily_depressed__fond_of_every_body_tha
t_he_was_used_to_and_hating_to_part_with_them__hating_change_of_every_kind__
Der korrigierte Text (Fehler wurden gekennzeichnet mit *) war folgender:
The*Woodhouses were first in consequence there. All looked up to
them. She had many acquaintance in the place, for her father was
universally civil, but not one among them who could be accepted in
lieu of Miss Taylor for even half a day. It was a melancholy change;
and Emma could not but sigh over it, and wish for impossible things,
till her father awoke, and made it n*ecessary to be cheerful. His
spirits required support. He was a nervous man, easily depressed;
fond of every body that he was used to, and hating to part with them;
hating change of every kind.
Das folgende Beispiel zeigt zwei geringfügige Fehler. Die anderen
drei kann ich nicht finden! Schauen wir uns ein anderes Beispiel an, Versuch
14. (Angeblich 4 Fehler)
the_real_evils_indeed_of_emmas_situation_were_the_power_of_having_rat
her_too_much_her_own_way_and_a_disposition_to_think_a_little_too_well
_of_herself__these_were_the_disadvantages_which_threatened_alloy_to_h
er_many_enjoyments__the_danger_however_was_at_present_so_unperceived_
that_they_did_not_by_any_means_rank_as_misfortunes__sorrow_came_a_gen
tle_sorrow_but_not_at_all_in_the_shape_of_any_disagreeable_consciousn
ess__miss_taylor_married__it_was_miss_taylors_loss_which_first_brough
t_grief__it_was_on_the_wedding_day_of_this_beloved_friend_that_emma_f
irst_sat_in_mour
The real evils, indeed, of Emma's situation were the power of having
rather too much her own way, and a disposition to think a little too
well of herself; these were the disadvantages which threatened alloy
to her many enjoyments. The danger, however, was at present so
unperceived, that they did not by any means rank as misfortunes *with*
*her*. Sorrow came -- a gentle sorrow -- but not at all in the shape of
any disagreeable consciousness.-- Miss Taylor married. It was Miss
Taylor's loss which first brought grief. It was on the wedding-day of
this beloved friend that Emma first sat in mournful thought of any
continuance.
In diesem Beispiel kann ich wiederum nur 2 Fehler finden (die beiden ausgelassenen
Wörter). Ich hoffe, dass diese Beispiele ausreichen um aufzuzeigen
wie zuverlässig Dasher ist, sobald man etwas geübter ist. Es
ist schwierig Fehler zu machen, weil man immer sehen kann, was man gerade
geschrieben hat. Deshalb glaube ich, dass man ein falsch geschriebenes
Wort erkennen würde.
Fünfundzwanzig Wörter pro Minute zu schreiben
ist immer noch langsamer als zu sprechen. Warum würde jemand Dasher
verwenden, wenn er stattdessen eine Spracherkennung benutzen könnte?
Dasher kann mit jeder normalen Maus, mit einer Touchscreen oder mit
einem Eyetracker verwendet werden. Die überwiegende Mehrheit der Dasheranwender
verwendet die normale Maus oder eine Touchscreen. Mit Maus oder Touchscreen
können bei entsprechender Übung 35 Wörter pro Minute erreicht
werden. Nach einer Stunde Übung sind 25 Wörter pro Minute ein
typischer Wert.
Das ist tatsächlich langsamer als die Sprechgeschwindigkeit. Steht
jemandem die Spracherkennung zur Verfügung, so sieht er vielleicht
keine Notwendigkeit, Dasher zu verwenden.
Dennoch mögen manche Menschen Dasher, weil ...
-
es ihnen ermöglicht, leise zu schreiben - klappernde Tasten gibt es
nicht mehr!
-
manche Menschen die Spracherkennung einfach nicht zum Laufen bringen können.
-
Sie Dasher auf jedem Computer einsetzen können, wohingegen Sie die
Spracherkennung nur auf einem Computer verwenden können, der mit Ihrer
Stimme trainiert wurde.
-
Umgebungsgeräusche eine Spracherkennung unmöglich machen.
-
Spracherkennung ein Kopfmikrofon erfordert und den Anwender zwingt, sich
eine Menge neuer Fertigkeiten anzueignen -- Sie werden wahrscheinlich mehrere
Tage brauchen, ein Spracherkennungssystem zu bedienen. Dagegen werden Sie
mit Dasher innerhalb von 5 Minuten klarkommen, und eine Stunde reicht bestimmt
aus, um 25 Wörter pro Minute zu erzielen.
-
Dasher kann bereits auf einem niedlichen Taschen-PC eingesetzt werden,
also auch dort, wo ein Spracherkennungssystem nicht mehr funktionieren
würde.
-
Ein erfahrener Dasher-Anwender macht fast keine Fehler mehr. Selbst der
am besten geschulte Spracherkennungsanwender mit der deutlichsten Aussprache
wird feststellen, dass das System etwa 5% der Wörter falsch schreibt.
Wieviel Rechenleistung benötigt Dasher?
Dasher kann problemlos auf jedem herkömmlichen PC betrieben werden
(unter den Betriebssystemen Windows oder GNU/Linux). Es funktioniert auch
sehr gut auf den leistungsfähigeren Palmtopcomputern wie dem Pocket-PC.
Die Eyetrackerversion haben wir bisher nur auf Standard-PCs eingesetzt,
da uns noch kein Palmtop mit einem Eyetracker begegnet ist :-)
Wie fügt sich Ihr Werk in die Arbeitsumgebung
von Textkompression, Texteingabe und die Mensch-Computer-Wechselwirkung
ein - und wo liegen die Unterschiede?
Dasher besitzt ein ausgeprägtes Unterscheidungsvermögen, weil
es auf die kontinuierlichen Bewegungen des menschlichen Körpers
zurückgreift, statt den Menschen dazu zu zwingen, binäre Bewegungen
(wie beim Tippen) oder diskrete Zeichen oder Symbole auszusenden (wie mit
der Handschrift oder bei den ''Grafitti''). Die Stärke der Augen liegt
im Navigieren und Suchen, und genau das sind die Fertigkeiten, auf welche
die Eyetrackerversion von Dasher zurückgreift.
Dasher ist auch in der Lage, Unterschiede zu erkennen, weil es ein Sprachmodell
integriert, und zwar weit gehend frei von programmbediungten Einschränkungen
(nämlich frei von Programm-Modi wie -Einstellungen oder -Varianten).
Viele Schreibsysteme verwenden ein Sprachmodell, um Wortergänzungen
vorzuschlagen, aber die Annahme eines Vorschlags bedingt eine Änderung
des Programmmodus. Wir halten den Einsatz von Dasher deshalb für besonders
einfach, weil es von Ihnen keine Entscheidungen zur Änderung des Modus
verlangt.
Dasher erkennt die Unterschiede selbst und verlangt wenig Einarbeitung.
Sobald der Anwender sich an die alfabetische Reihenfolge auf dem Bildschirm
gewöhnt hat, benötigt er als einzige zusätzliche Fertigkeit
noch die Fähigkeit zu steuern – analog dem Steuern eines Autos. Diese
Fertigkeit kann übernommen und übertragen werden. Möchte
ein erfahrener Dasheranwender statt Englisch oder Deutsch Hiragana schreiben
(das Japanische Phonetische Alphabet), so kann er es sofort. Wir müssen
das Sprachmodell bloß noch an Hiragana gewöhnen und die richtigen
Schriftzeichen laden. Ein Anwender, der auf Englisch 25 Wörter pro
Minute schreibt, wird auch 25 Wörter pro Minute auf Japanisch schreiben
(unter der Annahme, dass er beide Sprachen beherrscht!). In ähnlicher
Weise können wir im Englischen oder Deutschen weitere Schriftzeichen
zum Dasheralfabet hinzufügen (zum Beispiel Goßbuchstaben neben
Kleinbuchstaben). Damit kann der Anwender immer noch genauso schnell wie
vorher schreiben, obwohl die Anzahl der verfügbaren Schriftzeichen
sich verdoppelt hat. Sonderzeichen europäischer Sprachen können
einfach eingefügt werden. Um zehn akzentuierte Schriftzeichen in das
Alfabet einzufügen, sind keine großen Änderungen nötig
im Unterschied zu anderen Schreibhilfen wie z.B. einer Tastatur.
Dasher verwendet den Übungstext um Unterscheidungen zu treffen.
Viele Sprachmodell-basierte Systeme gehen von der Annahme aus, dass die
Sprache aus Wörtern bestehe. Die Vorhersagen des Modells werden duch
Wortergänzungen verkörpert. Unser Sprachmodell benötigt
diese Annahme nicht, aber es verhält sich oft wie ein Wortergänzungssystem.
Außerdem leistet Dasher oft gute Arbeit, indem es das nächste
Wort voraussagt. Dabei hat Dasher überhaupt keine Vorstellung von
"Wörtern". Falls der Anwender Dokumente schriebe, in denen Leerzeichen
ausgelassen oder durch "X" ersetzt wären, so würde das Sprachmodell
gut funktionieren; wenn der Anwender ganze Sätze verwendet, wird Dasher
sich wie ein Satzergänzungshilfsmittel verhalten.
Dasher kann sofort persönlich geprägt werden: Trainieren Sie
das Sprachmodell einfach mit einigen Beispieldokumenten, die dem ähneln,
das Sie schreiben möchten.
Dasher funktioniert sofort und in jeder Sprache: Trainieren Sie das
Sprachmodell einfach mit Beispieldokumenten aus der gewünschten Sprache.
Wie könnten diese Forschungsergebnisse praktisch
angewendet werden? Welche anderen Anwendungen könnten noch aus dieser
effizienten Textkompressionsmethode hervorgehen?
Wir glauben, dass Dasher in mindestens drei Gruppen verwendet werden
kann und dass die von David Ward geschaffene Software für die Anwendung
in einer von ihnen so gut wie ausgereift ist.
Zuallererst die Gruppe der Behinderten: Denjenigen, die eine qwerty/
qwertz-Tastatur nicht bedienen können, bietet Dasher eine Möglichkeit,
Text in einen Computer einzugeben. Einige behinderte Computeranwender,
die Dasher ausgiebig getestet haben, berichten uns, dass sie Dasher bei
Weitem besser finden als jede andere von ihnen ausprobierte Texteingabe.
Wir erwarten, dass Dasher, gesteuert über Touchpad, Joystick, Maus,
Kopfmaus, Rollierball oder
Eyetracker, die Schreibgeschwindigkeit vieler behinderter Anwender
schlagartig verbessern wird.
Zweitens bietet Dasher den Computeranwendern in extremer Umgebung eine
neuartige tastaturfreie Texteingabemethode. Bis heute haben kopfmontierte
Anzeigen für tragbare Kleincomputer kaum Bedeutung erlangt - wir meinen,
weil eine angemessene Texteingabemethode fehlte. Gesteuert durch einen
Eyetracker oder einen Miniaturtrackpad bietet Dasher eine neuartige Lösung
dieses Problems. Wir haben eine Dasher-Version entwickelt, die auf einem
Taschen-PC lauffähig ist. Vielleicht werden deshalb einige Palmtop-Anwender
Dasher als Texteingabe bevorzugen.
Drittens glauben Wir, dass Dasher für japanische Computeranwender
besonders brauchbar sein wird. Viele japanische Anwender sind mit dem qwertz-Alphabet
nur wenig vertraut. Dennoch sind die meisten Computer in Japan mit qwertz-Tastaturen
bestückt; daher kann man Japanisch auf einer Tastatur bisher nur relativ
langsam schreiben. Beim Schreiben auf Japanisch kann man mit Dasher die
qwerty-Tastatur umgehen. Gegenwärtig befindet sich der Hiragana-Prototyp
bei uns im Test.
Andere spekulativere Anwendungen für Dasher:
Hybridsystem Voice-Dasher
-
Sprechen Sie in eine fehlerhafte Spracherkennung hinein und beobachten
Sie, wie ihre Folgerungen als Voraussagen angezeigt werden; überall
wo das von Ihnen Gesagte nicht sicher erkannt wurde, verwenden Sie Dasher,
um in den richtigen Satz hineinzusteuern. Das ist viel einfacher, als Fehler
mit weiteren gesprochenen Befehlen zu korrigieren!
-
Hybrides automatisches Dasher-Übersetzungssystem
-
Stellen wir uns ein leistungsschwaches Übersetzungssystem vor, das
schlechte Übersetzungen aus dem Französichen oder Deutschen ins
Englische liefert. Jemand vom Fach muss durch die Übersetzung hindurchstreifen
und Fehler korrigieren. Diese Korrektur könnte innerhalb Dasher erledigt
werden, indem die korrigierte Ausgabe des Übersetzers ein Sprachmodell
erzeugt.
Welche Eingabe wird sich auf lange Sicht durchsetzen?
Ich glaube, dass wir die lange Sicht schon direkt vor uns haben. Schon
jetzt benutzt einer unserer behinderten Freunde Dasher zum Schreiben von
Dokumenten. Wir befinden uns am Ausgangspunkt für die Produktentwicklung
im Sinne von Ausbietung und Werbung.
Nach Ihren Angaben kann Dasher in den meisten Sprachen
eingesetzt werden. Wie wird es wohl Ihrer Erwartung nach im Japanischen
angewendet?
Als ersten Schritt zu einer vollwertigen japanischen Version von Dasher,
die sowohl Kana als auch Kanji beherrscht, hat David Ward eine Hiragana-Version
namens "Daishoya" geschrieben. Sie ist verfügbar als Windowsversion
1.6.3 von Dasher und in den GNU/Linux-Versionen 1.6.3 bis 1.6.8.
Ein Beispiel, wie "Daishoya" verwendet wird, um
(hajime mashite) zu schreiben, kann eingesehen werden über www.inference.phy.cam.ac.uk/dasher/Languages.html.
Die Konvertierung von Dasher zu Daishoya ist einfach: Wir ersetzen
das lateinische Alfabet (a..z) durch das Hiraganaalfabet
(a,i,u,e,o,ka,ki,ku,ke,ko...). Wir ersetzen den englischen Übungstext
durch ein Hiraganadokument. [Leider konnten wir noch kein umfangreiches
Dokument finden, das in reinem Hiragana geschrieben ist. Deshalb ist dieses
Sprachmodell noch nicht so gut trainiert wie wir es uns gewünscht
hätten.]
Mit Daishoya können Sie Hiragana-Texte ohne Tastatur schreiben.
Auf lange Sicht können wir uns zwei Wege vorstellen, mit Daishoya
Kanji zu schreiben:
-
Wir könnten ein Sonderzeichen zu unserem Zeichensatz hinzufügen
(z.B. das „Eingabe“-Zeichen ? in der japanischen Word-Version)
mit der Bedeutung "von Hiragana nach Kanji konvertieren", und mit einem
Sprachmodell vorhersagen, welche Kanji-Zeichen in dem gegebenen Zusammenhang
und für die gerade geschriebene Hiraganasequenz die wahrscheinlichsten
sind. Alle wahrscheinlichen Kanji-Zeichen würden in Kästchen
angezeigt, deren Größe zu Ihrer Wahrscheinlichkeit proportional
ist. Der Anwender würde in das gewünschte Kanji-Zeichen hineinzoomen.
-
Wir könnten eine neue Daishoya-Version erstellen, deren „alfabetische“
Symbole nicht Kana-, sondern Kanjizeichen sind – zum Beispiel einfache
Striche. Der Anwender würde jedes einzelne Kanji-Zeichen durch Hinzufügen
einzelner Elemente aufbauen.
Wie viele Menschen haben Dasher schon benutzt?
Mit dem Zählen kommen wir nicht mehr nach. Bis August 2002 haben
schätzungsweise 50,000 Anwender Dasher heruntergeladen.
Was werden die nächsten Schritte Ihrer Forschung
sein? Was ist letztendlich Ihr Ziel?
Das erste und wichtigste Ziel haben wir erreicht -- ein System, mit
dem Menschen schreiben können, und zwar ohne Tastatur und schneller
als sie bisher schreiben konnten. Dieser Traum ist Realität.
Bis Oktober 2002 wurde das Dasher-Projekt von der gemeinnützigen
Gatsby Foundation gefördert. Es beschäftigen uns weiterhin die
folgenden Forschungsthemen:
-
Eine weitere Verbesserung des Sprachmodels. Es ist schon sehr ordentlich,
aber wir können vorstellen, dass seine Geschwindigkeit um 20% und
die Kompression des Sprachmodells um ebenfalls 20% verbessert werden können.
-
Automatische Kalibrierung des Eyetrackers. Zur Zeit wird die Leistungsfähigkeit
von Dasher noch von der schlechten Kalibrierung des Eyetrackers limitiert.Wir
glauben, dass eine permanente automatische Feineinstellung des Eyetrackers
machbar ist, die auf die Steuerbewegungen des Anwenders zurückgreift.
-
Verbesserungen des Navigationsmechanismus für den Eyetracker. Wenn
Fehler korrigiert werden müssen (,was nicht oft vorkommt!), fühlt
sich die aktuelle Version noch etwas plump an. Wir arbeiten an einer modifizierten
Version des Navigationsmechanismus, mit dessen Hilfe mehrere Fehlerverfolgungs
und –korrekturwege ermöglicht werden.
-
Wie gut die japanische Version von Dasher für japanische Anwender
tatsächlich ist.
-
Erstellen einer Version, die sich auch für solche Menschen eignet,
die nur in eine Dimension (statt zweier) zeigen können. (Dieser eindimensionale
Modus ist als Option in Dasher Version 3.0.1 enthalten, verfügbar
ab März 2003.)
-
Intregration eines Kontrollmodus in Dasher sodass ein Anwender, der keine
Knöpfe zum Starten und Beenden von Dasher drücken kann, dennoch
das Schreiben durch Dasher starten und beenden kann, sofern Dasher geladen
ist, sowie weitere Steuerfunktionen. Dieses Feature ist in Dasher version
3.2 enthalten.
Wann werden Ihre Forschungsergebnisse umsetzungsreif
sein?
Wann wird es eine "Konsumentenversion" von Dasher
geben?
Produktentwicklung und –förderung wird als Open-Source-Project
betrieben. Die Forschungsversion von Dasher steht jetzt schon zur Verfügung
und wird bereits von einigen behinderten Computeranwendern gerne eingesetzt.
Wir gehen davon aus, dass die Open-Source-Gemeinschaft eine Konsumentenversion
in ordentlicher Aufmachung innerhalb 12 Monaten anbieten kann. Der Quellcode
wurde 2002 unter der öffentlichen GNU-lizenz publiziert. Hoffentlch
finden viele Konsumenten die Version, die Ende September 2002 publiziert
wurde, brauchbar und hilfreich. Jeder, der dieses Projekt unterstützen
möchte, wende sich bitte an David
MacKay.
Warum wird Dasher als Open-Source-Projekt betrieben?
Unsere Arbeit profitiert enorm von der Verwendung freier
Software.
-
Das von uns verwendete Betriebssystem ist GNU/Linux. Es wurde kostenfrei
von Linus Torvalds und anderen zur Verfügung gestellt.
-
Wier verwenden den gcc-Compiler und den emacs-Editor, kostenfrei
zur Verfügung gestellt von Richard Stallman.
-
Wir verwenden TeX and LaTeX, kostenfrei zur Verfügung
gestellt von Donald Knuth und Leslie Lamport.
-
Wir verwenden tcl (Ousterhout), X-Windows (viele von uns),
bash (Brian Fox), und Hunderte anderer kostenloser Softwarehäppchen.
Nachdem wir so viel profitiert haben, ist uns klargeworden, dass kostenlose
Software die Welt beglückt. Wir müssten schon einen sehr guten
Grund haben, wenn wir unser Arbeitsergebnis nicht frei zugänglich
machten.
Unsere Arbeit an der Universität wird hauptsächlich öffentlich
gefördert, denn die Steuerzahler des vereinten Königreichs kommen
für die Kosten der Universität auf. In gleicher Weise haben auch
US-Steuerzahler für Teile der von uns genutzten Software bezahlt.
Das zwingendste Argument, die Software kostenfrei zu halten ist, dass
es mehr Spaß macht, in dieser Welt zu leben, wenn jedermann freigiebig
mit anderen teilt.
Die Freizügigkeit von Dasher braucht ein Unternehmen nicht daran
zu hindern, es zu verkaufen, wie z.B. Red Hat GNU/Linux verkauft. Wenn
Unternehmen von Dasher profitieren, möchten wir sie aber aufmuntern,
den Fortgang unserer Arbeit mit einer angemessenen Spende zu unterstützen.
Das Dasher-Projekt wurde von den IBM-Forschungslaboratorien Zürich
großzügig unterstützt. David MacKay wurde ein Partnerschaftspreis
verliehen in Anerkennung seiner früheren freizügig zur Verfügung
gestellten Arbeitsergebnisse über Codes zur Fehlerkorrektur.
Wir beabsichtigen, Dasher zunächst unter der „GNU public license“
(GPL) zur Verfügung zu stellen. [Bei Bedarf kann eine spätere
Version von Dasher unter der LGPL-Lizenz zur Verfügung gestellt werden.]
Mit diesen Lizenzen kann, darf und soll jeder den Quellcode verwenden und
sicherstellen, dass modifizierte Versionen des Quellcodes in gleicher
Weise für jeden frei zugänglich bleiben.
Reden wir mal Klartext. Dasher ist ganz ausgezeichnet und hat das Potential
außergewöhnlich populär zu werden (besonders auf
dem japanischen Markt). Dennoch machen Sie es zu einer Open Source (aus
den obengenannten Gründen). Heißt das nicht, dass Palm oder
Sony oder irgendjemand Ihre Idee kaputtmachen könnte?
Ja, es ist denkbar, dass ein Unternehmen Dasher in sein Produkt einbaut
und dass es seine Verkäufe in die Höhe schnellen lässt.
Das ist in Ordnung, und ich hoffe, dass sie sich mit einer Gegenleistung
an die Gemeinschaft der Interessenten und Unterstützer freier Software
revanchieren – beispielsweise würden wir uns freuen über Zuwendungen
für Aufbau und Erhalt der Stelle eines Softwareentwicklungsbeauftragten
für Dasher in meiner Arbeitsgruppe.
Aus drei Gründen halte ich Softwarepatente für eine schlechte
Idee:
Erstens: Patente behindern eine offene Diskussion – wissenschaftliches
Arbeiten macht in einer geheimniskrämerischen Umgebung keinen Spaß,
und Verständigung ist essenziell für den Fortschritt. Ich könnte
wahrscheinlich keine Doktoranden für die Arbeit an Ideen wie Dasher
gewinnen, wenn ich sie zwänge, meine Ideen geheimzuhalten. Dasher
wäre wohl nie aus dem Grundstadium herausgekommen.
Zweitens verhindern Softwarepatente, dass beste Softwarelösungen
verwendet werden - ein treffendes Beispiel ist das weithin verwendete "gif"-Format
für Bilder: Compuserve und Unisys betreiben allem Anschein nach ein
Patent des Kompressionsalgorithmus, der üblicherweise eingesetzt wurde,
um gif-Images schön klein zu machen. Deshalb wird jeder die Verwendung
eines netten einfachen Standards einstellen müssen.
Drittens meine ich, dass sogar verdiente Erfinder recht selten irgendeinen
finanziellen Vorteil aus einem Softwarepatent erzielen. Es ist aussichtslos.
Diejenigen, die von Patenten profitieren sind (a) Patentanwälte und
(b) Großunternehmen, die Patente als Drohmittel einsetzen, um andere
Firmen zu Vereinbarungen zu zwingen. Wenn ich ein Patent hätte und
ein Großunternehmen es verletzte, was könnte ich dagegen tun?
Sie können mehr Geld in die juristische Schlacht werfen als ich. Und
sie würden zweifellos unterstellen und gegenhalten, dass ich einen
ganzen Stapel von ihren Patenten verletzte. Sogar in der physischen Welt
erscheinen Patent ziemlich nutzlos. Nehmen Sie Herrn Dyson mit seinen beutelfreien
Staubsaugern. Hat nicht Hoover sein Patent verletzt, und hat es ihn nicht
zehn jammervolle Jahre gekostet, damit die Missachtung seiner Rechte gerichtliche
Anerkennung fand?
Von wem wurde Ihre Forschung gefördert?
Die "blue-skies"-Forschung der "Inference group" wird unterstützt
von der gemeinnützigen Gatsby Charitable Foundation und durch
den Partnerschaftspreis des Forschungslabors IBM Zürich.
Das Dasher-Projekt ist (bisher) fast ohne Mittel betrieben worden und
ohne weitere Förderungsanträge.
Unterstützung für die Weiterentwicklung von Dasher ist
willkommen!
Was ist Ihr "Dienstgrad", wie sollte man sich auf
Sie beziehen und wie an Sie wenden?
David MacKay ist Reader* in Natural Philosophy in der
Fakultät für Physik ander Universität Cambridge. Er ist
auch Mitbegründer der IT-Firma Transversal.
[(*) Ein "Reader" wäre nach der U.S- und der deutschen Terminologie
in etwa ein Professor oder Privatdozent.]
David Ward hat das größte Stück der harten Arbeit erledigt,
Dasher von der Idee in eine funktionstüchtige Wirklichkeit zu konvertieren.
Er wurde an der Fakultät für Physik promoviert und arbeitet nun
für ein Softwareunternehmen in Cambridge.
Wir würden gerne David Ward und David MacKay genannt werden, oder
Dr. David Ward und Dr. David MacKay.
Was würden Sie sonst noch gerne sagen?
Ausführbare Programmkopien der Dasher-Software können kostenlos
von der Website des Dasher-Projekts heruntergeladen werden,
http://www.inference.phy.cam.ac.uk/dasher/.
Dort finden Sie auch Tipps für Neulinge. Geben Sie nicht auf - es
kostet Sie ein bis zwei Minuten um anzufangen – innerhalb zehn Minuten
werden Sie bereits “dashen“.
Probieren Sie es aus!
Zuwendungen zur Unterstützung unserer Forschung sind jederzeit
willkommen.