SectionPage Presseausgabe
An der Universität Cambridge wurde ein neues Texteingabesystem entwickelt, das den Umgang mit Computern revolutionieren könnte - für Menschen, die nicht in der Lage sind, eine Tastatur zu bedienen.
More images |
"Die Software funktioniert wie ein Videospiel, wo der Anwender immer tiefer in eine riesige Bibliothek hineinsteuert", erläutert Dr. MacKay. "Mit dem eingesetzten Sprachmodell wird diese Bibliothek so gestaltet, dass schnell und leicht die wahrscheinlichen Zeichenfolgen ausgewählt und dass Buchstabierfehler erschwert werden."
Das System wird in der heutigen Nature-Ausgabe beschrieben (22. August 2002). Es ist viel schneller als alle anderen Schreibsysteme, die durch Eyetracker gesteuert werden. Experimente haben gezeigt, dass Dasher bis zu 25 Wörter pro Minute schreiben kann. Anwender die über einen Eyetracker auf einer am Bildschirm agebildeten Tastatur schreiben, schaffen nur 15 Wörter pro Minute. "Es ist nicht nur schneller als jedes alternative Schreibsystem mit Eyetrackersteuerung - die Häufigkeit von Buchstabierfehlern ist ungefähr fünfmal kleiner - und die Benutzung des neuen Systems ist auch weniger stressig", fügt Dr. MacKay hinzu.
Die Arbeitsweise von Dasher ist besonders differenziert, weil es durch natürliche Zeige-Gesten gesteuert wird. Es baut auf der natürlichen menschlichen Fähigkeit auf, hochpräzise analoge Bewegungen auszuführen. Auf einer Tastatur wird der Text mit Alles-oder-Nichts-Bewegungen eingegeben und die genannte Fähigkeit wird nicht genutzt.
Dasher unterscheidet auch nicht zwischen kompletten Wörtern und dem normalen Schreibvorgang. Andere Schreibsysteme schlagen auf einem separaten Sektor des Displays Wörter vor, und der Anwender muss durch Schauen oder Zeigen eine Auswahl treffen. Dashers Vorschläge sind wie selbstverständlich in den Schreibprozess integriert. Das Sprachmodell passt sich an den individuellen Schreibstil des Anwenders an, sodass mehrere Wörter manchmal auf einen Blick geschrieben werden können.
Dasher ist besonders hilfreich für Computeranwender, die nicht in der Lage sind, eine herkömmliche Tastatur zu bedienen. Weil es über ein beliebiges Zeigehilfsmittel gesteuert werden kann - Maus, Trackball, Touchpad, oder Eyetracker - ist es auch auf Handhelds oder Mobiltelefonen einsetzbar, wo die Tastatur aus Platzgründen fehlt. Außerdem besitzt es ein Potential als Eingabesystem für andere Sprachen, wie z.B. Japanisch.
David MacKay und David Ward planen, Dasher als Open-Source-Software vergleichbar mit GNU/Linux weiterzuentwickeln.
Hinweise für Herausgeber: Der Artikel "Fast hands-free writing
by gaze direction" (freihändig mit dem Blick Schnellschreiben), wurde
von David J. Ward und David J.C. MacKay in "Nature" am 22. August 2002
publiziert.
Nähere Informationen über Dasher einschließlich Videodemonstrationen
und Images erhalten Sie bei:
http://www.inference.phy.cam.ac.uk/dasher/.
Weitere Presseinformationen sind online verfügbar.
Falls Sie weitere Informationen wünschen, wenden Sie sich bitte
an:
David MacKay, Department of Physics, University of Cambridge.
Tel: 01223 339852; e-mail: mackay@mrao.cam.ac.uk
Alison McFarquhar, Press and Publications Office, University of Cambridge.
Tel: 01223 332300; e-mail: am353@cam.ac.uk
Cambridge
University's press office.
EndPage Alias QA.html FoldingPage Further Press Info
Ich (David MacKay) war überzeugt, dass Standardtexteingabesysteme (wie Zehnfingertastaturen) sehr ineffizient sind - sie besitzen nicht die Vorhersagekraft der natürlichen Sprache und sie nutzen unsere Fähigkeit zu hochpräzisen Gesten nicht aus.
I glaubte, dass wir auf einer bekannten Grundlage - nämlich der
Informationstheorie - vollständig neue Schreibsysteme mit weniger
Hardware als Tastaturen erhalten können, die trotzdem beinahe so schnell
arbeiten - und dass sie in Zeigeysteme wie z.B. Eyetracker integriert werden
könnten.
Unterschiedliche Gruppen werden Dasher hilfreich finden. Ihr gemeinsames Interesse ist, eine Alternative zur regulären Zehnfingertastatur zu finden.
Diejenige Gruppe, für die Dasher unserer Ansicht nach die größten Vorzüge bietet, sind Personen mit besonderen Bedürfnissen. Viele von denen, die keine Tastatur bedienen, wohl aber eine normale Maus, Joystick, Trackball, Touchscreen oder Kopfmaus (und natürlich nur diejenigen, die ihren Bildschirm sehen können), werden Dasher hilfreich finden. Innerhalb von 10 Minutenkönnen diese Anwender mit Dasher 5 bis 15 Wörter pro Minute schreiben. Nach 60 Minuten Übung beträgt die Schreibgeschwindigkeit 15 bis 25 Wörter pro Minute. Mit noch mehr Übung kann man 39 Wörter pro Minute erreichen.
Für Schwerbehinderte, die mit den obengenannten Zeigesystemen nicht umgehen können, wohl aber mit ihren eigenen Augebn, bietet Dasher enorme Vorteile, wenn es zusammen mit einem Eyetracker verwendet wird. Mit der entsprechenden Übung können Schreibgeschwindigkeiten von 20-25 Wörtern pro Minute erzielt werden.
Eine weitere Gruppe, für die eine gewöhnliche "qwertz"-Tastatur unpraktisch ist, sind Japanische Computerbenutzer. Viele von ihnen können mit dem lateinischen Alfabet nicht umgehen. Es ist mühsam, Japanisch mit einer lateinischen Tastatur zu schreiben. Dasher kann in fast jeder Sprache verwendet werden, und wir haben einen japanischen Prototyp entwickelt, der mit dem phonetischen Hiragana-Alphabet schreiben kann.
Ich (David MacKay) saß Dezember 1997 mit Mike Lewicki im Bus zum Flughafen Denver. Ich gab gerade etwas in meinen Minicomputer ein (ein Psion 3a mit einer kleinen "qwerty"-Tastatur), und Mike kommentierte: "Ei der daus, wie groß der Kasten doch ist!" Und nun dachten wir über die Frage nach: "Wie könnten wir einen kleineren Minicomputer bauen, vorausgesetzt die Tastatur sei der limitierende Faktor?" Unser Brainstorming zur Schaffung eines Hilfsmittels mit einem niedlich kleinen Display mündete in einer Brille und einem Eingabesystem nicht größer als 2cm mal 2cm, das am Jackenzipfel befestigt werden kann und nur mit dem Finger bedient wird.
Wir waren überzeugt, etwas effizienteres als eine herkömmliche Tastatur zu machen. Aus zwei Gründen ist eine Tastatur ineffizient. Erstens muss jeder Buchstabe durch eine eigene Fingerbewegung eingegeben werden - aber ein normaler Text ist hochredundant und deshalb in hohem Maß vorhersehbar. Der Informationsgehalt eines normalen Texts beträgt nur ein bis 2 Bits pro Buchstabe. Deshalb nahmen wir uns vor, ein Sprachmodell in das Herzstück des Texteingabewerkzeugs zu integrieren, um diese Vorhersehbarkeit besser auszunutzen und die Belastung des Anwenders zu reduzieren. Zweitens: Der lateinische Ausdruck ''digitis" für den menschlichen Finger wird heute zwar heute auch als ''digit'' verwendet, aber die Finger sind und bleiben analoge Werkzeuge mit ihrer besonderen Fähigkeit zu feinen, kontinuierlichen Gesten. Die groben, klumpigen Tasten missachten unsere Fähigkeit, hochpräzise Bewegungen auszuführen. Stattdessen zwingen sie uns zu binären Bewegungen, indem wir die Tasten drücken müssen. Nach unserer Einschätzung kann ein einzelner Finger grundsätzlich Informationen mit einer Datenrate von circa 24 bit pro Sekunde anzeigen.
Wenn wir einen einzigen Finger (der Informationen mit einer Rate von 24 bit pro Sekunde weitergibt), mit einem guten Sprachmodell verknüpfen könnten (das den Text zu einem Bit pro Buchstabenkomprimiert), dann könnten wir vielleicht mit einer Geschwindigkeit von 24 Buchstaben pro Sekunde schreiben!
Hier hatte ich die Idee, einen invers-arithmetischen Codierer zu konstruieren.
Der Anwender könnte die Schnittstelle durch zweidimensionale Zeichen steuern, zum Beispiel auf einem 2D-Trackpad. Und weil der Anwender sieht, wohin sich die Zeichen bewegen, brauchen wir nicht einmal den Trackpad: Wir könnten genauso gut einen Eyetracker benutzen, um die gleiche steuernde Information zu erhalten.
Damit war die Idee von 'Dasher' geboren. (Den Namen hat Mike vorgeschlagen.) Mike dachte sich, dass man einen Prototyp am besten in Tcl schreiben sollte, und als wir am Flughafen Denver ankamen, hatte Mike mir gerade soviel Tcl beigebracht, dass ich eine einfache zoomende Schnittstelle zusammengezimmert hatte.
Innerhalb einer Woche hatte ich den ersten Prototypen von 'Dasher' fertiggestellt.
Noch eine weiteres Motiv hatte mich beflügelt: Dasher ist
ein invers-arithmetischer Codierer - es würde ein praktisches Lehrmittel
abgeben, und zwar für arithmetische Codierung in meinem Fortgeschrittenenkurs
über Informationstheorie, Mustererkennung und Neuronale Netze.
Seit Januar 1998 habe ich alle Jahre wieder Dasher eingesetzt, um arithmetische
Codierung zu lehren.
Mit Worten ist das schwer zu erklären -soger mit Bildern ist es schwierig! (Eine Online-Erklärung mit Bildern gibt es hier) Am einfachsten lässt es sich mit einer Live-Vorführung zeigen. Wie auch immer, versuchen wir's mal:
Stellen Sie sich eine Bibliothek mit allen möglichen Büchern
vor. Alle Bücher seien auf einem einzigen Regalboden
alfabetisch geordnet. (Ja genau, ich meine alle möglichen
Bücher. Diese Bibliothek wird manchmal die Bibliothek von Babel gennannt.)
Bücher mit dem Anfangsbuchstaben "a" stehen links. Bücher mit
dem Anfangsbuchstaben "z" stehen
rechts. Das erste Buch in Abschnitt "a" liest sich wie "aaaaaaaaaaaa...";
irgendwo rechts davon befinden sich Bücher, deren Titel mit "all good
things must come to an end..." beginnt; ein kleines bisschen weiter rechts
befinden sich Bücher, deren Titel mit "all good things must come to
an enema..." beginnt.
Wenn jemand ein Textstück schreibt, dann wird er seinen nächsten
Textbaustein aus dieser "Bibliothek aller Bücher" auswählen
- nämlich dasjenige Buch, das genau den zu wählenden Textbaustein
enthält. Wie wird dieses Buch angewählt? Stellen wir uns
einmal vor, es soll "all good things..." geschrieben
werden...
Zuerst wandert unser Benutzer in den Abschnitt "a" der Bibliothek. Dort
wird er mit denjenigen Büchern konfrontiert, die mit
"aa", "ab", "ac,.... "az" beginnen. Sobald er dem "al" - Abschnitt
näher rückt, kann er schon Bücher sehen, die
mit "ala", "alb",... "alz" anfangen.
Der Schreibende rückt dem Regal immer näher und wird das Buch
finden, das genau den Text enthält, den er schreiben wollte.
Anstelle von "Schreiben" können wir den Vorgang beschreiben als
Hineinzoomen
in eine alfabetische Bibliothek, indem
wir in die richtige Richtung gehen.
Genauso funktioniert Dasher, mit einer tückischen Ausnahme: Wir ändern die GRÖSSE der Stellfläche für jedes Buch entsprechend der Wahrscheinlichkeit des zugehörigen Texts. Beispielsweise werden nicht viele Bücher mit "x" beginnen. Deshalb können wir "x..." weniger Platz zur Verfügung stellen - dafür gibt es mehr Platz für die plausibleren Bücher, damit wir den wahrscheinlichen Text leichter finden.
Im Endeffekt haben wir nicht das Gefühl, wie bei der Schreibmaschine nur einzelne Buchstaben zu schreiben - sondern es kommt uns Anwendern so vor, wie wenn uns ganze Silben, ganze Wörter, ja sogar ganze Sätze entgegeneilten.
Der Anwender steuert sein Schreiben, indem er in die Richtung zeigt,
in die er gehen will. Die Anzeige zoomt weiter in die von ihm angedeutete
Richtung. Und weil jeder Anwender typischerweise in die Richtung schaut,
die er einschlagen will, ist es nicht einmal notwendig dorthin zu zeigen
- wir können einfach seine Augen verfolgen und die Blickrichtung als
Zeiger nutzen.
Arithmetische Codierung ist eine herrliche Methode zur Textkompression. Normalerweise brauche ich zur Erklärung eine Vorlesungseinheit.
Stellen Sie sich ein Lineal vor, z.B. mit 30 cm Länge. Markieren Sie es auf halber Länge. Markieren Sie die linke Hälfte "0" und die rechte Hälfte "1". Nun halbieren Sie die linke Hälfte und markieren die zwei Viertel "00" and "01". Genauso halbieren Sie die rechte Hälfte und markieren die zwei Viertel "10" and "11". Jetzt haben wir sechs Intervallbezeichnungen vergeben: "0" und "1" sowie "00", "01", "10", und "11". Die letzten vier Intervalle können wir weiter unterteilen und bekommen acht Intervalle wie: "000" and "101" usw. Es kann also ein beliebiger Abschnitt (und ein beliebig kleiner Abschnitt!) mit einer binären Zeichenfolge assoziiert werden.
Nun hängt die Textkompression natürlich davon ab, ob der Text Redundanzen enthält, und eine beliebige Redundanz kann mit einem probabilistischen Modell beschrieben werden, welches uns sagt, welcher Buchstabe in dem Dokument wahrscheinlich der erste ist, und welcher wahrscheinlich der zweite ist (unter der Voraussetzung, der wahrscheinlichste erste sei es wirklich!) usw. Arithmetische Codierung geht von der Annahme aus, dass Sie irgendwoher solch ein Modell haben.
Wenden wir uns mal der Vorhersagen des probabilistischen Modells zu: Nehmen wir mal an, die vorhergsagten Wahrscheinlichkeiten für den ersten Buchstaben (a,b,c,...., oder z) seien P(a)=0.05; P(b)=0.02; P(c)=0.03; ... P(e)=0.10; ... P(t)=0.20; ....
Wir können diese Wahrscheinlichkeiten nutzen, um das Lineal in Stückchen zu teilen. Die 5% ganz links auf dem Lineal nennen wir "a", die nächsten 2% nennen wir "b" usw.
Danach können wir die "a"-Portion des Lineals in "aa", "ab", "ac",... unterteilen, jeweils entsprechend den einzelnen Wahrscheinlichkeiten, die von dem probabilistischen Modell zugeordnet werden, sobald wir die Frage stellen: ''Angenommen der erste Buchstabe sei ein "A", welcher Buchstabe wird wahrscheinlich der zweite sein?''
So wird jede mögliche Zeichenfolge einem kleinen Abschnitt des
Lineals zugeordnet. Danach codiert die arithmetische Codierungsmethode
einfach die gegebene Zeichenfolge, indem sie kürzeste binäre
Zeichenfolge findet, die demselben Stück des Lineals entspricht.
Eine benutzerfreundlichere Methode, als mit den eigenen Augen zu schreiben, können wir uns nicht vorstellen. Ähnlich wie beim Autofahren verbringen Ihre Augen viel Zeit damit, dahin zu schauen, wohin Sie fahren. Wir können uns deshalb grundsätzlich vorstellen, uns des Steuerrads zu entledigen und das Auto einfach dahin fahren zu lassen, wohin Ihre Augen gerade schauen. Diese freihändige Art zu fahren wäre für die Augen des Fahrers überhaupt nicht anstrengender als das normale Fahren.
Ein ähnliches Gefühl hat man beim Schreiben mit Dasher. Es geht fast mühelos. Schauen Sie einfach auf dem Bildschirm nach der ersten Silbe, die Sie schreiben wollten: sie zoomt an Ihnen vorbei, und die nächsten möglichen Silben erscheinen; meistens können Sie die nächste von Ihnen gewünschte Silbe leicht ausmachen. Sie fixieren die Silbe, sie zoomt herbei, und die nächsten Optionen erscheinen. Es wird keine bewusste Kontrolle der Augen benötigt.
Die Benutzung billiger und einfacher Eyetracker kann bei jeder Anwendung
ermüdend sein, weil solche Eyetracker leicht von einem blinkenden
Auge gestört werden oder schlecht kalibriert sind. Diese Probleme
beruhen aber nicht auf Dasher, sondern auf dem Eyetracker.
In unserer Publikation, "Schnelles freihändiges Schreiben mit dem Blick", in Nature vom 22. August 2002 vergleichen wir einen Eyetracker mit Bildschirmtastatur mit Dasher, dessen Wortergänzung über einen Eyetracker gesteuert wird. Dasher-Anwender konnten nach einer Übungsdauer von einer Stunde bis zu 25 Wörtern pro Minute schreiben. Die Benutzer der Bildschirmtastatur konnten nach der gleichen Übungszeit nur 15 Wörter pro Minute schreiben. Außerdem betrug die Fehlerrate bei der Benutzung der auf dem Bildschirm angezeigten Tastatur ungefähr dasd Fünffache derer von Dasher. Es ist schwierig, unter Dasher Buchstabierfehler zu machen, weil das Sprachmodell die Auswahl korrekter Schreibweisen erleichtert.
Zu Geschwindigkeit und Fehlerrate noch weitere wichtige Faktoren hinzu. Anwender, die beide Systeme ausprobiert hatten, berichteten, dass sie die Bildschirmtastaturaus zwei Gründen anstrengender fanden: Erstens ist man sich unsicher, ob im aktuellen Wort ein Fehler vorliegt (die Ergänzungsautomatik funktioniert nur, wenn keine Fehler gemacht wurden), denn ein Fehler kann nur erkannt werden, wenn man nicht auf die Tastatur schaut. Zweitens muss man bei jedem Buchstaben entscheiden, ob man die Wortergänzung verwenden oder weiterschreiben soll. Nach dem Wortergänzungsfenster zu schauen ist wie ein Gücksspiel, denn man kann sich nicht sicher sein, ob das benötigte Wort dort wirklich angezeigt wird. Selbst wenn es angezeigt wird - es ist zusätzliche mentale Aktivität für das Suchen und Finden der richtigen Ergänzung nötig.
Demgegenüber sehen die Anwender von Dasher gleichzeitig die zuletzt geschriebenen Buchstaben und die wahrscheinlichsten Optionen für die nächsten. Und es ist Dasher egal, wie Sie schreiben wollen - es braucht nicht zu unterscheiden zwischen Wortergänzung und normalem Schreiben.
Auch haben wir das mausgesteuerte Dasher mit anderen Zeigegerät-basierten
Texteingabesystemen verglichen. Alle Anwender werden mit der Übung
schneller, und die Schreibgeschwindigkeiten der sehr Erfahrenen haben mit
der Maus 39 Wörter pro Minute erreicht. Das ist noch nicht
so schnell wie die Geschwindigkeit mit dem Zehnfingersystem auf einer voll
dimensionierten Tastatur, aber wir sind weder auf eine Tastatur mit Platzbedarf
angewiesen noch auf die zwei Hände, mit denen wir sie bedienen müssten.
Wir
brauchen nur einen Finger!
Wir können zur mausgesteuerten Version von Dasher und zur Eyetrackerversion nähere Angaben machen.
Mit einer normalen bildschirmabgebildeten Tastatur müssen Sie den ersten zu schreibenden Buchstaben eine vorgegebene Zeit lang anschauen (diese sogenannte ''Verweilzeit - engl: dwell time'' ist im Sinne einer Reaktionszeit Ihres Computers voreingestellt - zum Beispiel auf eine halbe Sekunde). Danach schauen Sie auf den nächsten Buchstaben usw. Das ist fürchterlich langsam und ermüdend. Das Ziel der Evolution unserer Augen war nicht das ''Knöpfchendrücken''! Wenn Sie die Reaktionszeit verringern, haben Sie immer noch das Gefühl der Langsamkeit und Ermüdung, aber nicht mehr so schlimm wie bei der ersten Einstellung. Nun aber führt die verringerte Reaktionszeit zu Fehlern, weil Sie versehentlich bei den falschen Tasten ''verweilen''. Zur Beschleunigung Ihres Schreibvorgangs haben Sie die Option, einige wenige Sondertasten am oberen Rand der Tastatur anzuschauen. Diese bieten Ihnen Wortergänzungen an. Weil Sie nur das lesen können, was Sie gerade anschauen, werden Sie die angebotenen Wortergänzungen nur herausfinden, indem Sie sich dazu entschließen, Ihren Blick auf das Wortergänzungsareal zu richten. Dieses tasten Sie mit Ihrem Blick ab, während Sie gleichzeitig versuchen, auf keinem der angezeigten Wörter zu lange zu verweilen. Entweder müssen Sie jetzt das richtige Wort durch anschauen anwählen (wenn Sie es denn finden) oder aufgeben zum Tastatur zurückkehren. Sofern Sie zum Tastaturschreiben zurückkehren, sollten Sie sich jetzt erinnern, bei welchem Buchstaben Ihr Schriftzug schon angelangt war! Den zuletzt geschriebenen Buchstaben können Sie sich nur in Erinnerung bringen, wenn Sie auf wieder ein anderes Bildschirmfeld schauen. Die Wortergänzung ist hier weniger wertvoll, da sie nicht weiß, wann Ihren Augen ein Tippfehler unterlaufen ist. Es läst sich wohl nicht vermeiden, dass sie einige Wörter in Ihrem Satz falsch buchstabiert haben.
Wenn Sie für den gleichen Satz Dasher einsetzen, zeigt der Eingangsbildschirm
alle Schriftzeichen von a bis z vertikal an. Sobald sie auf den ersten
Buchstaben des Satzes blicken, zoomt die Anzeige in dieses Schriftzeichen
hinein. In diesem ersten Buchstaben erscheinen die möglichen Fortsetzungen.
Sie blicken Sie auf die Fortsetzung, die Sie wollen, und die Anzeige zoomt
dorthinein. Es handelt sich um einen kontinuierlichen Vorgang. Es gibt
keine abgestuften Auswahlstadien. Nur wenig links von der Stelle, auf die
man gerade blickt, sieht man die bereits augewählte Zeichenfolge.
Rechts kann man sehen, wie es wahrscheinlich weitergehen wird - geordnet
in alfabetischer Reihenfolge. Sie haben das Gefühl, Wortergänzungen
angeboten zu bekommen. Gleichzeitig tun Sie nichts anderes als zu schreiben,
indem Sie Buchstaben aus dem Alfabet aussuchen. Fehler werden seltener;
wenn Sie Dasher etwa eine Stunde lang geübt haben. Wenn Sie einmal
einen Fehler gemacht haben, merken Sie es typischerweise gleich danach,
weil das Modell dann die von Ihnen anschließend gewünschten
Zeichen nicht mehr richtig vorhersagt. Sie korrigieren die Fehler, indem
Sie zurückgehen -- blicken Sie auf die linke Seite des Bildschirms
statt
nach rechts -- danach blicken Sie wieder allmählich nach rechts.
Wir waren hocherfreut darüber, dass man mit Dasher und einem Eyetracker
viel schneller schreiben kann, als es uns von vielen behinderten Anwendern
mit anderen Programmen berichtet wurde. Wir haben von einem Anwender erfahren,
der nur 6-9 Wörter pro Minute schreiben konnte. Hoffentlich versucht
er es mal mit Dasher. Wahrscheinlich wird seine Schreibgeschwindigkeit
damit verdreifacht.
Eine gute Frage. Wir haben diesen Gesichtspunkt noch nicht einer formalen
Untersuchung unterzogen, aber ich kann Ihnen einige Rohdaten überlassen
und Ihnen einen vorläufigen Eindruck geben. Ich glaube, dass die meisten
Fehlbuchstabierungen der hier folgenden Textprobe nicht schwer wiegen und
dass viele von Ihnen aus Unsicherheit entstanden sind, wie man Jane Austens
Prosa überhaupt buchstabieren soll!
Den hier gezeigten Text schrieb ich in meiner neunten Sitzung mit dem
Eyetracker. Er angeblich 5 Fehler im Vergleich mit der Vorlage. [Interpunktion
und Großbuchstaben wurden damals grundsätzlich nicht berücksichtigt
mit der Ausnahme, dass die Satzenden mit doppeltem Unterstrich '__' gekennzeichnet
wurden.]
thewoodhouses_were_first_in_consequence_there__all_looked_up_to_them__she_had_ma ny_acquaintance_in_the_place_for_her_father_was_universally_civil_but_not_one_am ong_them_who_could_be_accepted_in_lieu_of_miss_taylor_for_even_half_a_day__it_wa s_a_melancholy_change__and_emma_could_not_but_sigh_over_it_and_wish_for_impossib le_things_till_her_father_awoke_and_made_it_ncessary_to_be_cheerful__his_spirits _required_support__he_was_a_nervous_man_easily_depressed__fond_of_every_body_tha t_he_was_used_to_and_hating_to_part_with_them__hating_change_of_every_kind__Der korrigierte Text (Fehler wurden gekennzeichnet mit *) war folgender:
The*Woodhouses were first in consequence there. All looked up to them. She had many acquaintance in the place, for her father was universally civil, but not one among them who could be accepted in lieu of Miss Taylor for even half a day. It was a melancholy change; and Emma could not but sigh over it, and wish for impossible things, till her father awoke, and made it n*ecessary to be cheerful. His spirits required support. He was a nervous man, easily depressed; fond of every body that he was used to, and hating to part with them; hating change of every kind.Das folgende Beispiel zeigt zwei geringfügige Fehler. Die anderen drei kann ich nicht finden! Schauen wir uns ein anderes Beispiel an, Versuch 14. (Angeblich 4 Fehler)
the_real_evils_indeed_of_emmas_situation_were_the_power_of_having_rat her_too_much_her_own_way_and_a_disposition_to_think_a_little_too_well _of_herself__these_were_the_disadvantages_which_threatened_alloy_to_h er_many_enjoyments__the_danger_however_was_at_present_so_unperceived_ that_they_did_not_by_any_means_rank_as_misfortunes__sorrow_came_a_gen tle_sorrow_but_not_at_all_in_the_shape_of_any_disagreeable_consciousn ess__miss_taylor_married__it_was_miss_taylors_loss_which_first_brough t_grief__it_was_on_the_wedding_day_of_this_beloved_friend_that_emma_f irst_sat_in_mour
The real evils, indeed, of Emma's situation were the power of having rather too much her own way, and a disposition to think a little too well of herself; these were the disadvantages which threatened alloy to her many enjoyments. The danger, however, was at present so unperceived, that they did not by any means rank as misfortunes *with* *her*. Sorrow came -- a gentle sorrow -- but not at all in the shape of any disagreeable consciousness.-- Miss Taylor married. It was Miss Taylor's loss which first brought grief. It was on the wedding-day of this beloved friend that Emma first sat in mournful thought of any continuance.In diesem Beispiel kann ich wiederum nur 2 Fehler finden (die beiden ausgelassenen Wörter). Ich hoffe, dass diese Beispiele ausreichen um aufzuzeigen wie zuverlässig Dasher ist, sobald man etwas geübter ist. Es ist schwierig Fehler zu machen, weil man immer sehen kann, was man gerade geschrieben hat. Deshalb glaube ich, dass man ein falsch geschriebenes Wort erkennen würde.
Dasher kann mit jeder normalen Maus, mit einer Touchscreen oder mit einem Eyetracker verwendet werden. Die überwiegende Mehrheit der Dasheranwender verwendet die normale Maus oder eine Touchscreen. Mit Maus oder Touchscreen können bei entsprechender Übung 35 Wörter pro Minute erreicht werden. Nach einer Stunde Übung sind 25 Wörter pro Minute ein typischer Wert.
Das ist tatsächlich langsamer als die Sprechgeschwindigkeit. Steht jemandem die Spracherkennung zur Verfügung, so sieht er vielleicht keine Notwendigkeit, Dasher zu verwenden.
Dennoch mögen manche Menschen Dasher, weil ...
Dasher kann problemlos auf jedem herkömmlichen PC betrieben werden
(unter den Betriebssystemen Windows oder GNU/Linux). Es funktioniert auch
sehr gut auf den leistungsfähigeren Palmtopcomputern wie dem Pocket-PC.
Die Eyetrackerversion haben wir bisher nur auf Standard-PCs eingesetzt,
da uns noch kein Palmtop mit einem Eyetracker begegnet ist :-)
Dasher besitzt ein ausgeprägtes Unterscheidungsvermögen, weil es auf die kontinuierlichen Bewegungen des menschlichen Körpers zurückgreift, statt den Menschen dazu zu zwingen, binäre Bewegungen (wie beim Tippen) oder diskrete Zeichen oder Symbole auszusenden (wie mit der Handschrift oder bei den ''Grafitti''). Die Stärke der Augen liegt im Navigieren und Suchen, und genau das sind die Fertigkeiten, auf welche die Eyetrackerversion von Dasher zurückgreift.
Dasher ist auch in der Lage, Unterschiede zu erkennen, weil es ein Sprachmodell integriert, und zwar weit gehend frei von programmbediungten Einschränkungen (nämlich frei von Programm-Modi wie -Einstellungen oder -Varianten). Viele Schreibsysteme verwenden ein Sprachmodell, um Wortergänzungen vorzuschlagen, aber die Annahme eines Vorschlags bedingt eine Änderung des Programmmodus. Wir halten den Einsatz von Dasher deshalb für besonders einfach, weil es von Ihnen keine Entscheidungen zur Änderung des Modus verlangt.
Dasher erkennt die Unterschiede selbst und verlangt wenig Einarbeitung. Sobald der Anwender sich an die alfabetische Reihenfolge auf dem Bildschirm gewöhnt hat, benötigt er als einzige zusätzliche Fertigkeit noch die Fähigkeit zu steuern – analog dem Steuern eines Autos. Diese Fertigkeit kann übernommen und übertragen werden. Möchte ein erfahrener Dasheranwender statt Englisch oder Deutsch Hiragana schreiben (das Japanische Phonetische Alphabet), so kann er es sofort. Wir müssen das Sprachmodell bloß noch an Hiragana gewöhnen und die richtigen Schriftzeichen laden. Ein Anwender, der auf Englisch 25 Wörter pro Minute schreibt, wird auch 25 Wörter pro Minute auf Japanisch schreiben (unter der Annahme, dass er beide Sprachen beherrscht!). In ähnlicher Weise können wir im Englischen oder Deutschen weitere Schriftzeichen zum Dasheralfabet hinzufügen (zum Beispiel Goßbuchstaben neben Kleinbuchstaben). Damit kann der Anwender immer noch genauso schnell wie vorher schreiben, obwohl die Anzahl der verfügbaren Schriftzeichen sich verdoppelt hat. Sonderzeichen europäischer Sprachen können einfach eingefügt werden. Um zehn akzentuierte Schriftzeichen in das Alfabet einzufügen, sind keine großen Änderungen nötig im Unterschied zu anderen Schreibhilfen wie z.B. einer Tastatur.
Dasher verwendet den Übungstext um Unterscheidungen zu treffen. Viele Sprachmodell-basierte Systeme gehen von der Annahme aus, dass die Sprache aus Wörtern bestehe. Die Vorhersagen des Modells werden duch Wortergänzungen verkörpert. Unser Sprachmodell benötigt diese Annahme nicht, aber es verhält sich oft wie ein Wortergänzungssystem. Außerdem leistet Dasher oft gute Arbeit, indem es das nächste Wort voraussagt. Dabei hat Dasher überhaupt keine Vorstellung von "Wörtern". Falls der Anwender Dokumente schriebe, in denen Leerzeichen ausgelassen oder durch "X" ersetzt wären, so würde das Sprachmodell gut funktionieren; wenn der Anwender ganze Sätze verwendet, wird Dasher sich wie ein Satzergänzungshilfsmittel verhalten.
Dasher kann sofort persönlich geprägt werden: Trainieren Sie das Sprachmodell einfach mit einigen Beispieldokumenten, die dem ähneln, das Sie schreiben möchten.
Dasher funktioniert sofort und in jeder Sprache: Trainieren Sie das Sprachmodell einfach mit Beispieldokumenten aus der gewünschten Sprache.
Wir glauben, dass Dasher in mindestens drei Gruppen verwendet werden kann und dass die von David Ward geschaffene Software für die Anwendung in einer von ihnen so gut wie ausgereift ist.
Zuallererst die Gruppe der Behinderten: Denjenigen, die eine qwerty/
qwertz-Tastatur nicht bedienen können, bietet Dasher eine Möglichkeit,
Text in einen Computer einzugeben. Einige behinderte Computeranwender,
die Dasher ausgiebig getestet haben, berichten uns, dass sie Dasher bei
Weitem besser finden als jede andere von ihnen ausprobierte Texteingabe.
Wir erwarten, dass Dasher, gesteuert über Touchpad, Joystick, Maus,
Kopfmaus, Rollierball oder
Eyetracker, die Schreibgeschwindigkeit vieler behinderter Anwender
schlagartig verbessern wird.
Zweitens bietet Dasher den Computeranwendern in extremer Umgebung eine neuartige tastaturfreie Texteingabemethode. Bis heute haben kopfmontierte Anzeigen für tragbare Kleincomputer kaum Bedeutung erlangt - wir meinen, weil eine angemessene Texteingabemethode fehlte. Gesteuert durch einen Eyetracker oder einen Miniaturtrackpad bietet Dasher eine neuartige Lösung dieses Problems. Wir haben eine Dasher-Version entwickelt, die auf einem Taschen-PC lauffähig ist. Vielleicht werden deshalb einige Palmtop-Anwender Dasher als Texteingabe bevorzugen.
Drittens glauben Wir, dass Dasher für japanische Computeranwender besonders brauchbar sein wird. Viele japanische Anwender sind mit dem qwertz-Alphabet nur wenig vertraut. Dennoch sind die meisten Computer in Japan mit qwertz-Tastaturen bestückt; daher kann man Japanisch auf einer Tastatur bisher nur relativ langsam schreiben. Beim Schreiben auf Japanisch kann man mit Dasher die qwerty-Tastatur umgehen. Gegenwärtig befindet sich der Hiragana-Prototyp bei uns im Test.
Andere spekulativere Anwendungen für Dasher:
Ich glaube, dass wir die lange Sicht schon direkt vor uns haben. Schon
jetzt benutzt einer unserer behinderten Freunde Dasher zum Schreiben von
Dokumenten. Wir befinden uns am Ausgangspunkt für die Produktentwicklung
im Sinne von Ausbietung und Werbung.
Als ersten Schritt zu einer vollwertigen japanischen Version von Dasher,
die sowohl Kana als auch Kanji beherrscht, hat David Ward eine Hiragana-Version
namens "Daishoya" geschrieben. Sie ist verfügbar als Windowsversion
1.6.3 von Dasher und in den GNU/Linux-Versionen 1.6.3 bis 1.6.8.
Ein Beispiel, wie "Daishoya" verwendet wird, um
(hajime mashite) zu schreiben, kann eingesehen werden über www.inference.phy.cam.ac.uk/dasher/Languages.html.
Die Konvertierung von Dasher zu Daishoya ist einfach: Wir ersetzen
das lateinische Alfabet (a..z) durch das Hiraganaalfabet
(a,i,u,e,o,ka,ki,ku,ke,ko...). Wir ersetzen den englischen Übungstext
durch ein Hiraganadokument. [Leider konnten wir noch kein umfangreiches
Dokument finden, das in reinem Hiragana geschrieben ist. Deshalb ist dieses
Sprachmodell noch nicht so gut trainiert wie wir es uns gewünscht
hätten.]
Mit Daishoya können Sie Hiragana-Texte ohne Tastatur schreiben.
Auf lange Sicht können wir uns zwei Wege vorstellen, mit Daishoya
Kanji zu schreiben:
Mit dem Zählen kommen wir nicht mehr nach. Bis August 2002 haben
schätzungsweise 50,000 Anwender Dasher heruntergeladen.
Das erste und wichtigste Ziel haben wir erreicht -- ein System, mit dem Menschen schreiben können, und zwar ohne Tastatur und schneller als sie bisher schreiben konnten. Dieser Traum ist Realität.
Bis Oktober 2002 wurde das Dasher-Projekt von der gemeinnützigen Gatsby Foundation gefördert. Es beschäftigen uns weiterhin die folgenden Forschungsthemen:
Produktentwicklung und –förderung wird als Open-Source-Project
betrieben. Die Forschungsversion von Dasher steht jetzt schon zur Verfügung
und wird bereits von einigen behinderten Computeranwendern gerne eingesetzt.
Wir gehen davon aus, dass die Open-Source-Gemeinschaft eine Konsumentenversion
in ordentlicher Aufmachung innerhalb 12 Monaten anbieten kann. Der Quellcode
wurde 2002 unter der öffentlichen GNU-lizenz publiziert. Hoffentlch
finden viele Konsumenten die Version, die Ende September 2002 publiziert
wurde, brauchbar und hilfreich. Jeder, der dieses Projekt unterstützen
möchte, wende sich bitte an David
MacKay.
Unsere Arbeit profitiert enorm von der Verwendung freier Software.
Unsere Arbeit an der Universität wird hauptsächlich öffentlich gefördert, denn die Steuerzahler des vereinten Königreichs kommen für die Kosten der Universität auf. In gleicher Weise haben auch US-Steuerzahler für Teile der von uns genutzten Software bezahlt.
Das zwingendste Argument, die Software kostenfrei zu halten ist, dass es mehr Spaß macht, in dieser Welt zu leben, wenn jedermann freigiebig mit anderen teilt.
Die Freizügigkeit von Dasher braucht ein Unternehmen nicht daran zu hindern, es zu verkaufen, wie z.B. Red Hat GNU/Linux verkauft. Wenn Unternehmen von Dasher profitieren, möchten wir sie aber aufmuntern, den Fortgang unserer Arbeit mit einer angemessenen Spende zu unterstützen. Das Dasher-Projekt wurde von den IBM-Forschungslaboratorien Zürich großzügig unterstützt. David MacKay wurde ein Partnerschaftspreis verliehen in Anerkennung seiner früheren freizügig zur Verfügung gestellten Arbeitsergebnisse über Codes zur Fehlerkorrektur.
Wir beabsichtigen, Dasher zunächst unter der „GNU public license“
(GPL) zur Verfügung zu stellen. [Bei Bedarf kann eine spätere
Version von Dasher unter der LGPL-Lizenz zur Verfügung gestellt werden.]
Mit diesen Lizenzen kann, darf und soll jeder den Quellcode verwenden und
sicherstellen, dass modifizierte Versionen des Quellcodes in gleicher
Weise für jeden frei zugänglich bleiben.
Ja, es ist denkbar, dass ein Unternehmen Dasher in sein Produkt einbaut und dass es seine Verkäufe in die Höhe schnellen lässt. Das ist in Ordnung, und ich hoffe, dass sie sich mit einer Gegenleistung an die Gemeinschaft der Interessenten und Unterstützer freier Software revanchieren – beispielsweise würden wir uns freuen über Zuwendungen für Aufbau und Erhalt der Stelle eines Softwareentwicklungsbeauftragten für Dasher in meiner Arbeitsgruppe.
Aus drei Gründen halte ich Softwarepatente für eine schlechte Idee:
Erstens: Patente behindern eine offene Diskussion – wissenschaftliches Arbeiten macht in einer geheimniskrämerischen Umgebung keinen Spaß, und Verständigung ist essenziell für den Fortschritt. Ich könnte wahrscheinlich keine Doktoranden für die Arbeit an Ideen wie Dasher gewinnen, wenn ich sie zwänge, meine Ideen geheimzuhalten. Dasher wäre wohl nie aus dem Grundstadium herausgekommen.
Zweitens verhindern Softwarepatente, dass beste Softwarelösungen verwendet werden - ein treffendes Beispiel ist das weithin verwendete "gif"-Format für Bilder: Compuserve und Unisys betreiben allem Anschein nach ein Patent des Kompressionsalgorithmus, der üblicherweise eingesetzt wurde, um gif-Images schön klein zu machen. Deshalb wird jeder die Verwendung eines netten einfachen Standards einstellen müssen.
Drittens meine ich, dass sogar verdiente Erfinder recht selten irgendeinen
finanziellen Vorteil aus einem Softwarepatent erzielen. Es ist aussichtslos.
Diejenigen, die von Patenten profitieren sind (a) Patentanwälte und
(b) Großunternehmen, die Patente als Drohmittel einsetzen, um andere
Firmen zu Vereinbarungen zu zwingen. Wenn ich ein Patent hätte und
ein Großunternehmen es verletzte, was könnte ich dagegen tun?
Sie können mehr Geld in die juristische Schlacht werfen als ich. Und
sie würden zweifellos unterstellen und gegenhalten, dass ich einen
ganzen Stapel von ihren Patenten verletzte. Sogar in der physischen Welt
erscheinen Patent ziemlich nutzlos. Nehmen Sie Herrn Dyson mit seinen beutelfreien
Staubsaugern. Hat nicht Hoover sein Patent verletzt, und hat es ihn nicht
zehn jammervolle Jahre gekostet, damit die Missachtung seiner Rechte gerichtliche
Anerkennung fand?
Die "blue-skies"-Forschung der "Inference group" wird unterstützt von der gemeinnützigen Gatsby Charitable Foundation und durch den Partnerschaftspreis des Forschungslabors IBM Zürich.
Das Dasher-Projekt ist (bisher) fast ohne Mittel betrieben worden und ohne weitere Förderungsanträge.
Unterstützung für die Weiterentwicklung von Dasher ist
willkommen!
David MacKay ist Reader* in Natural Philosophy in der
Fakultät für Physik ander Universität Cambridge. Er ist
auch Mitbegründer der IT-Firma Transversal.
[(*) Ein "Reader" wäre nach der U.S- und der deutschen Terminologie
in etwa ein Professor oder Privatdozent.]
David Ward hat das größte Stück der harten Arbeit erledigt, Dasher von der Idee in eine funktionstüchtige Wirklichkeit zu konvertieren. Er wurde an der Fakultät für Physik promoviert und arbeitet nun für ein Softwareunternehmen in Cambridge.
Wir würden gerne David Ward und David MacKay genannt werden, oder
Dr. David Ward und Dr. David MacKay.
Ausführbare Programmkopien der Dasher-Software können kostenlos
von der Website des Dasher-Projekts heruntergeladen werden,
http://www.inference.phy.cam.ac.uk/dasher/.
Dort finden Sie auch Tipps für Neulinge. Geben Sie nicht auf - es
kostet Sie ein bis zwei Minuten um anzufangen – innerhalb zehn Minuten
werden Sie bereits “dashen“.
Probieren Sie es aus!
Zuwendungen zur Unterstützung unserer Forschung sind jederzeit
willkommen.