PC und Behinderte

Sag’ mir, was ich schreiben will!


PC und Behinderte

Sag’ mir, was ich schreiben will!


Wolfgang L. Zagler

http://fortec.iaee.tuwien.ac.at/fortec/

zw@fortec.tuwien.ac.at

Sag’ mir, was ich schreiben will!

Beschleunigung der Texteingabe durch Textvorhersage

Wolfgang L. Zagler

Kommunikationsbarrieren

Die auf geschriebene und gesprochene Sprache aufbauende zwischenmenschliche Kommunikation setzt sowohl sensorische (Sehen, Hören) wie auch aktuatorische (Sprechen, Schreiben) und intellektuelle Fähigkeiten voraus. Von besonders schmerzlicher Einschränkung ihrer Kommunikation sind jene behinderten Menschen betroffen, die zwar über die üblichen sensorischen und intellektuellen Fähigkeiten verfügen, jedoch unter Einschränkungen bzw. Ausfällen im aktuatorischen Bereich leiden. Mit anderen Worten: Gesprochenes und Geschriebenes kann ohne jegliche Einschränkungen aufgenommen und auch verstanden werden. Sobald aber (was gar nicht so selten vorkommt) eine motorische Störung gemeinsam mit dem Verlust der eigenen Stimme auftritt, verliert die betreffende Person faktisch jede Möglichkeit, sich selbst zu äußern, da sowohl das Sprechen wie auch das Schreiben im herkömmlichen Sinn unmöglich ist.

Da die übliche Bedienung einer Tastatur zur Texteingabe nicht angewendet werden kann, müssen alternative Techniken eingesetzt werden. Wenn die Bewegungsfähigkeit im Kopfbereich noch ausreicht, kann eine Tastatur mittels eines am Kopf befestigten oder mit den Zähnen gehaltenen Stabes betätigt werden. Um das seitliche Abrutschen zu verhindern werden Tastaturen üblicherweise mit einer Lochmaske versehen.

Ist auch diese Bewegungsfähigkeit nicht mehr gegeben, können vielfältige Einzelschalter (wie z.B. Blasschalter oder Lidschlagschalters) eingesetzt werden, um minimale Bewegungen zur Steuerung des Kommunikationsvorganges auszunützen. Die Auswahl der einzelnen Kommunikationsbausteine (Buchstaben, Silben, Phrasen) erfolgt durch automatisches Scannen, also dadurch, dass sie zeitlich nacheinander zur Auswahl angeboten werden. Durch einen ersten Tastendruck wird der Scanvorgang angestoßen, und ein Cursor wandert schrittweise von einem Menüelement zum nächsten. Ist das gewünschte Menüelement erreicht, so kann dieses durch einen zweiten Tastendruck angesprochen werden. Die Taktfrequenz, mit der der Cursor (oft auch Fokus genannt) automatisch von einem Menüelement zum nächsten weitergeschaltet wird, wird Scanfrequenz genannt, ihr Kehrwert, die Verweildauer auf einem Menüelement wird als Scanperiode bezeichnet.

Die richtige Wahl der Scanperiode stellt einen kritischen Punkt dar. Ist die Scanperiode zu groß, so kostet der Scanvorgang unnötig Zeit. Ist die Scanperiode zu klein, so ist das System nur mit größter Konzentration bedienbar oder wird sogar unbeherrschbar, wenn die Reaktionszeit des Benutzers nicht ausreicht.

Image157

Bild 1 zeigt eine mittels Scanning benutzbare Buchstabentafel. Diese wird auf dem Bildschirm eines Computers dargestellt und erlaubt motorisch behinderten Personen die Kommunikation über einen Einfach-Sensor wie z. B. einen über den Lidschlag ausgelösten Schalter. Die Buchstabentafel enthält 32 Elemente. Bei linearem Scannen werden im Durchschnitt 16,5 Scanschritte zur Auswahl eines Elementes benötigt. Bei einer Scanperiode von 1s sind das 16,5 Sekunden. Für ein Wort bestehend aus sechs Buchstaben werden demnach ca. 100 Sekunden benötigt! Mit anderen Worten: Die Schreibgeschwindigkeit liegt bei etwa 3 Buchstaben / min (die Eingabe des Leerzeichens nach dem Wort muss auch berücksichtigt werden).

Wie sehr die Kommunikationsraten behinderter Menschen hinter den uns vertrauten Geschwindigkeiten zurückbleiben, verdeutlicht nachfolgende Tabelle:

Gesprochene Sprache

800 bis 900 Buchstaben pro Minute

Nichtbehinderte Schreiber über Tastatur

200 bis 300 Buchstaben pro Minute

Tastatureingabe über Mundstab

75 bis 120 Buchstaben pro Minute

Eingabe über Einzelschalter und Scannen

3 bis 10 Buchstaben pro Minute

2    Redundanz der Sprache und Vorhersage

Ein möglicher Ausweg aus dem Kommunikationsdilemma ist die Tatsache, dass jede Sprache ein hohes Maß an Redundanz aufweist (in der Größenordnung von 75%). Zur Vermittlung einer sprachlichen Information ist es im Prinzip nicht erforderlich, alle Buchstaben eines Textes komplett einzugeben. Diese Aussage läßt sich sehr leicht auch experimentell verifizieren. Man bittet dazu eine Person, anstelle zu sprechen, in langsamer Folge auf Buchstaben einer Alphabettafel zu zeigen. Dabei wird folgendes vereinbart: Der Empfänger der Nachricht darf versuchen, aus den bereits angezeigten Buchstaben eines Wortes bzw. auch aus den bereits bekannten Wörtern des Satzes zu raten, wie der Text weitergeht. Ist die Annahme richtig, dann zeigt der „Sprecher“ auf das Leerzeichen und beginnt mit dem Buchstabieren den nächsten Wortes, ist die Annahme falsch, wird das Buchstabieren bis zum nächsten Raten fortgesetzt.

Wertet man eine derart geführte Kommunikation aus, wird man feststellen, dass weit weniger als die Hälfte der Buchstaben eines Textes gezeigt werden mußten. Der Rest war aus der Zusammenhang zu erraten.

3    Wenn der Computer das Raten übernimmt

Man hat daher nach Möglichkeiten gesucht, dieses Erraten von Texten aus dem Zusammenhang auch auf den Computer zu übertragen, um auf diese Weise die für die Erstellung eines Textes erforderliche Anzahl von Anschlägen zu reduzieren. Unter der englischen Sammelbezeichnung „Predictive Typing“ kommen dabei folgende Verfahren zur Anwendung:

Braille_1.GIF

36

PCNEWS-60  November 1998

Wolfgang L. Zagler zw@fortec.tuwien.ac.at    http://fortec.iaee.tuwien.ac.at/fortec/


Sag’ mir, was ich schreiben will!

PC und Behinderte


3.1 Word Completion

Unter dem Terminus technicus „Word Completion“ wird folgendes Verfahren verstanden: Der Benutzer / die Benutzerin beginnt das gewünschte Wort - wie gewöhnlich - mit dem ersten Buchstaben zu tippen. Nach Anschlag des ersten Buchstaben werden vom Word Completion-Algorithmus unter Zugriff auf ein Wörterbuch, das Informationen über die Verwendungshäufigkeit enthält, Vorschläge für die Fortsetzung des Wortes gemacht. Ist das gewünschte Wort bereits in der präsentierten Vorschlagsliste enthalten, so kann es (z.B. durch Betätigen einer Funktionstaste) direkt aus der Liste ausgewählt werden und es ist vollständig eingegeben. Befindet es sich nicht unter den vorgeschlagenen Wörtern, so wird vom Benutzer / der Benutzerin der nächste Buchstabe getippt und vom Algorithmus wird eine neue, enger fokussierte Vorschlagsliste erstellt usw.

3.2 Word Prediction

Word Prediction“ bezeichnet folgendes Verfahren: Nach vollständiger Eingabe eines Wortes, wird vom Word Prediction-Algorithmus eine Vorschlagsliste für das folgende Wort erstellt. Ist das gewünschte Wort bereits in dieser Liste enthalten, so kann der Benutzers dieses direkt auswählen und es ist fertig eingegeben. Anderenfalls beginnt der Benutzer mit dem Tippen des ersten Buchstabens, die weitere Prediction erfolgt nach dem Word Completion Verfahren.

3.3 Multiple Word Prediction

Durch „Multiple Word Prediction“ werden zwei oder mehrere aufeinanderfolgende Wörter auf einmal vorhergesagt. Funktionsweise ähnlich wie Word Prediction.

3.4 Abbreviation Expansion

Abbreviation Expansion“ bedeutet die automatische Übersetzung von Abkürzungen in Volltext und ermöglicht die schnelle Eingabe von häufig benötigten Wörtern oder Phrasen.

4    Die Besonderheiten der deutschen Sprache

Wie bereits durch die bewußte Verwendung der englischen Fachausdrücke angedeutet, wurden Methoden des „Predictive Typings“ vor allem in englischsprechenden Ländern entwickelt, wo Textvorhersageprogramme Einsparungen an Anschlägen (Keystroke-Saving-Rate = KSR) von 50% bis 55% erreichen. Diese Programme beruhen im großen und ganzen auf Vorhersage und Ergänzung von Wörtern. Diese Erfolge sind nicht zuletzt auf die Tatsache zurückzuführen, dass Englisch zu den „nicht-flektierten“ Sprachen zählt, dass also englische Wörter lediglich geringe Variationen in der Endung aufweisen. Somit können durch das Textvorhersageprogramm die einzelnen Wörter samt ihrer Endung aus einer kleinen Auswahl treffsicher vorhergesagt werden.

Als Beispiel soll hier die Erzeugung des Wortes „investigates“ (in „He investigates the benefits of ...“) dienen. Die grundsätzlich möglichen Endungen von to investigate beschränken sich auf folgende vier:

investigate

investigates

investigating

investigated

Betrachten wir hingegen das deutsche Wort „forschen“. Die Möglichkeiten der Endungsbildung sind mit 16 unterschiedlichen Wortformen bedeutend vielfältiger:

forschen

forsche

forschst

forscht

forschte

forschtest

forschten

forschtet

forschend

forschende

forschender

forschendes

forschendem

forschenden

Forschet!
(Imperativ)

Wird keine Unterscheidung zwischen Groß- und Kleinschreibung getroffen, fallen alle Formen von „Forschung“ ebenso darunter wie das Eigenschaftswort „forsch“ mit allen seinen Endungen. Da für das deutsche Wort wesentlich mehr Buchstaben eingegeben werden müssen, bis sich die Unterschiede in den Endungen auf die Bildung der Vorschlagsliste auswirken, ist der durch Textvorhersage erzielte Gewinn geringer als in der englischen Sprache.

5    Elemente von Algorithmen zur Textvorhersage

Im folgenden werden einige Grundbausteine von Algorithmen zur Textvorhersage erläutert. Diese Grundbausteine sind Ergebnis von verschiedenen Forschungsarbeiten und werden auch bereits in mehreren Produkten eingesetzt.

5.1 Berücksichtigung der Häufigkeit von Einzelwörtern

Dies ist die einfachste und naheliegendste Strategie. Sie wird von praktisch allen bekannten Algorithmen genutzt. Die Vorschlagsliste wird basierend auf einem Frequenzwörterbuch erstellt indem jene Wörter vorgeschlagen werden, die dem eingegebenen Anfangsmuster entsprechen und am häufigsten vorkommen. Diese Häufigkeit wird durch eine Zählvariable angegeben, die jedem Wort zugeordnet ist. Man spricht von „Unigrammen“.

5.2 Berücksichtigung von bedingten Wahrscheinlichkeiten

Es werden Bigramme eingeführt, die die bedingten Wahrscheinlichkeiten angeben, dass ein bestimmtes Wort auf ein bestimmtes anderes folgt. Dadurch kann einerseits neben Word Completion auch Word Prediction durchgeführt werden. Andererseits entsteht ein zusätzlicher Gewichtungsfaktor für Word Completion.