Montag, 16. Februar 2015

34: Automatic language

Na da brat' mir doch einer 'n Storch (Sprichwort), es ist 2015. Und ich blogge jetzt mal frisch und fröhlich (Alliteration) weiter - der regelmässige Rhythmus (Alliteration & Pleonasmus) wird aber ab jetzt abgeschafft, da für mich gerade ein nicht gerade unbedeutendes (Litotes) Semester beginnt. Lassen Sie sich also einfach gelegentlich von einem Post überraschen, OK? Bestens. Für den ersten Post dieses Jahres habe ich mir das Analysematerial vollautomatisch produzieren lassen. Und zwar von meinem Handy.

Es wird ja kaum mehr handschriftlich geschrieben. Heutzutage wird vornehmlich getippt, auf echten
oder virtuellen Tastaturen, und das bringt neue Probleme mit sich, die wiederum mit neuen Schreibhilfen bekämpft werden. Beim Computer werden Wörterbücher angelegt, und die Daten daraus werden beim Schreiben mit dem verfassten Text abgeglichen. Scheint ihm ein Wort zu abgefahren, und kennt er ein Wort, das fast gleich geschrieben wird, so schlägt er dieses vor. Dazu kam irgendwann die Implementierung grammatischer Regeln, so dass uns Microsoft Word inzwischen auch auf falsche Deklination und ähnliches aufmerksam machen kann (in vielen Fällen schlägt es aber auch einfach nur Quatsch vor).

Bei kleinen Handytastaturen trifft man des öfteren nicht genau alle gewünschten Buchstaben, und deshalb können Smartphones mittels Autokorrektur Wörter vorschlagen (bzw. aufzwingen), die man vielleicht hatte schreiben wollen, weil die Finger in der Nähe der passenden Buchstaben vorbeigekommen waren. Die Entwickler der Swype-Technologie machten sich diese Technik zunutze und erfanden ein Schreibsystem, bei dem man nur eine Linie über die gewünschten Buchstaben auf der Tastatur zu zeichnen braucht, worauf aus den Buchstaben, bei denen die Linie die Richtung ändert, mögliche Wörter zusammengebastelt und vorgeschlagen werden. Das Handy lernt dabei neue Wörter, die man benutzt (der Schweizerdeutsch-Lernprozess meines Handys fasziniert mich ungemein), und speist zum Beispiel auch Namen aus dem Telefonbuch ein. Interessant wird es zum Beispiel dann, wenn man beispielsweise einen Text swypet und immer den jeweils zweiten Vorschlag annimmt. Bestaunen Sie im Folgenden die "zweitwahrscheinlichsten Varianten" zweier bekannter Texte.

Alte meiner erbrechen
Schwetzingen aus drum SE
Köpfen Asus den war schwatzen ihn dir hob.

Vatter unsere um hinten
Gehofft Werder sein nannte.
Sein Rettich könne, sein Wolke geschüttet, wow um Hummel, si aus Dem.

Besonders spannend: Manche Wörter kamen mehrmals vor, aber beim Swypen wurde nicht der selbe zweitwahrscheinlichste Vorschlag angegeben, was mich fragen lässt, wie denn da die Kriterien fürs Vorschlagen lauten... Auf jeden Fall würde es da nicht schaden, die Beziehungen zwischen den Wörtern zu beachten. Aber auch das können die Smartphones ja inzwischen.

Grosse Textmengen werden höchstwahrscheinlich in die Handys eingespeist - wahrscheinlich Korpora aus typischen SMS-Konversationen -, damit sie lernen, welche Worte beim Simsen oft aufeinander folgen, und möglicherweise passende Wörter vorschlagen können. Mit der Zeit lernt das System dann auch, was der Nutzer am meisten hintereinander schreibt (weswegen mich der Vorschlag im Bild oben doch etwas nachdenklich macht). Der Autovervollständiger ist ein linguistisch ungemein interessantes Phänomen. Auf meinem Windows Phone gibt es ihn nur auf Englisch. Hier sehen Sie, von welchen drei Wörtern manche Wörter laut Windows offenbar am meisten gefolgt werden:


Die Vorschläge hier sind ziemlich naheliegend... Not bad. Mal sehen, wie das weitergeht:



"Please help" auf Rang 1? Wenn das System so funktioniert, wie ich es erklärt habe, also mit eingespeisten echten SMS-Nachrichten, dann könnte man da auf eine "Great Depression" in der Bevölkerung oder sowas schliessen. Es folgt "Please don't". Es gibt also viel Uneinigkeit und Misstrauen; man muss den Leuten vieles ausreden/verbieten..? Und dann noch "Please contact" auf Rang 3... Das klingt mir irgendwie zu formell für einen echten, authentischen SMS-Korpus und wirft erneut die Frage auf, welcher Art die Nachrichten waren, die hier verwendet wurden, um das Handy zu "unterrichten".

Kuck an, kuck an. Wenn man von sich selbst schreibt, geht es also vor allem darum, was man hat (oder getan hat), was man denkt (oder meint) und was man ist (oder gerade tut). Spricht man den anderen an, so geht es darum, was er (tun) kann, was er ist (oder gerade tut), und was er hat (oder getan hat). Nun, das mit dem "have" erklärt sich vielleicht am ehesten so, dass SMS-Nachrichten in den meisten Fällen von kürzlich erfolgten Handlungen berichten (present perfect). Während wir etwas tun ("am", present continous) haben wir wohl eher weniger Zeit zum Simsen, aber wir wollen es ja richtig tun und fragen lieber nochmal nach, deswegen vielleicht Rang 3 dafür (oder wir gehören zu den Dauerschreibern, die ständig und überall mit jemandem in Kontakt sein müssen). Aber noch öfter empfinden die Menschen es offenbar als wichtig, ihren Senf abzugeben. Egoisten. Ein bisschen mehr "should" würde denen gut tun. :P
Was wird mit dem "You can" bezweckt? Die anderen sind sich wohl oft ihrer Möglichkeiten nicht bewusst. "You are" - war ja klar, was der andere ist, das wissen wir immer besser: Ein verantwortungsloses Schwein, eine dumme Quasselstrippe, ein zentralafrikanisches Rotstirngazellenbaby... Ok, letzteres eher selten. Vergessen Sie das wieder.

Das in SMS-Nachrichten erwähnte Wetter ist also in den meisten Fällen "soooo"... Also entweder schreiben sich die Leute vor allem dann Nachrichten, wenn das Wetter sooo schön, sooo mies, oder, was ich aufgrund meiner Facebook-Erfahrung auch für sehr wahrscheinlich halte, sooo spektakulär ist. Im zweiten Fall denke ich sofort an unangenehmen Smalltalk an der Bushaltestelle (gibt es Leute, die sogar beim Simsen so awkward drauf sind..?). Und der dritte Fall... kann man daraus schliessen, dass die Leute einander bei schönem Wetter öfter schreiben als bei schlechtem? Und was schliesst man wiederum daraus? Hoffentlich handelt es sich um Leute, die Ausflüge planen, und nicht um solche, die auch bei bestem Wetter noch nur mit elektronischen Geräten beschäftigt sind.

Was haben wir hier? "In the world"? Die Leute halten sich also oft für Experten, die die Autorität zur Verallgemeinerung besitzen. Oder die fortschreitende Globalisierung und Vernetzung lässt mehr Wissen und folglich mehr Aussagen über die Verhältnisse in der Welt zu. Dann folgt "in the morning"... Der Morgen ist anscheinend die meist erwähnte Tageszeit. Am Morgen findet also offenbar das erwähnenswerte Leben statt, der frühe Vogel fängt den Wurm, morning hour has gold in its mouth (klingt irgendwie verstörend auf Englisch...). Und bei Rang 3 geht das Studieren wieder los: "In the" kann unmöglich am drittmeisten von "is" gefolgt werden - wie funktioniert also dieses Vervollständigen? Meine Recherchen haben bislang nichts zutage gefördert...

Dann wünsche ich weiterhin viel Spass beim Tippen. Mal sehen, was die Technik uns Sprachfans noch so alles bringt... Ich werde da sein und es analysieren!

-Der Sprachbeschreiber

P.S. Mithilfe einiger engagierter Winterpausenklicker hat mein Blog kürzlich die 5000-Klick-Marke gesprengt. YAY, danke! =)