An vielen Stellen unserer digitalen Kommunikation unterstützen uns – oft unbemerkt – Algorithmen und KI-Systeme. Damit das klappt, müssen sie menschliche Sprache verstehen lernen. Was ist heute schon möglich – und wo stoßen Computer an ihre Grenzen?
Besserwisser im Telefon: Autokorrektur und -vervollständigung
Beim Tippen von Nachrichten auf dem Smartphone ist es sicher jeder und jedem schon einmal aufgefallen: Die Bildschirmtastatur korrigiert falsch geschriebene Wörter oder macht Vorschläge für das nächste Wort. Dahinter steckt eine Software zur Worterkennung. Ein Algorithmus gleicht dabei die eingegebenen Zeichen mit einem hinterlegten Wörterbuch ab.
Anna und die Autokorrektur
Was hat es bloß mit diesen kuriosen Nachrichten im Familienchat auf sich? Das möchte Anna in der Podcast-Folge „
Die KI liest mit“ genauer wissen.
Praktische Funktionen wie die automatische Textkorrektur basieren auf der maschinellen Verarbeitung natürlicher Sprache (engl. ‚natural language processing‘), einem Teilgebiet der Künstlichen Intelligenz (KI). Dabei wird Computern mit Methoden der Computerlinguistik beigebracht, menschliche Sprache zu verstehen und zu reproduzieren. Eine wichtige Voraussetzung dafür ist die Spracherkennung – und die ist für Computer eine große Herausforderung. Sie verarbeiten Sprache ganz anders als Menschen, nämlich als Folge von Zeichen. Dabei müssen sie nicht nur einzelne Begriffe und deren Bedeutung erkennen, sondern auch die Zusammenhänge zwischen Wörtern verstehen, etwa innerhalb eines Satzes. Hinzu kommen Grammatik, Semantik und andere Regeln, die für Menschen selbstverständlich sind – beispielsweise Pausen und Betonungen, die ebenfalls Bedeutung tragen.
Sprachverarbeitung
Sprachverarbeitung (engl. ‚natural language processing‘) umfasst diverse Methoden, mit denen Computer beigebracht wird, menschliche Sprache zu verstehen und wiederzugeben. Dadurch können Programme beispielsweise Stimm- oder Texteingaben automatisch erkennen und eigenständig darauf reagieren. Sprachverarbeitung wird heute oft durch maschinelles Lernen unterstützt. Sie ist Grundlage zahlreicher Anwendungen, darunter Übersetzungsprogramme, Chatbots oder KI-Systeme wie etwa Sprachassistenten.
zum Glossar
Korrekte Spracherkennung ist für Computer schwierig
Menschliche Sprache ist ein komplexes System von Zeichen und äußerst mehrdeutig. Das macht es Maschinen nicht gerade leicht, sie zu verstehen. Menschen lernen im Laufe ihres Lebens durch praktische Erfahrung, die Eigenheiten und Nuancen von Sprache zu deuten – also etwa, ob es sich bei einer Aussage um Ironie oder ein Wortspiel handelt. Computer stießen dabei lange an ihre Grenzen. Modernen Systemen, die mit statistischen Lernverfahren und Algorithmen aus Sprachdaten Muster und Modelle ableiten, gelingt das inzwischen jedoch immer besser. Heute findet Sprachverarbeitung in immer größerem Maßstab statt und ist zum Beispiel ein wichtiger Bestandteil von selbstständig agierenden KI-Systemen.
Sprachgewandte KI
Maschinelle Sprachverarbeitung ist eine wichtige Grundlage vieler Kommunikationsdienste und sorgt zum Beispiel dafür, dass Sprachassistenten Fragen beantworten können. Wie das funktioniert, wird im Beitrag
„Was macht einen Sprachassistenten klug?“ erklärt.
Auch ein Smartphone ‚lernt‘ den Sprachgebrauch der Besitzerin oder des Besitzers, um die Eingaben zu beschleunigen: Die Tastatursoftware registriert, welche Wörter und Kombinationen besonders häufig verwendet werden und errechnet auf Grundlage dieser Informationen, welches Wort wir wahrscheinlich als nächstes schreiben. Wenn wir einen Wortvorschlag übernehmen, wird diese Entscheidung wiederum registriert und für die Optimierung zukünftiger Vorhersagen genutzt.
Die Sprachverarbeitung funktioniert umso besser, je mehr Daten eine Software zur Verfügung hat. Moderne Programme greifen nicht nur auf eingespeiste Wortlisten, Lexika oder Sprachmuster zurück. Sie können auch eigenständig Webseitentexte, öffentliche Foren oder Kommentarspalten analysieren. Unternehmen werten so zum Beispiel automatisch aus, wie ihre Produkte auf Onlineportalen bewertet werden. Auch Übersetzungsprogramme wie Google Translate oder deepL nutzen komplexe KI-Verfahren, um aus Texteingaben die Feinheiten möglichst vieler Sprachen zu lernen. Wenn wir die Qualität der Übersetzung bewerten oder selbst passendere Wörter auswählen, beziehen Programme dieses Feedback ein. So wird die automatische Spracherkennung großer Online-Anbieter immer besser. Und das hilft zum Beispiel auch Menschen mit Seh- oder Hörbeeinträchtigungen, die unter anderem durch automatisch generierte Untertitel Zugang zu digitalen Informationen erhalten.
Automatische Kommunikation: Computer helfen mit Textbausteinen
Maschinelle Sprachverarbeitung ist sehr vielfältig und begegnet uns in unserem Kommunikationsalltag schon sehr häufig. Wenn wir unser E-Mail-Postfach öffnen, haben Algorithmen die Nachrichten bereits gescannt und sortiert: Persönliche E-Mails, Werbe-Mails und unerwünschte Spam-Nachrichten werden übersichtlich dargestellt. Dazu wird zum Beispiel abgeglichen, ob sich die Absenderinnen und Absender in unserem Adressbuch befinden und was in der Betreffzeile steht. Manche Dienste bieten an, mit vorgefertigten Antworten auf Nachrichten zu reagieren. Einfache Nachrichten wie Terminbestätigungen werden dann für die Nutzerin oder den Nutzer vorformuliert. Wenn wir aus mehreren Vorschlägen einen auswählen, wird diese Entscheidung von der Software als Feedback genutzt. Im Gegensatz zum Smartphone passt sich das Programm aber nicht in erster Linie an das eigene Verhalten an, sondern greift auf die aus Millionen von E-Mails erlernten Regeln zurück, damit die Antwortvorschläge besser zum allgemeinen Sprachgebrauch passen – und von möglichst vielen Menschen genutzt werden.
Chatbots
Chatbots sind Programme, die es ermöglichen, in natürlicher Sprache mit einem technischen System zu kommunizieren. Sie werden beispielsweise von Unternehmen zur Unterstützung der Kundenkommunikation auf ihren Webseiten oder in Messengern genutzt. Neben dem Kundenservice gibt es zahlreiche weitere Einsatzbereiche. Wer ein solches Programm einmal selbst ausprobieren möchte, kann zum Beispiel den Bot
Novi testen: Dieses von
funk (ARD/ZDF) entwickelte Chat-Programm fasst täglich in knapper Form Nachrichten zusammen. Man kann es über ausgewählte Messenger-Apps oder direkt im Browser nutzen.
zum Glossar
Eine gewisse Automatisierung der Kommunikation lässt sich auch in anderen Bereichen beobachten. Einige Unternehmen setzen beispielsweise im Kundenservice auf Chat-Programme, die eigenständig auf Fragen reagieren oder Produkte empfehlen. Andere Programme erinnern automatisch an die Netiquette, wenn in einem Chat Schimpfwörter verwendet werden. Ähnlich funktionieren Chatbots, wie sie bereits in manchen Messengern eingesetzt werden: Die Software analysiert die Unterhaltungen und reagiert auf bestimmte Wörter oder Sätze mit Vorschlägen, welche Funktionen oder Werkzeuge man als nächstes verwenden könnte. Damit das funktioniert, gleichen solche Programme unsere Eingaben mit Textdatenbanken ab und spielen ebenfalls hinterlegte Reaktionen aus. Wirklich verstehen, was wir vorhaben, können sie allerdings nicht. Ob wir diese und ähnliche Anwendungen als manchmal mehr, manchmal weniger gut funktionierende Alltagshilfen annehmen oder genervt abschalten, ist letztlich eine individuelle Entscheidung.
Praktische Alltagshilfen – aber auch vertrauenswürdig?
Funktionen wie die automatische Textkorrektur begleiten viele Nutzerinnen und Nutzer inzwischen selbstverständlich durch den Alltag. Allerdings verarbeiten sie dabei auch viele persönliche Inhalte. Bei vielen Apps und Geräten ist es möglich, die Hintergrundprozesse einzuschränken und die eigenen Daten zu schützen. Denn vermeintlich harmlose Funktionen können durchaus brisant sein: Die Tastatur-Software eines Mobilgeräts verarbeitet sensible Eingaben wie Passwörter, Namen oder Adressen. Manche Tastatur-Apps verbinden sich mit dem Internet und legen umfassende Profile mit individuellen Sprachdaten einer Person auf den Servern des Anbieters ab. Von dort können Informationen gestohlen werden oder verloren gehen. Man sollte also genau abwägen, ob die Zusatzfunktionen solcher Apps gerechtfertigt sind – und eine kurze Internetrecherche zum Umgang mit den Daten starten, bevor man sich für eine Anwendung entscheidet. Auch die vom Hersteller auf Geräten vorinstallierten Tastatur-Programme sind in dieser Hinsicht nicht immer optimal. Oft lassen sie sich aber bei Bedarf ersetzen.
Sichere Tipphilfen
Smartphone-Tastaturen verarbeiten sensible Eingaben. Manche Tastatur-Apps verbinden sich mit dem Internet und legen umfassende Datenprofile auf den Servern der Anbieter ab. Das kann eine potenzielle Sicherheitslücke darstellen. Daher lohnt es sich, die Geräteeinstellungen des Smartphones und Zugriffsrechte solcher Apps zu überprüfen. Außerdem lassen sich Tastatur-Apps bei Bedarf ersetzen – eine datenschutzfreundliche Alternative für Android-Geräte ist zum Beispiel die App AnySoftKeyboard.
Programme zur Sprachverarbeitung sind oft nützlich: Sie unterstützen uns dabei, schneller, effizienter und fehlerfreier mit anderen Menschen zu kommunizieren und schützen uns vor Spam. Dank höherer Rechenleistung und KI-gestützter Datenauswertung werden solche Anwendungen immer besser – doch sie sind noch lange nicht perfekt. Kuriose Wortvorschläge, kleine Pannen und Missverständnisse durch das Schreiben mit Autokorrektur zeigen vor allem eines: Sprache in all ihren Ausdrucksformen ist etwas zutiefst Menschliches – und für Computerprogramme oft noch nicht fehlerfrei berechenbar.
Nicht nur beim alltäglichen Austausch prägen
technische Systeme unser soziales Leben. Bei manchen Online-Diensten stellen Algorithmen Verbindungen zwischen Menschen her: Sie sagen teils erstaunlich präzise vorher, welche Personen wir kennen. Oder in wen wir uns verlieben könnten. Wie das funktioniert, darum geht es in den Beiträgen zu
Matching-Algorithmen auf Dating-Seiten und
Kontaktvorschlägen in sozialen Netzwerken.
An vielen Stellen unserer digitalen Kommunikation unterstützen uns – oft unbemerkt – Algorithmen und KI-Systeme. Damit das klappt, müssen sie menschliche Sprache verstehen lernen. Was ist heute schon möglich – und wo stoßen Computer an ihre Grenzen?
Besserwisser im Telefon: Autokorrektur und -vervollständigung
Beim Tippen von Nachrichten auf dem Smartphone ist es sicher jeder und jedem schon einmal aufgefallen: Die Bildschirmtastatur korrigiert falsch geschriebene Wörter oder macht Vorschläge für das nächste Wort. Dahinter steckt eine Software zur Worterkennung. Ein Algorithmus gleicht dabei die eingegebenen Zeichen mit einem hinterlegten Wörterbuch ab.
Was hat es bloß mit diesen kuriosen Nachrichten im Familienchat auf sich? Das möchte Anna in der Podcast-Folge „Die KI liest mit“ genauer wissen.
Praktische Funktionen wie die automatische Textkorrektur basieren auf der maschinellen Verarbeitung natürlicher Sprache (engl. ‚natural language processing‘), einem Teilgebiet der Künstlichen Intelligenz (KI). Dabei wird Computern mit Methoden der Computerlinguistik beigebracht, menschliche Sprache zu verstehen und zu reproduzieren. Eine wichtige Voraussetzung dafür ist die Spracherkennung – und die ist für Computer eine große Herausforderung. Sie verarbeiten Sprache ganz anders als Menschen, nämlich als Folge von Zeichen. Dabei müssen sie nicht nur einzelne Begriffe und deren Bedeutung erkennen, sondern auch die Zusammenhänge zwischen Wörtern verstehen, etwa innerhalb eines Satzes. Hinzu kommen Grammatik, Semantik und andere Regeln, die für Menschen selbstverständlich sind – beispielsweise Pausen und Betonungen, die ebenfalls Bedeutung tragen.
Sprachverarbeitung (engl. ‚natural language processing‘) umfasst diverse Methoden, mit denen Computer beigebracht wird, menschliche Sprache zu verstehen und wiederzugeben. Dadurch können Programme beispielsweise Stimm- oder Texteingaben automatisch erkennen und eigenständig darauf reagieren. Sprachverarbeitung wird heute oft durch maschinelles Lernen unterstützt. Sie ist Grundlage zahlreicher Anwendungen, darunter Übersetzungsprogramme, Chatbots oder KI-Systeme wie etwa Sprachassistenten.
zum Glossar
Korrekte Spracherkennung ist für Computer schwierig
Menschliche Sprache ist ein komplexes System von Zeichen und äußerst mehrdeutig. Das macht es Maschinen nicht gerade leicht, sie zu verstehen. Menschen lernen im Laufe ihres Lebens durch praktische Erfahrung, die Eigenheiten und Nuancen von Sprache zu deuten – also etwa, ob es sich bei einer Aussage um Ironie oder ein Wortspiel handelt. Computer stießen dabei lange an ihre Grenzen. Modernen Systemen, die mit statistischen Lernverfahren und Algorithmen aus Sprachdaten Muster und Modelle ableiten, gelingt das inzwischen jedoch immer besser. Heute findet Sprachverarbeitung in immer größerem Maßstab statt und ist zum Beispiel ein wichtiger Bestandteil von selbstständig agierenden KI-Systemen.
Maschinelle Sprachverarbeitung ist eine wichtige Grundlage vieler Kommunikationsdienste und sorgt zum Beispiel dafür, dass Sprachassistenten Fragen beantworten können. Wie das funktioniert, wird im Beitrag „Was macht einen Sprachassistenten klug?“ erklärt.
Auch ein Smartphone ‚lernt‘ den Sprachgebrauch der Besitzerin oder des Besitzers, um die Eingaben zu beschleunigen: Die Tastatursoftware registriert, welche Wörter und Kombinationen besonders häufig verwendet werden und errechnet auf Grundlage dieser Informationen, welches Wort wir wahrscheinlich als nächstes schreiben. Wenn wir einen Wortvorschlag übernehmen, wird diese Entscheidung wiederum registriert und für die Optimierung zukünftiger Vorhersagen genutzt.
Die Sprachverarbeitung funktioniert umso besser, je mehr Daten eine Software zur Verfügung hat. Moderne Programme greifen nicht nur auf eingespeiste Wortlisten, Lexika oder Sprachmuster zurück. Sie können auch eigenständig Webseitentexte, öffentliche Foren oder Kommentarspalten analysieren. Unternehmen werten so zum Beispiel automatisch aus, wie ihre Produkte auf Onlineportalen bewertet werden. Auch Übersetzungsprogramme wie Google Translate oder deepL nutzen komplexe KI-Verfahren, um aus Texteingaben die Feinheiten möglichst vieler Sprachen zu lernen. Wenn wir die Qualität der Übersetzung bewerten oder selbst passendere Wörter auswählen, beziehen Programme dieses Feedback ein. So wird die automatische Spracherkennung großer Online-Anbieter immer besser. Und das hilft zum Beispiel auch Menschen mit Seh- oder Hörbeeinträchtigungen, die unter anderem durch automatisch generierte Untertitel Zugang zu digitalen Informationen erhalten.
Automatische Kommunikation: Computer helfen mit Textbausteinen
Maschinelle Sprachverarbeitung ist sehr vielfältig und begegnet uns in unserem Kommunikationsalltag schon sehr häufig. Wenn wir unser E-Mail-Postfach öffnen, haben Algorithmen die Nachrichten bereits gescannt und sortiert: Persönliche E-Mails, Werbe-Mails und unerwünschte Spam-Nachrichten werden übersichtlich dargestellt. Dazu wird zum Beispiel abgeglichen, ob sich die Absenderinnen und Absender in unserem Adressbuch befinden und was in der Betreffzeile steht. Manche Dienste bieten an, mit vorgefertigten Antworten auf Nachrichten zu reagieren. Einfache Nachrichten wie Terminbestätigungen werden dann für die Nutzerin oder den Nutzer vorformuliert. Wenn wir aus mehreren Vorschlägen einen auswählen, wird diese Entscheidung von der Software als Feedback genutzt. Im Gegensatz zum Smartphone passt sich das Programm aber nicht in erster Linie an das eigene Verhalten an, sondern greift auf die aus Millionen von E-Mails erlernten Regeln zurück, damit die Antwortvorschläge besser zum allgemeinen Sprachgebrauch passen – und von möglichst vielen Menschen genutzt werden.
Chatbots sind Programme, die es ermöglichen, in natürlicher Sprache mit einem technischen System zu kommunizieren. Sie werden beispielsweise von Unternehmen zur Unterstützung der Kundenkommunikation auf ihren Webseiten oder in Messengern genutzt. Neben dem Kundenservice gibt es zahlreiche weitere Einsatzbereiche. Wer ein solches Programm einmal selbst ausprobieren möchte, kann zum Beispiel den Bot Novi testen: Dieses von funk (ARD/ZDF) entwickelte Chat-Programm fasst täglich in knapper Form Nachrichten zusammen. Man kann es über ausgewählte Messenger-Apps oder direkt im Browser nutzen.
zum Glossar
Eine gewisse Automatisierung der Kommunikation lässt sich auch in anderen Bereichen beobachten. Einige Unternehmen setzen beispielsweise im Kundenservice auf Chat-Programme, die eigenständig auf Fragen reagieren oder Produkte empfehlen. Andere Programme erinnern automatisch an die Netiquette, wenn in einem Chat Schimpfwörter verwendet werden. Ähnlich funktionieren Chatbots, wie sie bereits in manchen Messengern eingesetzt werden: Die Software analysiert die Unterhaltungen und reagiert auf bestimmte Wörter oder Sätze mit Vorschlägen, welche Funktionen oder Werkzeuge man als nächstes verwenden könnte. Damit das funktioniert, gleichen solche Programme unsere Eingaben mit Textdatenbanken ab und spielen ebenfalls hinterlegte Reaktionen aus. Wirklich verstehen, was wir vorhaben, können sie allerdings nicht. Ob wir diese und ähnliche Anwendungen als manchmal mehr, manchmal weniger gut funktionierende Alltagshilfen annehmen oder genervt abschalten, ist letztlich eine individuelle Entscheidung.
Praktische Alltagshilfen – aber auch vertrauenswürdig?
Funktionen wie die automatische Textkorrektur begleiten viele Nutzerinnen und Nutzer inzwischen selbstverständlich durch den Alltag. Allerdings verarbeiten sie dabei auch viele persönliche Inhalte. Bei vielen Apps und Geräten ist es möglich, die Hintergrundprozesse einzuschränken und die eigenen Daten zu schützen. Denn vermeintlich harmlose Funktionen können durchaus brisant sein: Die Tastatur-Software eines Mobilgeräts verarbeitet sensible Eingaben wie Passwörter, Namen oder Adressen. Manche Tastatur-Apps verbinden sich mit dem Internet und legen umfassende Profile mit individuellen Sprachdaten einer Person auf den Servern des Anbieters ab. Von dort können Informationen gestohlen werden oder verloren gehen. Man sollte also genau abwägen, ob die Zusatzfunktionen solcher Apps gerechtfertigt sind – und eine kurze Internetrecherche zum Umgang mit den Daten starten, bevor man sich für eine Anwendung entscheidet. Auch die vom Hersteller auf Geräten vorinstallierten Tastatur-Programme sind in dieser Hinsicht nicht immer optimal. Oft lassen sie sich aber bei Bedarf ersetzen.
Smartphone-Tastaturen verarbeiten sensible Eingaben. Manche Tastatur-Apps verbinden sich mit dem Internet und legen umfassende Datenprofile auf den Servern der Anbieter ab. Das kann eine potenzielle Sicherheitslücke darstellen. Daher lohnt es sich, die Geräteeinstellungen des Smartphones und Zugriffsrechte solcher Apps zu überprüfen. Außerdem lassen sich Tastatur-Apps bei Bedarf ersetzen – eine datenschutzfreundliche Alternative für Android-Geräte ist zum Beispiel die App AnySoftKeyboard.
Programme zur Sprachverarbeitung sind oft nützlich: Sie unterstützen uns dabei, schneller, effizienter und fehlerfreier mit anderen Menschen zu kommunizieren und schützen uns vor Spam. Dank höherer Rechenleistung und KI-gestützter Datenauswertung werden solche Anwendungen immer besser – doch sie sind noch lange nicht perfekt. Kuriose Wortvorschläge, kleine Pannen und Missverständnisse durch das Schreiben mit Autokorrektur zeigen vor allem eines: Sprache in all ihren Ausdrucksformen ist etwas zutiefst Menschliches – und für Computerprogramme oft noch nicht fehlerfrei berechenbar.