Hast du schon darüber nachgedacht, wie eine Sprachsteuerung funktioniert? Wir möchten dir heute die Antworten darauf geben und dir außerdem sagen, welche Sprachassistenten es gibt. Du erfährst darüber hinaus, welchen Nutzen du von einer Sprachsteuerung hast.
Wie funktioniert eine Sprachsteuerung?
Im Jahr 2012 lehrte Apple seinem damaligen Betriebssystem iOS5 das Sprechen. Genauer gesagt, konnte das iPhone 4S sprechen. Die Sprachassistentin Siri war geboren. Sie erleichterte damit die Bedienung des Smartphones. Natürlich gab es bereits vorher Sprachsteuerungen, allerdings sorgte erst Siri für eine Revolution des Marktes und für die Entwicklung weiterer Sprachsteuerungen.
Wie entstehen die Antworten?
Im Prinzip funktionieren alle Sprachassistenten ähnlich. Du gibst einen Sprachbefehl, der vom Gerät aufgenommen wird. Im Anschluss wird dieser in ein bestimmtes Format übertragen und übersetzt. Danach wird er an einen Server des Anbieters weitergeleitet. Er wertet die Daten aus und sendet die Antwort an das Gerät. So können dann die Funktionen ausgeführt oder Anwendungen veranlasst werden.
Was ist für die Sprachsteuerung alles notwendig?
Damit du einen Sprachassistenten nutzen kannst, brauchst du eine aktive Internetverbindung. Andernfalls ist der Einsatz nämlich noch nicht möglich. Offline können Sprachsteuerungen Befehle noch nicht erkennen. Hier ist die Kapazität der Sprachassistenten also begrenzt. Doch in Zukunft könnte es durchaus sein, allerdings benötigen die Anbieter der Sprachsteuerungen aber sehr leistungsfähige Server, die auf der ganzen Welt stationiert sein müssen.
Was jedoch noch viel wichtiger für die Fähigkeit der Sprachsteuerungen war, ist dass Apple zwei Jahre nach der Vorstellung von Siri das innovative Deep Learning einführte. Das heißt in etwa so viel wie “tiefes Lernen”. Die Software war ab sofort in der Lage, die Informationsquellen miteinander zu verbinden und konnte durch Befehle hinzulernen. Wie eben auch unser Gehirn.
Die Basis bei Apple ist ein riesiger Cache-Speicher mit 200 Megabyte. Er enthält unterschiedliche Modelle zur Erkennung von Gesichtern, Szenen und Sprachen. Diese vergleichen die Funktionen miteinander. Seit damals konnte die Fehlerquote in Bezug auf die Spracherkennung erheblich gesenkt werden, nämlich um 25 Prozent.
Es gibt noch andere Anbieter, die auch mit Deep Learning arbeiten, zum Beispiel Safari oder Spotlight. Microsoft entwickelte Cortana und Google brachte Now heraus. Mit dem Unterschied, dass diese beiden Sprachassistenten noch ein wenig intelligenter als Siri waren.
Die Sprachbefehle noch besser verstehen können
Schon jetzt sind neuronale Netze in der Lage, große Datenmengen schnell durchsuchen zu können. Anschließend wird die Sprache in Texte transformiert. Und es soll zukünftig noch intelligenter werden. Die Sprache soll nicht nur übersetzt werden, vielmehr soll auch die Absicht dahinter verstanden werden. Das erlaubt das sogenannte Natural Language Processing oder abgekürzt NLP.
Und wie funktioniert NLP? Wenn es darum geht, die Sprache zu verstehen, wird diese aufgenommen und analysiert. Die Sätze werden in ihre Bestandteile aufgespalten. So kann sich die Software über Themen, Zusammenhänge und Stimmung ein Bild machen. Dieser Vorgang wird Natural Language Understanding genannt.
Um antworten zu können, wandelt die Software die gesprochenen Befehle um. Die daraus generierten Daten sind behilflich, die gewünschte Antwort aus verschiedenen vorgegebenen zu finden. Danach gibt die Software die Antwort aus, indem es diese in unserer Sprache mitteilt.
Du solltest dir aber darüber im Klaren sein, dass die Sprachsteuerungen nur ihren bestimmten Bereich abdecken können. Nicht jeder Sprachassistent kann alles tun oder beantworten. Deshalb solltest du dich vor der Auswahl einer Sprachsteuerung darüber informieren, wofür sie eingesetzt werden kann.
Die bekanntesten Sprachassistenten im Überblick
Es gibt unterschiedliche Sprachassistenten. Die wichtigsten stellen wir dir nun vor.
Alexa gehört wohl zu den bekanntesten Sprachassistenten weltweit. Der Entwickler ist Amazon. Auch der Google Assistant dürfte jedem ein Begriff sein. Er verwendet den Smart Speaker Google Nest in unterschiedlichen Versionen. Es ist aber auch möglich, andere Smart Speaker zu verwenden.
Ein weiterer Sprachassistent ist Bixby von Samsung. Er verwendet keinen eigenen Smart Speaker, wodurch du einen Lautsprecher deiner Wahl einsetzen kannst. Der Samsung Sprachassistent ist meist bereits bei allen Tablets und Smartphones des Herstellers vorhanden. Auch bei anderen Geräten, zum Beispiel Fernseher oder Kühlschränken ist er verfügbar.
Bekannt und beliebt sind auch die bereits genannten Sprachassistenten Siri und Cortana. Letzterer ist ausschließlich zur Sprachsteuerung für die Microsoft Office 365 Produkte geeignet.