Apple schlägt Google mit Siri bei der Spracherkennung

MobileSmartphone

Mit dem iPhone 4S scheint Apple Google in einer Hinsicht überholt zu haben: Siri Assistant, der mit künstlicher Intelligenz ausgestattete virtuelle Assistent, mit dem Anwender Meetings planen, Anrufe tätigen und einen Tisch in einem Restaurant reservieren können.

Seit August 2010 bietet Google unter dem Namen Google Voice Actions ähnliche Spracherkennungstechnologie für die Android-Plattform an. Genau wie bei Siri können Anwender mit Voice Actions per Spracheingabe bei Unternehmen und Kontakten anrufen, SMS und E-Mails verschicken, Musik hören und im Internet surfen.

Im Kontext betrachtet

Aber Siri geht über die einfache Durchführung und Erledigung von Aufgaben hinaus. Das Tool berücksichtigt bei bestimmten Aktivitäten den Kontext. Wenn man Siri nach dem Wetterbericht fragt, ermittelt der Assistent den aktuellen Aufenthaltsort des iPhone-4S-Nutzers und holt sich dann die gewünschten Informationen. Oder Sie machen es kurz und fragen Siri, ob Sie einen Regenschirm benötigen; der Assistent bestimmt anhand örtlicher Wetterdaten, ob es regnen wird oder nicht.

Siri greift darüber hinaus auf Wolfram Alpha zurück, um Anwendern den Zugriff auf eine Vielzahl von Informationen zu ermöglichen, zum Beispiel wie viele Kalorien ein Bagel hat; das Tool erkennt Beziehungen zwischen den einzelnen Kontakten in der Kontaktliste des Handys; Siri plant Meetings und macht dabei Gebrauch von der Kalendar-App des iPhones. Wenn ein Anwender Siri nutzt, um ein Meeting zu organisieren, kann Siri dem Anwender mitteilen, ob die gewünschte Uhrzeit schon verplant ist.

Die Webseite Unofficial Apple Weblog hat eine schöne lange Liste von Dingen, für die man Siri nutzen kann. Siri hat ein breites Einsatzspektrum, das Erstaunen verursacht. Google Voice Actions in seiner derzeitigen Form sieht im Vergleich dazu ziemlich blass aus.

Google ist so besorgt über das Potenzial von Siri, dass es einen der wichtigsten Softwareentwickler im Bereich Spracherkennung, Dave Burke, von Großbritannien in die Google-Firmenzentrale nach Mountain View in Kalifornien geholt hat, behauptet zumindest die britische Tageszeitung The Guardian. Burke hat unter anderem an Googles App für die mobile Suche per Spracheingabe gearbeitet.

Mit Burke und Mike Cohen, der bei Google die Abteilung für Spracherkennungstechnologie leitet und Gründer des Unternehmens Nuance Communications (Nuance verknüpfte Spracherkennung mit der T9-Texteingabe) war, hat Google genug Entwickler-Power, um den Fehdehandschuh aufzuheben, den Apple mit Siri hingeworfen hat.

Im Kern geht es bei dieser Auseinandersetzung darum, Spracherkennung in einen Kontextrahmen einzubinden, um somit intelligentere Informationstransaktionen möglich zu machen.

Weil Siri vergleichbare Tools angeblich weit hinter sich lässt und weil Apple Siri unter seine Fittiche genommen hat, wird allgemein angenommen, dass damit nun künstliche Intelligenz auch in die Mainstream-Computerlandschaft Einzug halten wird.

Schneller Erfolg fraglich

Der erste Schritt ist getan, und das ist von eminenter Bedeutung. Allerdings gibt es keine Garantie, dass Endverbraucher auch bereit sind, diesen Weg bis zum Ende zu gehen. Das ist nicht wie im Film »Feld der Träume«, das Motto »Wenn Du es baust, werden sie kommen« trifft hier nicht zu. Man muss dazu nur einmal einen Blick werfen auf die Zahl der mobilen Zahlungsvorgänge, die auf Near Field Communications (NFC) beruhen. Diese Akzeptanzrate schlägt sich in der vorsichtig optimistischen Haltung der Analysten nieder.

Frank Gillet, Analyst bei Forrester Research, hält Siri für einen vielversprechenden Ansatz: »Siri stellt den Beginn eines neuen Benutzererlebnisses dar, bei dem der Kontext im Mittelpunkt steht, was letzten Endes zu einem persönlicheren, intimeren Erlebnis für die Nutzer von Apples mobilen Geräten und den Mac-Produkten führen wird.«

Gillets Kollege, der Forrester-Analyst Charles Golvin, drückt sich in seinem Kommentar etwas pessimistischer aus: »Der neue Siri Assistant von Apple, den es nur auf dem neuen iPhone 4S gibt, ist ein beeindruckender Vorbote, der zeigt, wie wir mobile Endgeräte in der Zukunft nutzen werden – nicht nur, was die Mächtigkeit der Spracheingabe betrifft, sondern auch und noch wichtiger, was die Fähigkeit betrifft, den Kontext eines Satzes oder eines Befehl zu verstehen. Wir bei Forrester glauben jedoch, dass es wesentlich länger dauern wird, bis dieses neue Interface bei Endverbraucher Akzeptanz finden wird, als dies damals bei Apples revolutionärem Touchscreen des ersten iPhones der Fall war.«

Wenn jeder, der ein iPhone 4S kauft, von Siris vollem Funktionsumfang Gebrauch machen würde, ergäben die Spracheingaben Zuhause, in den Straßen und in Büros ein wahres Stimmenchaos.

Siri ist kein vorprogrammierter Hit; es wird lange dauern, bis sich Anwender an diese Art der Eingabe gewöhnt haben, da Handynutzer nach wie vor mehr an ihrem Gerät herumtippen, als dass sie damit sprechen, wenn man von herkömmlichen Telefongesprächen einmal absieht.

Lesen Sie auch :