Ingenieur Christian Horn erzählt, wie bei Mercedes-Benz die Sprachsteuerung weiterentwickelt wird. Und er erklärt, wie mit künstlicher Intelligenz (KI) aus einem Befehlsempfänger ein Assistent mit eigenem Charakter wird. 

 

1. Oktober 2025

 

Herr Horn, wie sieht Sprachsteuerung im Auto heute aus und wie wird sie in Zukunft aussehen?

Die bisherigen Generationen unseres Systems legten den Fokus auf einen natürlichen Sprachdialog, bei dem man nicht mehr im Befehlston sprechen muss. Der nächste Entwicklungsschritt ist ein digitaler Begleiter mit vier Haupteigenschaften: Er soll natürlich, persönlich, empathisch und vorausschauend sein. Der Sprachassistent im Auto kann in Zukunft auch Schlussfolgerungen ziehen und dazulernen.

 

Ich sage also: «Es schneit!», und das System schaltet die Heizung höher und setzt den Scheibenwischer in Gang?

Mehr noch: Die Idee ist die, dass das System in einem situativen Kontext proaktiv Vorschläge macht. 

 

Wie weit kann das gehen? 

Es soll so weit gehen, dass der Mercedes-Benz von morgen seine Fahrerin und seinen Fahrer so gut kennt wie nie zuvor. Der virtuelle Assistent im Auto wird das Leben unserer Kundinnen und Kunden verbessern und bereichern – in ihrem Fahrzeug und auch in anderen Bereichen. Ein konkretes Beispiel: Wenn Sie sich zu einem im Kalender eingetragenen Termin verspäten, kann das System anbieten, sich für Sie direkt aus dem Fahrzeug heraus einzuwählen.

 

Kann ich irgendwann einmal sagen: «Brems!», und dann bremst das Auto?

Nein. Sicherheitsrelevante Funktionen wie Bremsen oder Beschleunigen und entsprechende Systeme unterstützt unsere Sprachsteuerung bewusst nicht. Es geht primär ums Infotainment und darum, wie ich mit verschiedenen Elementen des Fahrzeugs kommuniziere.

 

Nach welchen Kriterien entwickeln Sie elektronische Features für Mercedes-Benz? 

Erst einmal gibt es die Bestands-Features, die wir laufend weiterentwickeln. Unsere Funktion «Just Talk» etwa erlaubt es heute, das Auto einfach anzusprechen, ohne vorher wie früher jedes Mal «Hey Mercedes» zu sagen. Diese Weiterentwicklung bringt den Kundinnen und Kunden eindeutig mehr Komfort.

 

Und wie entstehen ganz neue Features?

Dafür haben wir einen bewährten sogenannten Ideation-Prozess. Im Zentrum steht die Frage: Was bringt den Kundinnen und Kunden einen wirklichen Nutzen? Dann orientieren wir uns auch daran, welche bestehenden Funktionen gut genutzt werden. Und wir führen Tests mit Betaversionen durch, bevor ein Feature auf den Markt kommt.


Das Auto scheint schon fast zum Gesprächspartner zu werden.

Ja, es geht ein bisschen in diese Richtung. Das System entfernt sich immer weiter vom klassischen Befehlsempfänger, den wir 1996 als einer der ersten Hersteller überhaupt eingeführt haben. Es entwickelt sich in Richtung Begleiter oder gar Freund im Auto mit gewissen Charaktereigenschaften. Es kann einen beim Einsteigen persönlich begrüssen und auch darauf hinweisen, wenn man beim Aussteigen sein Handy im Auto liegen lässt. Diese Funktion finde ich persönlich sehr praktisch.


Dann könnte ich das Auto irgendwann auch nach den Sehenswürdigkeiten in der Region fragen?

Das können Sie heute schon. Wenn ich frage: «Was ist das für ein Gebäude rechts?», sucht das System mittels GPS-Koordinaten entsprechende Wikipedia-Einträge. In einigen Ländern erklärt Ihnen unser Tourguide laufend die Sehenswürdigkeiten der Umgebung.

Wie hebt sich Mercedes-Benz von den Mitbewerbern ab?

Unser Anspruch ist es, ein einzigartiges Erlebnis und ein unverkennbares Design in jedem Mercedes-Benz zu bieten. Unsere Kundinnen und Kunden sollen einen «Wow»-Effekt erleben, beim digitalen Erlebnis in unseren Fahrzeugen mehr bekommen, als sie erwarten. So definieren wir «digitalen Luxus».

 

Wie bringt man die Leute dazu, überhaupt Sprachassistenten zu nutzen?

Durchs Erleben! Wer einmal mit Sprachassistent fährt und sieht, wie gut er funktioniert, will kaum mehr zurück. Wir entwickeln unser System auf breite Verständlichkeit hin. Es soll sinnvolle und hilfreiche Antworten geben und die Bedienung im Vergleich zum Touchscreen massiv vereinfachen. Denn über den Bildschirm kann ich nur binär Befehle eingeben. Sprache dagegen ist viel flexibler. Mit unserem «und»-Feature sage ich dem Auto beispielsweise: «Mach die Sitzheizung an und bring mich nach Hause» oder «Fahre mich nach Berlin und vermeide die Autobahn». Das Auto führt sofort beides aus. Bei der haptischen Steuerung über Touchscreen würde das viele einzelne Überlegungsschritte und Klicks durchs Menü benötigen.

 

Und wenn mich «Hey Mercedes» mal nicht verstehen will?

Dann sollten Sie nicht beim ersten Mal aufgeben. Wir haben zudem eine Feedbackfunktion mittels des Befehls «Hey Mercedes, ich möchte dir Feedback geben» implementiert. Die entsprechende Mitteilung kommt bei uns als Text an. Damit können Kundinnen und Kunden direkt Einfluss auf Optimierungen und weitere Entwicklungen nehmen.

 

Beim Infotainmentsystem haben Sie Konkurrenz, beispielsweise von Apple CarPlay. Wie vermeiden Sie, dass die Leute nicht einfach das nutzen, was sie kennen?

Natürlich unterstützen wir Apple CarPlay. Aber da geht es ja nur um Infotainment und Navigation, nicht um die Fahrzeugsysteme wie Klimaanlage, Sitzheizung und vieles mehr. Wer zum Beispiel einmal seine «vollelektrische» Urlaubsreise inklusive intelligenter Ladestoppplanung mit unserer Sprachsteuerung geplant hat, merkt schnell, wie viel umfangreicher die Möglichkeiten unseres Systems gegenüber einer simplen Handyintegration sind.

 

Erkennt das System auch meine Stimme und stellt dann automatisch den Sitz und die Spiegel richtig ein? 

Wir hatten einmal eine Authentifizierung über Stimmerkennung. Die hat auch sehr gut funktioniert, wurde allerdings nur wenig genutzt, wie uns die Nutzungszahlen zeigten. Heute erkennt mich mein Auto über die Kamera im Cockpit, die Eingabe eines Codes oder mit Fingerprint. Und ja: Sitzposition und andere persönliche Einstellungen werden dann automatisch abgerufen. 

 

Stellt sich die Maschine im Auto auf den Menschen ein? Ist sie lernfähig?

Ja, denn wir arbeiten mit einer trainierbaren KI. Wir lernen über die Nutzung von MBUX und die Routinen der Fahrerinnen und Fahrer deren Verhalten kennen. Diese Erkenntnisse nutzen wir, um mittels KI die Sprachsteuerung zu trainieren und weiterzuentwickeln – etwa, um eine emotionalere Stimme zu entwickeln, die unterschiedliche Sprechweisen haben kann und empathischer tönt. Damit fällt es der Userin oder dem User leichter, mit dem Auto zu sprechen. 

 

Wie gehen Sie mit Akzenten und unterschiedlichen Sprachen um?

Das ist Teil der Trainingsmodelle. Grammatik, Satzbau und Wortwahl wird in Dialekten anders verwendet und wir legen Wert darauf, dass das verstanden wird. Wir unterstützen 27 Sprachen und die sind alle einzeln mit einer künstlichen Intelligenz trainiert. Wir entwickeln hier in Deutschland, in Sunnyvale in Kalifornien nahe dem Silicon Valley, in Japan und in Korea. In China haben wir ebenfalls ein grosses Entwicklungsteam. Es ist wichtig, dass wir vor Ort sind bei einem derart lokalen Thema wie Sprache.

Sprachbefehle

Testen Sie Ihren Assistenten

Der Sprachassistent von Mercedes-Benz hat so einiges drauf. Probieren Sie es in Ihrem Auto mit Stern mit diesen Befehlen aus:

 

• Erzähle mir einen Witz!

• Mir ist kalt!

• Aktiviere den Schleudersitz! (nur in Fahrzeugen mit Schiebedach)

• Wie klingt ein Einhorn?

• Wie wird morgen das Wetter in Genf?

• Starte Geoquiz!

Weitere Artikel

Das könnte Sie auch interessieren