InnovationsweltreiseChinas Weg zur Nummer eins für künstliche Intelligenz
Swisscom
12.10.2018
Spracherkennung in Kombination mit KI verändert unseren Umgang mit Maschinen. Anteil an dieser Entwicklung hat beispielsweise Huang Wei, CEO und einer der vier Gründer von Unisound. Das chinesische Unternehmen zählt zu den führenden Entwicklern von Spracherkennungssystemen in den Bereichen Smart Home, Automobil und Medizin.
Beim Thema künstliche Intelligenz geht der Blick zunehmend nach Osten. China ist fest entschlossen, die Führung in diesem Sektor zu übernehmen. Mitte 2017 hat die chinesische Regierung dazu einen Plan veröffentlicht – den «Next Generation Artificial Intelligence Development Plan». Demnach soll im Jahr 2020 die heimische Wertschöpfung bei rund 23 Milliarden Dollar liegen und im Jahr 2030 rund 150 Milliarden Dollar generieren. Um diese ambitionierten Ziele zu erreichen, entwickeln zahlreiche Unternehmen im Reich der Mitte in rasantem Tempo technologische Lösungen, die unter anderem unsere Kommunikation mit intelligenten Maschinen vereinfachen sollen.
Eines der führenden KI-Unternehmen in China ist Unisound. 2013 in Peking gegründet, entwickelt das nichtstaatliche Start-up Hardware wie Prozessoren und Sensoren, die zusammen mit einer cloud-basierten Plattform Sprachinteraktionen zwischen Mensch und Maschine ermöglichen. Beispielsweise rund 70 Prozent aller Sprachsysteme, die nach dem Kauf ins Auto eingebaut werden, stammen von Unisound. In über 100 Grosskrankenhäusern in China geben Ärzte ihre Berichte und Befunde nicht mehr über die Tastatur ein, sondern über ein cloud-basiertes medizinisches Spracherkennungssystem.
Chinesische Pioniere
Unisound-CEO Huang Wei und seine drei Partner setzten bereits auf die Verknüpfung von Cloud und Spracherkennung, als Cloud Computing, Cloud Storage, Artificial Intelligence, Machine Learning und Data Mining in China noch kaum eine Rolle spielten. Schon während des Studiums befasste sich Huang mit Bilderkennung, seine Doktorarbeit schrieb er über Spracherkennung und damit sollte sich auch sein Start-up beschäftigen. «Unser chinesischer Unternehmensname Yun Zhi Sheng bedeutet so viel wie ‹die Wolke kennt die Stimme›», erklärt Huang.
«Es war von Anfang an unser Ziel, Rechenleistung und Smart Services in der Cloud zu nutzen, um die menschliche Stimme zu erkennen und zu verarbeiten. Unser Unternehmensname entspricht somit auch unserer Mission und Vision.» Huang und seine Mitstreiter waren sich damals schon sicher, dass in Zukunft Daten in der Cloud gespeichert würden. Und sie wussten um die elementare Bedeutung der Sprache in der Kommunikation. Für Huang ist sie die natürlichste Art, um Gedanken mitzuteilen. Unisound hat daher begonnen, den Maschinen die Sprache als Interaktionsform beizubringen.
Smart ja – aber nur Homes, nicht Phones
Und sie sind zunächst einmal auf Unverständnis gestossen. Dass Unisound keine Lösungen für Smartphones entwickelte, hat viele irritiert. Aber für Huang sind Smartphones nicht der wichtigste Markt für Spracherkennung: «Smartphones hält man in der Hand, man bedient sie über Touchscreens, Spracherkennung spielt hier nicht die Hauptrolle.»
Vielversprechender erschienen Huang und seinen Kollegen Lösungen für Medizin und Smart Homes. Heute ist Unisound Marktführer im medizinischen Umfeld und kooperiert mit Smart-Home-Giganten wie Haier oder Midea, die ihre Kühlschränke oder Klimaanlagen mit Unisound smarter machen. Allerdings sind die Kosten für die smarten Sprachchips noch so hoch, dass beispielsweise nur High-end-Klimaanlagen ab rund 2000 Franken damit ausgestattet werden. «Wenn es uns gelingt, die Kosten auf ein Viertel zu reduzieren, wird auch hier die Spracherkennung in den Massenmarkt kommen», ist Huang überzeugt.
Das Interesse daran besteht: Wie die «Global Consumer Insights Survey 2018» von PwC zeigt, sind Chinesen besonders offen gegenüber Geräten mit künstlicher Intelligenz. 21 Prozent der Befragten besitzen bereits ein Gerät mit künstlicher Intelligenz, 52 Prozent planen, eines zu kaufen. Dass China damit im internationalen Vergleich an der Spitze liegt, hat mehrere Gründe. Zum einen interessieren sich chinesische Verbraucher besonders für Sprachinteraktionen, zum anderen haben sie weniger Bedenken, wenn es um Privatsphäre und Datensicherheit geht. Damit unterscheiden sie sich deutlich von den Schweizern, die sehr auf Datensicherheit bedacht sind.
Der digitale Dolmetscher
Wie weit entwickelt Anwendungen für Spracherkennung bereits sind, konnte man im Juli 2018 bei der «TechCrunch» in Hangzhou erleben, einer internationalen Konferenz zum Thema Innovation. Paneldiskussionen wurden von Simultandolmetschern vom Chinesischen ins Englische übersetzt. So weit, so traditionell. Parallel kam aber auch eine Übersetzungs-Software des Suchmaschinen-Anbieters Sogou zum Einsatz. Die Übersetzung wurde in Echtzeit auf einer Leinwand angezeigt. Und damit konnten die Teilnehmer vergleichen: Wer war besser, Mensch oder Maschine?
Das Ergebnis: «Die Übersetzung der Maschine war vollständiger, der Mensch hingegen unterschlug manche Inhalte. Allerdings war die menschliche Übersetzung auch genauer und machte durchweg Sinn», so Stefan Justl von der auf China spezialisierten Kommunikationsagentur Storymaker, der sich vor Ort ein Bild machte. Der Vergleich hat jedoch gezeigt, wie gut die Spracherkennungs-Software bereits funktioniert.
Rein technisch sieht Unisound-CEO Huang keine Probleme, maschinelle Übersetzungen auf das Niveau von erfahrenen Dolmetschern zu bringen. «Es ist lediglich eine Frage der Investition. Viele Begriffe, Termini und Abkürzungen müssen dem System hinzugefügt werden, damit es sehr gut funktioniert.»
Die Vorteile sieht Huang klar auf Seiten der Maschine: Kein Mensch kann so viele Sprachen übersetzen wie eine intelligente Maschine. Es ist nur eine Frage der Zeit, bis wir mit einer kleinen Übersetzungsmaschine in die Ferien fliegen und auf Chinesisch, Koreanisch oder Kroatisch nach dem Weg fragen oder Essen bestellen. In Japan wird ein solches Gerät bereits beworben. Der sogenannte Pocketalk kommt im Oktober auf den Markt. 50 Sprachen soll die Maschine beherrschen, Schweizerdeutsch ist nicht dabei.
Spracherkennung mit Schweizer Dialekten
Spracherkennungssysteme haben hohe Entwicklungskosten und werden vornehmlich für die meistgesprochenen Sprachen konzipiert. Damit ein System lernen kann, braucht es zum gesprochenen Wort entsprechend ein schriftliches Transkript. Im Chinesischen und Englischen sind solche Daten zur Genüge vorhanden. Im Schweizerdeutschen, gesprochen von nur 4,9 Millionen Menschen, hingegen nicht. Auch gibt es im Schweizerdeutsch keine einheitliche Schreibweise und Betonung.
Swisscom arbeitet daher mit einem sogenannten «Crowdsourcing»-Ansatz an der Spracherkennung von verschiedenen Dialekten, bei dem Freiwillige Textpassagen in verschiedenen Dialekten sprechen, um damit das System zu speisen. Dies bietet dann die Basis, um die Dialekte von einer mathematisch-linguistischen Perspektive her zu analysieren und um herauszufinden, wie man am besten mit ihrer Besonderheit umgeht. Das Ziel ist die Entwicklung eines Systems, das sämtliche Dialekte versteht. Die Swisscom UHD TV-Box versteht übrigens auch Walliserdeutsch.
Sprachbefehle ganz einfach: So sprechen Sie mit Swisscom TV
Sprachbefehle ganz einfach: So sprechen Sie mit Swisscom TV
Swisscom hat am 15. November neue Funktionen für Swisscom TV enthüllt. Ausserdem wurde an der Pressekonferenz die WLAN Box präsentiert: Diese sorgt für ein besseres WLAN-Netz zu Hause.
Bild: Swisscom
Die WLAN-Box verbindet sich mit einer bereits vorhandenen Internet-Box 2 und bildet mit dieser ein gemeinsames, optimiertes Netzwerk.
Bild: Swisscom
Dadurch steigt sowohl die Geschwindigkeit Ihres Heimnetzwerkes als auch dessen Reichweite. Ihre Geräte wie Handy, Tablet oder Laptop verbinden sich automatisch mit dem besten Signal.
Bild: Swisscom
Entertainment OS3 heisst die neue Software für Swisscom TV. Auf dem Homescreen findet man neu Themenwelten. Ob Komödien, Krimi und vieles mehr: In jeder Welt stellt Swisscom TV für Sie das Beste zusammen.
Bild: Bluewin
Lachen ist gesund: Wäre es mit der Themenwelt «Komödien»? Übrigens, das Update auf die neue Swisscom-TV-Software ist kostenlos und wird ab 15. November automatisch an die TV-Boxen ausgespielt.
Bild: Bluewin
Das OS3-Update wird bei den Kunden kontinuierlich auf die Swisscom TV 2.0 Boxen geladen.
Bild: Swisscom
Die TV-Box gehorcht Ihnen aufs Wort - und das auf Mundart: Die Entwickler haben für OS3 weiter an der Sprachfunktion gefeilt.
Bild: Swisscom
Dazu hält man die Mikrofontaste auf der Fernbedienung gedrückt und sagt, was man wünscht.
Bild: Bluewin
Sie können neu nicht nur suchen, sondern auf Befehle erteilen.
Bild: Bluewin
Beispiel für die Suche nach einer Sendung.
Bild: Bluewin
Oder wir wechseln den Sender. Probieren Sie es aus. Auf www.swisscom.ch/smartremote erfahren Sie, was die TV-Box alles versteht.
Bild: Bluewin
Ebenfalls neu: WLAN-Box. Die Swisscom-Entwicklung vereint drei Geräte in einem: WLAN Repeater, WLAN Access Point und TV-Verbindungskit. Sie verbessert den WLAN-Empfang selbst in grossen Wohnungen und ermöglicht den drahtlosen Anschluss von Swisscom TV.
Bild: Swisscom
Mit «Smart ICT» lanciert Swisscom ausserdem ein Paket für KMU, bei dem Aufbau und Betrieb der kompletten Telefonie und IT inbegriffen sind – abgerechnet zum Monatspreis.
Bild: Swisscom
Bilder von der Pressekonferenz: Swisscom hat am Mittwoch drei neue Produkte lanciert - Neue Funktionen für Swisscom TV, eine WLAN Box und den «Internet Guard»-Dienst ...
Bild: Bluewin
Dazu lud die Swisscom zu einer Pressekonferenz in Zürich. Die Neuheiten wurden dabei gleich live vorgestellt:
Bild: Bluewin
Dirk Wierzbitzki, Leiter Products & Marketing bei Swisscom, zeigt die neue WLAN-Box ...
Bild: Bluewin
Die das ganze Heim so simpel wie noch nie mit dem Internet verbinden soll. Egal, welches Gerät: Über die WLAN-Box geht es sicher ins Web.
Bild: Bluewin
Sicherer deshalb, weil Swisscom mit der Lancierung der WLAN Box auch gleich einen neuen Service am Start hat: «Internet Guard» schützt die angeschlossenen Geräte aktiv vor Cyber-Angriffen.
Bild: Bluewin
Und für Swisscom TV-Kunden wird es mit dem neuen Software Update «Entertainment OS 3» noch einfacher, ihre Lieblings-Sendungen zu finden oder nach bestimmten Stars zu suchen:
Bild: Bluewin
Denn nun kann man per Sprachsuche nach TV-Inhalten suchen. Statt lange in Menüs herumzudrücken, können Kunden jetzt einfach in die Fernbedienung sprechen, die TV-Box liefert dann eine Auswahl an Resultaten. Sender, Stars, Apps, eigene Aufnahmen: Alles lässt sich jetzt per Sprachbefehl aufrufen.
Bild: Bild: Bluewin
Allgemein bringt das kostenlose Software-Update viele Neuerungen: Es wird nun viel einfacher, Inhalte zu finden. Die «Themenwelten» gliedern Filme und Sendungen nach Interessengebieten.
So bastelst du mit KI deine ganz persönliche Weihnachtskarte
Dank KI kann inzwischen jeder noch viel kreativer sein, wenn es um Grusskarten geht. Wir zeigen dir am Beispiel einer persönlichen Weihnachtskarte wie du dabei vorgehst.
13.12.2024
Online-Elternabend: «Sharenting – Umgang mit Kinderbildern im Netz»
«Sharenting» steht für das Phänomen, wenn Eltern, Erziehungsberechtigte oder auch Grosseltern Fotos ihrer Kinder online stellen und teilen. Unter der Leitung von Claudia Lässer diskutierten Expert*innen und Eltern über das Thema.
20.11.2024
Elternabend bei blue Zoom: Die Folgen von Sharenting für die Kinder
Das Teilen von Kinderfotos im Internet birgt Gefahren. Am Online-Elternabend auf blue Zoom und im blue Zoom Livestream am 19. November, 20 Uhr, sprechen Medienexperten und Eltern über Datenmissbrauch, Mobbing und andere Risiken.
08.11.2024
So bastelst du mit KI deine ganz persönliche Weihnachtskarte
Online-Elternabend: «Sharenting – Umgang mit Kinderbildern im Netz»
Elternabend bei blue Zoom: Die Folgen von Sharenting für die Kinder