Mega-Erfolg aus dem NichtsDieses chinesische KI-Modell lässt die US-Tech-Riesen zittern
Martin Abgottspon
27.1.2025
Deepseek setzt innerhalb von wenigen Stunden zu einem globalen Siegeszug an.
Reddit
Die Welt der künstlichen Intelligenz steht Kopf. Grund dafür ist das chinesische Sprachmodell Deepseek, das bei einem Bruchteil der Kosten selbst einige der grössten amerikanischen KI-Systeme übertrifft.
Martin Abgottspon
27.01.2025, 16:00
28.01.2025, 09:16
Martin Abgottspon
Keine Zeit? blue News fasst für dich zusammen
Das chinesische KI-Labor Deepseek hat mit begrenzten Ressourcen ein leistungsstarkes Modell entwickelt, das OpenAI, Google und Meta in Tests übertrifft.
Trotz US-Exportkontrollen hat China mit innovativen Ansätzen und kosteneffizienter Technologie aufgeholt.
Chinesische KI-Modelle unterliegen staatlicher Zensur und könnten die globale Informationsfreiheit gefährden.
Nur gerade zwei Monate und rund 5,6 Millionen Dollar steckte das ominöse chinesische Unternehmen Deepseek in die Entwicklungs eines KI-Modells in der Grössenordnung von ChatGPT, Gemini oder Perplexity. Zum Vergleich: OpenAI gibt jährlich etwa 5 Milliarden US-Dollar aus, während Googles Kapitalausgaben für 2024 auf über 50 Milliarden US-Dollar geschätzt werden.
Noch beeindruckender ist, dass Deepseeks Modell in Tests, darunter Mathematik- und Programmieraufgaben, sowie bei der Fehlererkennung in Codes, Spitzenwerte erzielte und damit selbst führende Modelle wie GPT-4, Metas Llama und Anthropic’s Claude übertraf. An diesem Montagnachmittag war das System allerdings für mehrere Stunden überlastet, was wahrscheinlich auch dem aktuellen Hype geschuldet ist.
Umgehung von US-Exportkontrollen
Dennoch ist die Leistung von Deepseek bemerkenswert. Umso mehr, weil das Unternehmen unter den strikten Exportkontrollen der USA arbeitet. Diese verbieten den Export der leistungsstarken Nvidia Chips nach China – Hardware, die allgemein als unverzichtbar für die Entwicklung wettbewerbsfähiger KI-Systeme gilt. Doch Deepseek bewies Kreativität: Es setzte auf weniger leistungsstarke Chips und entwickelte innovative Lösungen, um diese effizienter zu nutzen.
Ein Teil dieses Erfolgs liegt in der Nutzung eines sogenannten Distillationsprozesses, bei dem bestehende grosse Modelle genutzt werden, um kleinere Modelle gezielt zu trainieren. Diese Technik ermöglichte es Deepseek, mit begrenzten Ressourcen eine ähnliche Leistungsfähigkeit wie die der grossen westlichen KI-Modelle zu erreichen.
Goodbye ChatGPT
It’s only been 5 days since Deepseek R1 dropped, and the World is already blown away by its potential.
Doch trotz des bahnbrechenden Erfolgs bleibt Deepseek ein Mysterium. Das Labor wurde aus dem Hedgefonds High Flyer Quant gegründet, der rund 8 Milliarden US-Dollar verwaltet. Der Firmengründer Liang Wenfeng und sein Team treten kaum öffentlich auf. Die auf der Webseite des Unternehmens formulierte Mission – «Das Geheimnis der Allgemeinen Künstlichen Intelligenz (AGI) mit Neugier ergründen» – gibt wenig Einblick in die Arbeitsweise oder Datenquellen von Deepseek.
Nichtsdestotrotz hat der rasche Erfolg von Deepseek das globale Wettrennen um die Vorherrschaft im KI-Bereich neu entfacht. Noch Anfang 2024 erklärte der frühere Google-CEO Eric Schmidt, China sei zwei bis drei Jahre hinter den USA zurück. Nun gibt er zu, dass sich das Blatt in den letzten sechs Monaten dramatisch gewendet hat.
Die offene Architektur von Deepseek’s Modell hat Entwickler weltweit angelockt. Die Kosten sind ein entscheidender Faktor: Deepseek’s Modell bietet Inferenzkosten von nur 10 Cent pro Million Tokens – etwa ein Dreissigstel der Kosten vergleichbarer Modelle von OpenAI. Dies könnte den Einsatz von Open-Source-Modellen weltweit revolutionieren und die Vormachtstellung von geschlossenen Modellen untergraben.
Risiken der Dominanz Chinas
Doch der Erfolg Chinas birgt auch Risiken. Viele der in China entwickelten KI-Modelle unterliegen staatlichen Vorschriften und müssen «kernsozialistische Werte» verkörpern. Studien zeigen, dass Modelle von Tencent und Alibaba historische Ereignisse wie das Tian’anmen-Massaker zensieren und Kritik an der chinesischen Regierung unterdrücken. Sollten diese Modelle weltweit Verbreitung finden, könnte dies erhebliche Konsequenzen für die globale Informationsfreiheit haben.