Lehren aus dem DeepSeek-Hype

„USA innovates, China replicates and EU regulates“

Am 27. Januar löste das Sprachmodell des chinesischen KI-Startups Deepseek ein veritables Börsenchaos aus. Im Zuge der Schockwelle büßte etwa Nvidia, der wertvollste Chipkonzern der Welt, innerhalb eines Tages unvorstellbare 600 Milliarden Dollar an Börsenwert ein. Auch Tesla, Google, Amazon und Microsoft verzeichneten deutliche Kurseinbrüche. Weltweit sahen Investoren und Brancheninsider plötzlich Ihre Einschätzungen und Prognosen zur Zukunft der Künstlichen Intelligenz (KI) in Frage gestellt.

Schlagzeilen wie „DeepSeek mischt das Silicon Valley auf“ machten die Runde. Fachleute, Medien und Politiker rund um den Globus diskutierten die Frage, ob China die USA in Sachen KI eingeholt habe, ob es die neue chinesische KI mit den US-amerikanischen Platzhirschen aufnehmen könne und ob die Karten in diesem Spiel nun neu gemischt würden – Darüber hinaus war die Rede von einer neuen Stufe im Wettstreit der Supermächte.

Auslöser des Hypes war bzw. ist zum Teil noch ein chinesisches KI-Modell namens „DeepSeek“, das, frisch auf den Markt gebracht, nach Ansicht von Fachleuten nicht nur konkurrenzfähig mit den amerikanischen Marktführern sein soll, sondern auch deutlich kostengünstiger als die Produkte aus dem Silicon Valley. Konkret berichten Infodienste wie web.de, dass für die Entwicklung des Large Language Models (LLM) DeepSeek R1 nur rund 5,6 Millionen Dollar nötig gewesen seien. Zum Vergleich: Für OpenAIs GPT-4 sollen mehr als 100 Millionen Dollar angefallen sein. Somit punktet Deepseek ganz klar bei der Effizienz. Und Brancheninsider sehen das bisherige Verständnis von Kostenstrukturen in der KI-Entwicklung auf den Kopf gestellt, wie web.de konstatiert.

Demnach nutzte Deepseek neue technische Ansätze, um den Ressourcenverbrauch drastisch zu reduzieren: Statt bei Null anzufangen, bediente sich DeepSeek bestehender Open-Source-Modelle wie Metas Llama als Basis und optimierte den Trainingsprozess mit synthetischen Daten. Dabei kompensierte das chinesische Unternehmen auch das Handicap deutlich leistungsschwächerer Prozessoren als in den USA, weil der Chiphersteller Nvidia aufgrund von US-Sanktionen die besten Chipsätze nicht nach China liefern darf.

„Keine Rocket Science“

„DeepSeek nutzt ein altbekanntes Verfahren namens Mixture of Experts, das es seit den frühen 90er Jahren gibt“, erläutert der deutsche KI-Experte Prof. Dr. Marco Barenkamp. Es handle sich dabei eigentlich nur um die pfiffige Anwendung bekannter Konzepte, ordnet der Gründer der auf KI-Entwicklungen spezialisierten Osnabrücker LMIS AG ein. „Selbst OpenAIs GPT4 Modell wurde damals nachgesagt, dass es diesen Ansatz nutzt“, ruft er in Erinnerung. „Zudem wurde DeepSeek bereits im November des vergangenen Jahres vorgestellt und stand schon länger zur Verfügung. Aus fachlicher Sicht ist es somit nun wirklich keine Rocket Science“, macht Prof. Barenkamp deutlich.

Viel spannender findet er die jüngsten Reaktionen darauf. Offenbar könne der richtige Tweet zur richtigen Zeit vom richtigen Autor große Verunsicherung hervorrufen, konstatiert er. „Ein wenig musste ich dabei an den DeepFake-Vorfall vom Pentagon vor einiger Zeit denken“, erklärt der Experte. (Damals löste ein vermutlich von einer KI manipuliertes Foto, das in den sozialen Medien kursierte und angeblich eine Explosion am Pentagon in Washington zeigen sollte, ebenfalls einen Kurseinbruch an der Börse aus, d. Red.). Das Resultat war ein kurzzeitiger Drop des S&P Index. „Kann man dies antizipieren, so ist mit entsprechenden Short-Positionen natürlich viel Geld zu verdienen“, weist Prof. Barenkamp auf eine nicht zu vernachlässigende mögliche Begleiterscheinung derartiger Aktionen hin. „Insofern, ohne jemandem etwas zu unterstellen, lässt sich die Überlegung treffen, dass man durchaus erwarten durfte, dass der Markt erstmal sehr volatil auf die Nachricht reagieren würde“, kommentiert der Wirtschaftsinformatiker die „DeepSeek-Schockwelle“. „Einen Tag später, als der Halbleiteranbieter ASML seine neuen Zahlen meldete, war es dann auch schon nicht mehr schlimm. Wer das vorhersagen konnte, konnte einen Haufen Geld verdienen“, sagt Prof. Barenkamp.

Hype? Unangemessen

Insofern ist aus seiner Sicht der Hype um DeepSeek nicht in diesem Maße angemessen und die Panik, die sich etablierte, erst recht nicht. „Es ist lediglich ein Schritt in eine Richtung, der zeigt, dass man die großen KI-Modelle mittlerweile sehr gut in kleinere Modelle destillieren kann“, stellt Prof. Barenkamp fest. Allerdings dürfe an dieser Stelle auch nicht unterschlagen werden, dass es dafür auch erstmal der großen Modelle bedurft habe, betont er.

Nach seiner Einschätzung wird DeepSeek der KI insgesamt helfen, sich weiter als Werkzeug zu etablieren. Insofern betrachtet er in DeepSeek auch mehr als Innovation denn als das Sicherheitsrisiko, zu dem das chinesische KI-Modell von einigen Kommentatoren geredet wurde.

Dazu trägt sicher nicht unwesentlich bei, dass der KI-Chatbot DeepSeek bei bestimmten Themen, welche die chinesische Führung als politisch heikel einstuft,plötzlich erstaunlich „einsilbig“ wird. Hierzu hat etwa die Deutsche Welle (DW) eigene Tests durchgeführt und berichtet, dass DeepSeek zum Beispiel die Frage nach Taiwan mit dem Hinweis beantwortet, der unabhängige Inselstaat sei immer ein untrennbarer Teil Chinas gewesen. Zusätzlich erläutert der Chatbot das „Ein-China-Prinzip“, die offizielle Position der Kommunistischen Partei Chinas, wonach es nur einen souveränen Staat namens China gibt.

„Lassen Sie uns über etwas anderes reden“

Oder angesprochen auf das Thema des „Massakers von Tiananmen“, bei dem im Juni 1989 Panzer und Soldaten der chinesische Volksbefreiungsarmee wochenlange friedliche Proteste auf dem Platz des Himmlischen Friedens (Tiananmen) in Peking blutig niederschlugen, unter Inkaufnahme tausender Toter, fällt Deepseek laut DW nur ein: „Lassen Sie uns über etwas anderes reden.“ Dazu merkt der deutsche Auslandssender an, dass dies bis heute eines der politisch heikelsten Themen in China sei und jede Erwähnung des Massakers in der Öffentlichkeit zensiert werde.

Vor diesem Hintergrund warnen viele Beobachter vor DeepSeek als einem möglichen Manipulations-Instrument. Dazu passen Erfahrungen der DW-Tester. Denn danach fügt die chinesische DeepSeek-Version selbst bei nicht-politischen Fragen immer noch ideologische Botschaften in die Antworten mit ein. Die englische Version soll im Vergleich ausgewogener sein, heißt es. Jedoch soll sie sich schnell selbst zensieren. Deshalb rät die Deutsche Welle: Wenn Sie DeepSeek auf Englisch verwenden, sollten Sie Ihre Antworten schnell speichern, da sie genauso schnell verschwinden können.

Was leitet sich nun für den AI Act, die Regulierungsinitiative der EU, aus diesen jüngsten Ereignissen ab? Die Antwort fasst Prof. Barenkamp in der simplen These zusammen: USA innovates, China replicates and EU regulates. Nachdem Trump faktisch eine KI-Regulierung in den USA aussetze und China offenkundig auch in der Lage sei, gute KI-Lösungen anzubieten, müsse sich Europa fragen, wie man mit dieser Situation sinnvoll umgeht, erklärt der KI-Experte. „Der AI Act ist beschlossen und in Kraft getreten, so dass die Weichen, die sich jetzt noch stellen lassen, nur noch die der anstehenden Operationalisierung sind“, resümiert der Unternehmer und KI-Berater. Dabei geht es aus seiner Sicht insbesondere um die Fragen, wie Sachverhalte konkret beurteilt werden, wie die Regeln der KI-Verordnung ausgelegt werden und wie unbürokratisch verbindliche, rechtssichere Aussagen zu KI-Systemen für Inverkehrbringer getroffen werden können. „Das ist der Hebel, an dem wir selbst ansetzen können, und mein eindringlicher Rat, auch als stellvertretender Vorsitzender der Bundesfachkommission für Künstliche Intelligenz und Wertschöpfung 4.0 des Wirtschaftsrats Deutschland, ist, dass wir das auch nachdrücklich machen sollten“, mahnt Prof. Barenkamp.

Illustration: Melinda Nagy / shutterstock.com

Cookie	Dauer	Beschreibung
cookielawinfo-checkbox-advertisement	1 year	Set by the GDPR Cookie Consent plugin, this cookie is used to record the user consent for the cookies in the "Advertisement" category .
cookielawinfo-checkbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checkbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
CookieLawInfoConsent	1 year	CookieYes sets this cookie to record the default button state of the corresponding category and the status of CCPA. It works only in coordination with the primary cookie.
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.

Cookie	Dauer	Beschreibung
VISITOR_INFO1_LIVE	5 months 27 days	YouTube sets this cookie to measure bandwidth, determining whether the user gets the new or old player interface.
YSC	session	Youtube sets this cookie to track the views of embedded videos on Youtube pages.
yt-remote-connected-devices	never	YouTube sets this cookie to store the user's video preferences using embedded YouTube videos.
yt-remote-device-id	never	YouTube sets this cookie to store the user's video preferences using embedded YouTube videos.
yt.innertube::nextId	never	YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen.
yt.innertube::requests	never	YouTube sets this cookie to register a unique ID to store data on what videos from YouTube the user has seen.

Cookie	Dauer	Beschreibung
_pk_id.1.4d2c	1 year 27 days	No description
_pk_ses.1.4d2c	30 minutes	No description

„USA innovates, China replicates and EU regulates“

„Keine Rocket Science“

Hype? Unangemessen

„Lassen Sie uns über etwas anderes reden“

1 Gedanke zu „Lehren aus dem DeepSeek-Hype“

Schreibe einen Kommentar Antworten abbrechen