Einen Tag nach dem beispiellosen Absturz des Kurses von Aktien des US-Tech-Konzerns Nvidia an der New Yorker Börse sitzt der Schock immer noch tief. Am Montag, 27.1., war dieser an nur einem Tag um 17 Prozent gesunken. Der Unternehmenswert fiel damit um 592,7 Milliarden US-Dollar auf 2,9 Billionen. Grund dafür ist das Auftauchen des chinesischen KI-Modells DeepSeek, das Mitte Januar sein Modell R1 auf den Markt gebracht hatte.

Obwohl Nvidia als sehr hoch bewertet galt, löste der historisch größte Tagesverlust eines Wall-Street-Unternehmens Schockwellen aus. US-Präsident Donald Trump sprach von einem „Weckruf“ für alle US-Unternehmen der Branche. In Miami sagte der Präsident vor republikanischen Kongressabgeordneten, US-Industrien müssten „im Wettbewerb hoch konzentriert sein, um zu gewinnen“.

DeepSeek will leistungsfähiger sein als OpenAI-Produkte

Das 2023 gegründete und in Hangzhou ansässige Unternehmen DeepSeek ist in seiner Medienpolitik sehr zurückhaltend. Gründer Liang Wenfeng gibt keine Interviews, das Start-up beantwortet keine Anfragen. Allerdings kommunizierte DeepSeek anlässlich der Vorstellung seines jüngsten Modells, dass dieses in seinen Fähigkeiten mühelos an jene US-amerikanischen Entwicklungen wie OpenAI o1 heranreiche.

Dies sei jedoch mit erheblich geringeren Trainingskosten verbunden gewesen. So habe man dafür lediglich 5,57 Millionen US-Dollar aufwenden müssen – während man auf den Hochleistungschip H800 von Nvidia zurückgreifen konnte. Bei diesem handelt es sich um eine exportkonforme Version des H100-Chips, der für den chinesischen Markt produziert wurde.

Zum Vergleich: OpenAI hat für das Training seines Modells GPT-4o eigenen Angaben zufolge 78 Millionen Dollar aufgewendet. Inwieweit die Darstellung von DeepSeek über dessen Trainingskosten glaubwürdig ist, ist fraglich. Von unabhängiger Seite gibt es bis dato keine Verifizierung. Es ist auch ungewiss, inwieweit alle relevanten Kosten wie jene für Forschung, Infrastruktur oder Personal abgebildet sind.

Zweifel an Angaben über kostengünstige Entwicklung

Gegenüber der chinesischsprachigen Epoch Times äußert die auf Halbleiter spezialisierte Analystin Stacy Rasgon von Bernstein Research, die Zahlen seien „irreführend“. Die 5,57 Millionen US-Dollar bezögen sich lediglich auf DeepSeek-V3. Dieses sei ein „hybrides Expertenmodell“.

Es sei zwar anzunehmen, dass dieses aufgrund von Optimierungen und cleveren Techniken eine ähnliche oder bessere Leistung wie andere große Basismodelle bieten könne. Dabei benötige das Modell – gemessen an diesen – nur einen Bruchteil der Rechenressourcen zum Training. Da nur ein Teil des Parametersatzes zu einem bestimmten Zeitpunkt aktiv sei, senke das die Schulungs- und Betriebskosten.

Lesen Sie auch Microsoft will bis Ende Juni 80 Milliarden Dollar in KI investieren

Allerdings mache DeepSeek speziell zu den Entwicklungskosten seines R1-Modells keine speziellen Angaben. Diese seien „vermutlich beträchtlich“, betont Rasgons. Auch Paul Triolo von der Unternehmensberatung DGA Group erklärte auf Substack:

„OpenAIs O1 ist sicherlich viel teurer zu trainieren als GPT-4, und ebenso ist (DeepSeek) R1 sicherlich teurer zu trainieren als V3.“

Experten vergleichen neues Modell mit Generikum in der Medizin

Ein Bericht von Archerman Capital, der der chinesischsprachigen Epoch Times vorliegt, vergleicht das Verhältnis zwischen DeepSeek und den US-Pionieren mit jenem zwischen Generika und Originalen in der Medizin:

„Die Forschung und Entwicklung innovativer Medikamente wird in zehn Jahren Milliarden von Dollar in Anspruch nehmen. Demgegenüber wird die Forschung und Entwicklung von Generika schneller und billiger sein.“

Für die Bezifferung der Kosteneffizienz gebe es jedoch keinen einheitlichen Maßstab. Es sei auf jeden Markt so, dass Nachzügler zum Teil auf die Vorleistungen anderer zurückgreifen könnten. Im Fall von Entwicklungen wie KI sind die Voraussetzungen für einen Patentschutz jedoch schwieriger zu erfüllen als in den meisten anderen Bereichen.

Lesen Sie auch Jetzt kann fast jeder mithilfe von KI Filme erstellen – OpenAI veröffentlicht Sora

DeepSeek erreicht mit seinem Modell R1 Experten zufolge Benchmarks in der Leistungsfähigkeit, die mit GPT-4 von OpenAI vergleichbar seien oder diese übertreffen. Dies treffe vor allem auf Bereiche wie Mathematik und Programmierung zu.

Aktualität und Spezialisierung sollen gängige Modelle übertreffen – Zweifel bleiben

Vorteile bietet das Modell Rezensionen zufolge auch bei der Verarbeitung aktueller Informationen, da eine regelmäßige Aktualisierung stattfindet. Dies würde auf eine ähnliche Aktualität wie bei der „Perplexity“-KI hindeuten. Diese gibt bei ihren Antworten jedoch standardmäßig Quellen an. Epoch Times kann zudem die Aktualitätsvorteile von DeepSeek nicht bestätigen. So ist die KI noch nicht darüber im Bilde, dass Donald Trump erneut zum US-Präsidenten gewählt worden ist.

Weitere Features, die KI von DeepSeek zugeschrieben werden, sind eine bessere Spezialisierung als bei anderen Chatbots. Während diese ihre beste Performance eher bei häufig gestellten Alltagsfragen bieten, ist DeepSeek bei präzisen Fachauskünften tendenziell besser aufgestellt.

Auch hier hat Epoch Times die Probe aufs Exempel gemacht und die KI nach seinem Wissensstand über die zu Könner gehörige anhaltische Ortschaft Bebitz befragt. Diese wird der Gemeinde Südliches Anhalt zugeordnet. Auf die Nachfrage nach dem Bürgermeister der Gemeinde wird ein unzutreffender Name genannt.

Eine ausgeprägte Leistungsfähigkeit wird ihm auch im Bereich der Reasoning-Fähigkeiten zugeschrieben. Da es sich bei DeepSeek R1 um eine Open-Source-Software handelt, ist es leichter, sie zu nutzen und weiterzuentwickeln.

DeepSeek will plötzlich nichts mehr wissen

Was die Epoch Times jedoch bestätigen kann, ist, dass DeepSeek in vollem Umfang den politischen Zensurvorgaben der Kommunistischen Partei Chinas folgt. Unsere Frage „Was ist die Epoch Times“ wurde erst mit einer Antwort bedacht, die recht objektiv und auf der Basis allgemein zugänglicher Informationen formuliert war. Kurz vor deren Beendigung nach drei Absätzen verschwand diese jedoch und wurde durch den Hinweis ersetzt:

„Tut mir leid, das ist außerhalb meiner derzeitigen Reichweite. Lass uns über etwas anderes sprechen.“

Auch der Hinweis darauf, dass die ursprüngliche Antwort doch eigentlich brauchbar gewesen wäre, führt nicht zu deren erneuter Anzeige. Die englischsprachige Epoch Times hat noch weitere Reizthemen für das Regime in Peking ausgetestet – mit dem gleichen Ergebnis.

Risiken durch Open-Source geringer – aber nicht völlig zu unterschätzen

Gründer Liang Wenfeng weist enge Verbindungen zu Chinas kommunistischem Regime auf. Noch am Tag der Veröffentlichung von DeepSeek-R1 nahm er an einem Symposium von Unternehmern und Experten unter Leitung von Chinas Ministerpräsident Li Qiang teil. Das Treffen wurde im „News Network“ des zentralen staatlichen Fernsehsenders „CCTV“ übertragen.

Was die Risiken der Anwendung anbelangt, betont der Dienst in seiner Datenschutzerklärung, es würden keine Chat-Interaktionen mit der KI gespeichert oder gesammelt. Die Gespräche fänden nur im Browser des Nutzers statt und würden weder auf Servern gespeichert noch übertragen. Als Open-Source-Modell kann DeepSeek R1 von der Community überprüft werden. Das macht potenzielle Sicherheitslücken oder versteckte Funktionen theoretisch leichter aufdeckbar macht.

Als Unternehmen mit Sitz in China und mit Rückendeckung der Kommunistischen Partei unterliegt jedoch auch DeepSeek im Zweifel den Datenzugriffsgesetzen der chinesischen Regierung. Der Missbrauch zum Zwecke der Erstellung von Fehlinformationen ist ebenfalls möglich. Außerdem ist es jederzeit möglich, dass eine Änderung des Geschäftsmodells auch mit einer Änderung der Datennutzung verbunden ist.