Der DeepSeek-Schock: Ein chinesisches KI-Startup stürmt die Charts und hinterfragt das KI-Paradigma
In einem Schlagereignis, das im Fachblatt Echo und in den Silicon Valley News für Entsetzen sorgte, hat ein von dem chinesischen KI-Startup DeepSeek entwickelter Chatbot diese Woche die Spitze der App Store-Charts von Apple in den USA erobert. Damit löste er OpenAIs ChatGPT als am häufigsten heruntergeladene kostenlose App ab und sorgte für ein Erdbeben im hochkompetitiven KI-Markt.
DeepSeeks Erfolgsgeheimnis liegt in einem Ansatz, der die traditionellen Modelle in Frage stellt. Der gleichnamige KI-Assistent basiert auf Open-Source-Modellen, die zu Bruchteilen der Kosten und mit deutlich weniger Rechenleistung als die führenden Modelle der Welt, wie ChatGPT oder GPT-4, trainiert wurden. Laut dem Unternehmen werden die zugrunde liegenden Open-Source-Modelle von DeepSeek effizient und kostengünstig mit einem Bruchteil der Chips trainiert, die normalerweise erforderlich sind.
Der Aufstieg des DeepSeek-Chatbots wurde durch die Veröffentlichung von R1-Reasoning am 20. Januar eingeleitet. Dieses Modell, das zur Lösung komplexer Probleme entwickelt wurde, erzielt in bestimmten Benchmarks gleichwertige Ergebnisse wie OpenAIs o1 und stellt damit eine ernstzunehmende Konkurrenz dar. Hinter R1 steckt das V3-LLM, das im Dezember von DeepSeek veröffentlicht wurde.
Das Unternehmen sieht V3 auf Augenhöhe mit GPT-4 und Anthropics Claude 3.5 Sonnet, trotz Entwicklungskosten von weniger als 6 Millionen US-Dollar – ein krasser Kontrast zu den geschätzten über 100 Millionen Dollar für das Training von GPT-4, wie es OpenAI-Chef Sam Altman öffentlich angab.
Die Behauptungen von DeepSeek über die Trainingsweise von V3 mit lediglich 2.000 spezialisierten Nvidia-Chips im Vergleich zu den erforderlichen 16.000 oder mehr bei anderen Modellen (so die New York Times) stellen die Kernannahmen etablierter Akteure wie Nvidia, Microsoft, Google und Amazon infrage. Diese Behauptungen werfen Fragen nach der Effizienz und Notwendigkeit der aktuellen KI-Paradigmen auf und lassen den Markt mit Ungewissheit und einer Portion Panik reagieren.
Das Ergebnis ist ein signifikanter Abwärtstrend im Vorbörsenhandel für Unternehmen wie Nvidia, Microsoft und andere Akteure mit starken Interessen am Status quo der KI-Entwicklung. Der DeepSeek-Schock zeigt die Dynamik des Marktes und lässt erahnen, dass sich das KI-Paradigma in Zukunft möglicherweise grundlegend verändern könnte. Die Welt schaut gespannt auf DeepSeeks nächste Schritte und fragt: Was kommt nach dem Chatbot?
Schlagwörter: DeepSeek + OpenAIs ChatGPT + GPT-4
Wie bewerten Sie den Schreibstil des Artikels?
