Nahezu täglich postet Florian Hasibar zu Themen aus der Welt der Künstlichen Intelligenz. In Österreich hat sich der Gründer und Geschäftsführer von mytalents.ai, einer Lernplattform mit Fokus auf KI-Themen, damit längst einen Namen als Experte gemacht. „Am 25. Dezember“, so erzählt es Hasibar der Kleinen Zeitung, habe er erstmals größere Notiz von einem chinesischen KI-Unternehmen mit dem Namen DeepSeek genommen.

Damals veröffentlichte die im Besitz des Hedgefonds High-Flyer befindliche Firma das neue, frei zugängliche, KI-Modell V1. Darauf basierende Anwendungen funktionieren ähnlich wie der populäre Chatbot ChatGPT von OpenAI. In der KI-Szene sorgten die Chinesen damit für gehörig Aufsehen, weil es in Leistungstests gut mit Modellen der KI-Größen OpenAI, Meta oder Anthropic mithalten konnte. Bei, wie DeepSeek versichert, deutlich geringerem Budget und viel kleinerer Rechenleistung im Hintergrund.

mytalents.ai-Gründer Florian Hasibar
mytalents.ai-Gründer Florian Hasibar © KK

Exakt vor einer Woche legte DeepSeek dann nach und sorgte dafür, dass „die Community explodierte“, wie es Hasibar metaphorisch formuliert. Der algorithmische Sprengstoff wurde in Form des Sprachmodells R1 ausgeliefert. Dieser erinnert Silicon-Valley-Größe Marc Andreessen, er sieht einen „Sputnik-Moment der KI“, gar ans Wettrennen im Weltall.

„DeepSeeks neues Modell zu sehen, ist wirklich beeindruckend“, lässt selbst Microsoft-Boss Satya Nadella wissen. Das gelte „sowohl in Bezug auf die effektive Umsetzung eines Open-Source-Modells, das diese rechenzeitoptimierte Leistung liefert, als auch bezüglich seiner hohen Effizienz“. Beeindruckend sei im Modell der Fortschritt im „Schritt-für-Schritt-Denken“ sagt Florian Hasibar – „du kannst dem Modell zusehen, wie es nachdenkt und siehst sogar die Nachdenkschritte“.

„Sie haben viele Fehler nicht machen müssen“, erklärt Patrick Ratheiser, Chef des steirischen KI-Start-ups Leftshift One, mit Blick auf die Genese von DeepSeek. Bei Leftshift One beobachtet man das chinesische Unternehmen, ein Spezialist für die Extraktion kleinerer aus größeren KI-Modellen, schon länger. „Technisch“, so Ratheiser, sei es „fantastisch“, was die chinesische KI biete.

DeepSeek: „20 bis 40 Mal billiger“

Zudem würde DeepSeek eindrucksvoll zeigen, dass es noch immer möglich ist, gigantisch kapitalisierten Firmen wie OpenAI bei Sprachlernmodellen „die Stirn zu bieten“. Zugleich sei DeepSeek preislich um Welten unter OpenAI & Co angesiedelt. Das bestätigen auch Analysen von Bernstein, wonach DeepSeek zurzeit „20 bis 40 Mal billiger als die entsprechenden Modelle von OpenAI“ anbiete.

Aber: „Wir hosten es trotzdem nicht“, meint Leftshift-One-Chef Ratheiser. Ein Unsicherheitsfaktor sei mögliche politische Einflussnahme und damit verbundene chinesische Zensur. So werden die DeepSeek-Modelle recht schnell sprechfaul, wenn es um heikle Themen wie den Status Taiwans geht.

Leftshift One, Feldkirchen, 19.06.2023

patrick ratheiser
„Wir hosten es nicht“: Patrick Ratheiser, CEO von Leftshift One, über DeepSeek © Richard Großschädl

In den Apple-Downloadcharts, egal ob in den USA, Deutschland oder Österreich, sprang DeepSeek trotzdem rasch an die Spitze. Was in Folge für großes Aufsehen und gewaltige Bewegung an der US-Technologiebörse Nasdaq sorgte. Ein großer Teil der jüngeren Zugewinne und aktuellen Bewertungen basiert dort nämlich auf dem Zukunftsversprechen von KI. Die großen amerikanischen Tech-Unternehmen, egal ob Meta, Microsoft, Amazon oder Google, investieren Milliarden in entsprechende Infrastruktur – an einer US-Themenführerschaft, einer großen Dominanz, zweifelte die letzten Monate niemand.

Minus 17 Prozent bei Nvidia

Bis jetzt? Gerade einmal zwei Monate, fünf Millionen US-Dollar und ältere H800-Nvidia-Chips hätte es laut DeepSeek gebraucht, eines der jetzt so stark besprochenen Modelle zu trainieren. Überprüfbar ist das freilich nicht, in vielen Hintergrundgesprächen äußern Branchenexperten Zweifel. Bei OpenAI jedenfalls liegen die Trainingskosten mittlerweile bei deutlich mehr als 100 Millionen US-Dollar je Modell.

Zudem gibt es Stimmen wie jene von Alexandr Wang, Gründer und Chef von Scale AI, einem riesigen Anbieter von KI-Trainingsdaten, die behaupten, dass DeepSeek trotz prinzipieller Handelsbeschränkungen sehr wohl Zugriff auf die leistungsstarken Nvidia-H100-Chips hätte. Woher auch immer.

All das reicht, um den Nasdaq-Leitindex Composite am Montag abermals in den Tiefflug zu versetzen. In Summe verlor der Index mehr als drei Prozent. Die Nvidia-Aktie fiel um knapp 17 Prozent und das radierte 589 Milliarden Dollar (559,4 Milliarden Euro) Börsenwert aus. Noch nie hatte ein US-Unternehmen an einem Tag so viel Wert verloren – allerdings war auch keins davor so teuer wie Nvidia mit fast 3,5 Billionen Dollar.