Zukünftig entwickeln vermutlich so ziemlich alle entscheidenden Unternehmen der Tech-Branche eigene Chips: Amazon, Alphabet, Microsoft, Meta, Oracle, Dell oder auch Snowflake.

Ich erkläre hier, warum sich NVIDIA freut, wenn die Tech-Giganten ihre eigenen Chips entwickeln:

Warum Nvidia gegenüber AMD die Nase vorn hat

Nvidia hat den Markt der KI-GPUs erfunden und entwickelt.

Natürlich gibt es Nachahmer, die günstigere Chips entwickeln. Doch die Chips von AMD schließen nach einem Jahr maximal mit der Performance der Nvidia-Chips auf und kosten dann weniger. Doch gleichzeitig zeigen Studien, dass die Chips von AMD mehr Strom verbrauchen als die Chips von Nvidia. Die "total costs of ownership", also die Vollkosten für die Entwicklung eines funktionstüchtigen KI-Modells sind bei den AMD-Chips noch immer deutlich höher als bei den Nvidia-Chips, wenn man die Stromkosten einbezieht.



Und sobald AMD in Sachen Leistungsfähigkeit aufschließt, bringt Nvidia bereits die nächste Generation auf den Markt. Ich habe nicht den Eindruck, dass sich Jensen Huang auf seinen Lorbeeren ausruht, im Gegenteil, er sieht die KI-Revolution noch in einem sehr frühen Stadium und arbeitet mit Hochdruck an besseren GPUs und an der zügigen Verfügbarkeit neuer GPUs.

Inferenz vs. Training: Der wahre Nutzen eigener KI-Chips

Tatsächlich entwickeln Amazon, Alphabet, Microsoft und viele andere Mega-Techs ihre eigenen "KI-Chips".

Doch diese Chips sind für die "Inferenz" optimiert, nicht für das Trainieren. Mit Inferenz meint man die Anwendung des trainierten KI-Modells für den beabsichtigten Zweck. ChatGPT beantwortet Ihnen alle Fragen. Dazu greift er auf ein Datenmodell zu, das über 9 Monate trainiert wurde. Doch zur Beantwortung Ihrer konkreten Frage durchforstet er das Datenmodell und stellt die bestmögliche Antwort zusammen. Diesen Prozess nennt man "Inferenz". Das Modell verfeinert die Antwort, daher können Sie auf die gleiche Frage später eine unterschiedliche Antwort erhalten.



Diese Inferenz ist ebenfalls sehr rechenintensiv und es ist vorteilhaft, spezielle Chips für diese Anwendung zu optimieren. Jedoch im Vergleich zum Training ist diese Rechenoperation niedlich. Daher sagt Jensen Huang bei jeder Gelegenheit, er begrüße die Entwicklung unternehmenseigener KI-Chips. Denn damit sind die Inferenz-Chips gemeint, nicht die Trainings-Chips. Und je mehr Inferenz-Chips entwickelt werden, desto stärker werden sich KI-Angebote verbreiten. Doch jedes KI-Angebot benötigt zunächst einmal eine KI, die auf Nvidia-GPUs wie der H100 oder H200 trainiert wird.