Huawei bringt mit dem Ascend 910B einen neuen KI-Beschleuniger auf den Markt. Der Chip wird voraussichtlich vom chinesischen Chipauftragsfertiger SMIC mit 7-Nanometer-Technologie hergestellt. Bisher gibt es noch keine offiziellen Informationen zu den genauen Spezifikationen, da Huawei den Chip noch nicht offiziell vorgestellt hat. Früher wurde der Ascend 910 von TSMC für Huawei produziert, aber aufgrund von Handelsbeschränkungen darf TSMC nicht mehr für Huawei tätig sein.
Der bisherige Ascend 910 ist ein Chipletdesign, bei dem die Logik auf zwei separaten Chiplets aufgeteilt ist und vier HBM2E-Speicherstapel verwendet werden. Zwei Dummy-Chiplets unterstützen das Design, um Stabilität zu gewährleisten. Es ist noch unklar, ob der Nachfolger aus mehreren Siliziumbestandteilen besteht oder ob es sich um einen monolithischen Chip handelt. Obwohl SMIC selbst keine Multi-Chiplet-Prozessoren herstellen kann, bietet ihr Partner JCET laut ihrer Webseite die Möglichkeit des sogenannten Advanced Packagings an.
Laut einem Bericht der Nachrichtenagentur Reuters gibt es bei SMIC Produktionsengpässe aufgrund einer vermeintlichen Knappheit an belichtbaren Wafern. SMIC hat bisher den Smartphone-Prozessor Kirin 9000S für das Huawei Mate 60 Pro mit 7-nm-Technologie produziert. Es wird behauptet, dass die Partner beschlossen haben, die Produktion von Smartphones zugunsten der KI-Beschleuniger zu reduzieren, jedoch sind die genauen Mengen nicht bekannt.
Der Weltmarkt für KI-Beschleuniger wird derzeit von Nvidia mit ihrem H100-Modell dominiert, während AMD versucht, mit den Modellen MI300X und MI300A aufzuholen. Um mit diesen Produkten in Bezug auf Geschwindigkeit mithalten zu können, musste Huawei den Ascend 910B im Vergleich zum bisherigen 910 deutlich schneller machen. Der Ascend 910B erreicht eine Rechenleistung von 256 Billionen Operationen pro Sekunde mit 16-Bit Gleitkommawerten (256 FP16-Teraflops) und 512 INT8-TeraOPS mit 8-Bit Ganzzahlen. In Bezug auf die Geschwindigkeit sind Nvidias H100 und AMDs MI300X-Beschleuniger deutlich leistungsstärker. Nvidia gibt beispielsweise eine Leistung von fast einem FP16-Petaflops (1000 Teraflops) an, wenn die Tensor-Kerne verwendet werden. AMD gibt eine Leistung von 1,3 FP16-Petaflops für seine MI300X an. Bei KI-Beschleunigern lassen sich die Zahlen jedoch nur begrenzt miteinander vergleichen, insbesondere in diesem Fall.
Die Geschwindigkeit des Huawei Ascend 910B scheint jedoch beeindruckend genug zu sein, um das Interesse von Baidu zu wecken. Aufgrund von Exportbeschränkungen dürfen AMD und Nvidia ihre Spitzenmodelle für KI-Beschleuniger nicht nach China verkaufen. Berichten zufolge hat Nvidia daher eine abgeschwächte Version namens H20 auf den Markt gebracht, die etwa die Hälfte der Geschwindigkeit des H100 aufweist. Zuvor wurden bereits die Modelle A800 und H800 mit reduzierter Leistung eingeführt, um den US-Sanktionen zu entgehen. Als Reaktion darauf haben die USA neue Vorschriften erlassen.
Schlagwörter: Nvidias H100 + Huawei + SMIC
Wie bewerten Sie den Schreibstil des Artikels?