AMD hat auf der Computex 2024-Keynote einen Einblick in die kommenden EPYC-Prozessoren gegeben, die auf der Zen-5-Architektur basieren. Sie versuchten auch, die Leistung im Vergleich zu den aktuellen Intel-Prozessoren zu demonstrieren und veröffentlichten einige Diagramme, die den Eindruck erwecken sollten, dass AMD ihrem Konkurrenten um den Faktor 2,5 bis 5,4 überlegen ist. Doch Vorsicht ist geboten, wenn es um Benchmarks direkt vom Hersteller geht. Es ist ratsam, immer einen genauen Blick auf die Fußnoten zu werfen.
Besonders im Bereich der Rechenzentren spielt die verwendete Software eine entscheidende Rolle. Sowohl bei den Prozessoren als auch bei HPC/AI-Beschleunigern gibt es oft einen speziell optimierten Software-Stack. Wenn man sich für AMD-Hardware entscheidet, nutzt man auch die dafür optimierte Software und umgekehrt gilt dies wahrscheinlich auch für Intel- oder NVIDIA-Hardware. Intel hat in einem Blog-Beitrag angesprochen, dass AMD nicht den optimierten Software-Stack verwendet hat und es ist nicht klar, welche Software überhaupt zum Einsatz kam.
Für die Xeon-Prozessoren gibt es eine PyTorch-Optimierung namens Intel Extension for PyTorch (IPEX). Mit dieser Optimierung erreichen zwei Xeon Platinum 8592 mit insgesamt 128 Kernen für das Inferencing in INT4 in einer Chatbot-Anwendung auf Basis von Llama2 7B und vorgegebenen Latenzen von 50 ms einen Durchsatz von 686 Anfragen. Ohne den Einsatz der optimierten Software waren es nur 125 Anfragen. AMD gibt für zwei seiner Turin-Prozessoren, die insgesamt 256 Kerne haben, eine Zahl von 671 Anfragen an. Gemäß Intel wäre es sogar möglich gewesen, durch Deaktivierung von SNC einen Durchsatz von etwa 740 zu erreichen. Dies verdeutlicht erneut die Bedeutung der Software für unterschiedliche Workloads.
Die Situation erinnert an AMDs Veröffentlichung erster Benchmarks zum Instinct-MI300X-Beschleuniger im Dezember letzten Jahres. AMD stellte damals fest, dass es sich weit vor NVIDIAs H100-Beschleuniger befand, aber NVIDIA wies darauf hin, dass AMD ohne das optimierte TensorRT-LLM-Framework getestet hatte. Als dieses Framework zum Einsatz kam, lag NVIDIA wieder deutlich vor AMD. AMD konterte jedoch erneut und fühlte sich in seinen Werten bestätigt.
In Bezug auf den aktuellen Fall widerspricht Intel seinem Konkurrenten explizit in Bezug auf einen der Benchmarks. Laut Intel erzielen auch die anderen Anwendungsbereiche, wie Textzusammenfassungen und Übersetzungen in der LLM-Token-Erzeugung, deutlich bessere Ergebnisse, wenn optimierte Software verwendet wird. Jedoch wurde offenbar beschlossen, hierfür keine Grafik zu erstellen. Die Leistung wird voraussichtlich um das 2,3- bzw. 1,2-fache steigen, was jedoch nicht an AMDs Turin heranreicht.
Darüber hinaus sollte angemerkt werden, dass AMDs derzeitige EPYC-Plattform über 12 Speicherkanäle verfügt, während Emerald Rapids von Intel lediglich acht Kanäle bietet. AMD präsentierte auch eine gängige HPC-Anwendung (NAMD), in der sie sich ebenfalls vor Intel positioniert sieht. Intel hat keine Einwände gegen diese Werte. AMDs EPYC-Generation Turin wird jedoch wahrscheinlich nicht nur mit Intels letzter Xeon-Generation Emerald Rapids konkurrieren müssen, sondern auch mit den kürzlich vorgestellten Xeon-6-Modellen. Diese sind jedoch vorerst nur in der kleineren E-Kern-Version erhältlich. Erst im Verlauf des dritten Quartals werden die leistungsstarken Granite Rapids mit einer Kapazität von bis zu 128 P-Kernen eingeführt. Auch Intels Plattform bietet an dieser Stelle 12 Speicherkanäle.
Es kann herausfordernd sein, den verwendeten Software-Stack, möglicherweise optimierte Datensätze und die vielen anderen Umgebungsbedingungen richtig einzuordnen. Es kommt stark darauf an, welche Software und welche Datensätze verwendet werden. Potenzielle Kunden werden hierbei äußerst genau hinsehen und eigene Tests durchführen.
Die Keynote von AMD auf der Computex war in Bezug auf andere Produkte und deren Leistungsvergleiche eher zweifelhaft einzuschätzen. AMD präsentierte zwei neue Prozessoren für den Sockel AM4, den Ryzen 7 5800XT und den Ryzen 9 5900XT. Auch hier lieferte AMD einige Benchmarks, die zeigten, dass sie in Spielen mit dem Core i7-13700K und dem Core i5-13600KF auf Augenhöhe waren. Doch auch hier sollte man einen Blick in die Fußnoten werfen.
Es wird deutlich, dass AMD einerseits eine Radeon RX 6600 als Grafikkarte verwendet hat, was höchstwahrscheinlich zu einer Begrenzung durch die GPU geführt hat. Andererseits wurde für die Intel-Prozessoren DDR4-Speicher verwendet. Jemand, der derzeit ein Intel-System erwirbt, wird höchstwahrscheinlich nicht mehr auf DDR4 setzen. Es ist wahrscheinlich, dass der Einfluss der deutlich unterdimensionierten Grafikkarte eine viel größere Rolle im Leistungsvergleich gespielt hat. Es ist uns unklar, warum AMD sich für eine Radeon RX 6600 entschieden hat. Es lässt sich vermuten, dass dies bewusst geschehen ist, um die Leistungswerte in der gewünschten Weise darzustellen.
Schlagwörter: AMD + AMDs Turin + Intel
Wie bewerten Sie den Schreibstil des Artikels?