{"id":8636,"date":"2024-06-13T16:38:52","date_gmt":"2024-06-13T16:38:52","guid":{"rendered":"https:\/\/byte-bucket.com\/2024\/06\/13\/amd-gibt-einblick-in-kommende-epyc-prozessoren-auf-der-computex-keynote-2024\/"},"modified":"2024-06-13T16:38:52","modified_gmt":"2024-06-13T16:38:52","slug":"amd-gibt-einblick-in-kommende-epyc-prozessoren-auf-der-computex-keynote-2024","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=8636","title":{"rendered":"AMD gibt Einblick in kommende EPYC-Prozessoren auf der Computex-Keynote 2024"},"content":{"rendered":"<p>AMD hat auf der Computex 2024-Keynote einen Einblick in die kommenden EPYC-Prozessoren gegeben, die auf der Zen-5-Architektur basieren. Sie versuchten auch, die Leistung im Vergleich zu den aktuellen Intel-Prozessoren zu demonstrieren und ver\u00f6ffentlichten einige Diagramme, die den Eindruck erwecken sollten, dass AMD ihrem Konkurrenten um den Faktor 2,5 bis 5,4 \u00fcberlegen ist. Doch Vorsicht ist geboten, wenn es um Benchmarks direkt vom Hersteller geht. Es ist ratsam, immer einen genauen Blick auf die Fu\u00dfnoten zu werfen.<\/p>\n<p>Besonders im Bereich der Rechenzentren spielt die verwendete Software eine entscheidende Rolle. Sowohl bei den Prozessoren als auch bei HPC\/AI-Beschleunigern gibt es oft einen speziell optimierten Software-Stack. Wenn man sich f\u00fcr AMD-Hardware entscheidet, nutzt man auch die daf\u00fcr optimierte Software und umgekehrt gilt dies wahrscheinlich auch f\u00fcr Intel- oder NVIDIA-Hardware. Intel hat in einem Blog-Beitrag angesprochen, dass AMD nicht den optimierten Software-Stack verwendet hat und es ist nicht klar, welche Software \u00fcberhaupt zum Einsatz kam.<\/p>\n<p>F\u00fcr die Xeon-Prozessoren gibt es eine PyTorch-Optimierung namens Intel Extension for PyTorch (IPEX). Mit dieser Optimierung erreichen zwei Xeon Platinum 8592 mit insgesamt 128 Kernen f\u00fcr das Inferencing in INT4 in einer Chatbot-Anwendung auf Basis von Llama2 7B und vorgegebenen Latenzen von 50 ms einen Durchsatz von 686 Anfragen. Ohne den Einsatz der optimierten Software waren es nur 125 Anfragen. AMD gibt f\u00fcr zwei seiner Turin-Prozessoren, die insgesamt 256 Kerne haben, eine Zahl von 671 Anfragen an. Gem\u00e4\u00df Intel w\u00e4re es sogar m\u00f6glich gewesen, durch Deaktivierung von SNC einen Durchsatz von etwa 740 zu erreichen. Dies verdeutlicht erneut die Bedeutung der Software f\u00fcr unterschiedliche Workloads.<\/p>\n<p>Die Situation erinnert an AMDs Ver\u00f6ffentlichung erster Benchmarks zum Instinct-MI300X-Beschleuniger im Dezember letzten Jahres. AMD stellte damals fest, dass es sich weit vor NVIDIAs H100-Beschleuniger befand, aber NVIDIA wies darauf hin, dass AMD ohne das optimierte TensorRT-LLM-Framework getestet hatte. Als dieses Framework zum Einsatz kam, lag NVIDIA wieder deutlich vor AMD. AMD konterte jedoch erneut und f\u00fchlte sich in seinen Werten best\u00e4tigt.<\/p>\n<p>In Bezug auf den aktuellen Fall widerspricht Intel seinem Konkurrenten explizit in Bezug auf einen der Benchmarks. Laut Intel erzielen auch die anderen Anwendungsbereiche, wie Textzusammenfassungen und \u00dcbersetzungen in der LLM-Token-Erzeugung, deutlich bessere Ergebnisse, wenn optimierte Software verwendet wird. Jedoch wurde offenbar beschlossen, hierf\u00fcr keine Grafik zu erstellen. Die Leistung wird voraussichtlich um das 2,3- bzw. 1,2-fache steigen, was jedoch nicht an AMDs Turin heranreicht.<\/p>\n<p>Dar\u00fcber hinaus sollte angemerkt werden, dass AMDs derzeitige EPYC-Plattform \u00fcber 12 Speicherkan\u00e4le verf\u00fcgt, w\u00e4hrend Emerald Rapids von Intel lediglich acht Kan\u00e4le bietet. AMD pr\u00e4sentierte auch eine g\u00e4ngige HPC-Anwendung (NAMD), in der sie sich ebenfalls vor Intel positioniert sieht. Intel hat keine Einw\u00e4nde gegen diese Werte. AMDs EPYC-Generation Turin wird jedoch wahrscheinlich nicht nur mit Intels letzter Xeon-Generation Emerald Rapids konkurrieren m\u00fcssen, sondern auch mit den k\u00fcrzlich vorgestellten Xeon-6-Modellen. Diese sind jedoch vorerst nur in der kleineren E-Kern-Version erh\u00e4ltlich. Erst im Verlauf des dritten Quartals werden die leistungsstarken Granite Rapids mit einer Kapazit\u00e4t von bis zu 128 P-Kernen eingef\u00fchrt. Auch Intels Plattform bietet an dieser Stelle 12 Speicherkan\u00e4le.<\/p>\n<p>Es kann herausfordernd sein, den verwendeten Software-Stack, m\u00f6glicherweise optimierte Datens\u00e4tze und die vielen anderen Umgebungsbedingungen richtig einzuordnen. Es kommt stark darauf an, welche Software und welche Datens\u00e4tze verwendet werden. Potenzielle Kunden werden hierbei \u00e4u\u00dferst genau hinsehen und eigene Tests durchf\u00fchren.<\/p>\n<p>Die Keynote von AMD auf der Computex war in Bezug auf andere Produkte und deren Leistungsvergleiche eher zweifelhaft einzusch\u00e4tzen. AMD pr\u00e4sentierte zwei neue Prozessoren f\u00fcr den Sockel AM4, den Ryzen 7 5800XT und den Ryzen 9 5900XT. Auch hier lieferte AMD einige Benchmarks, die zeigten, dass sie in Spielen mit dem Core i7-13700K und dem Core i5-13600KF auf Augenh\u00f6he waren. Doch auch hier sollte man einen Blick in die Fu\u00dfnoten werfen.<\/p>\n<p>Es wird deutlich, dass AMD einerseits eine Radeon RX 6600 als Grafikkarte verwendet hat, was h\u00f6chstwahrscheinlich zu einer Begrenzung durch die GPU gef\u00fchrt hat. Andererseits wurde f\u00fcr die Intel-Prozessoren DDR4-Speicher verwendet. Jemand, der derzeit ein Intel-System erwirbt, wird h\u00f6chstwahrscheinlich nicht mehr auf DDR4 setzen. Es ist wahrscheinlich, dass der Einfluss der deutlich unterdimensionierten Grafikkarte eine viel gr\u00f6\u00dfere Rolle im Leistungsvergleich gespielt hat. Es ist uns unklar, warum AMD sich f\u00fcr eine Radeon RX 6600 entschieden hat. Es l\u00e4sst sich vermuten, dass dies bewusst geschehen ist, um die Leistungswerte in der gew\u00fcnschten Weise darzustellen.<\/p>\n<p>Schlagw\u00f6rter: AMD + AMDs Turin + Intel<\/p>\n","protected":false},"excerpt":{"rendered":"<p>AMD hat auf der Computex 2024-Keynote einen Einblick in die kommenden EPYC-Prozessoren gegeben, die auf der Zen-5-Architektur basieren. Sie versuchten auch, die Leistung im Vergleich zu den aktuellen Intel-Prozessoren zu demonstrieren und ver\u00f6ffentlichten einige Diagramme, die den Eindruck erwecken sollten, dass AMD ihrem Konkurrenten um den Faktor 2,5 bis 5,4&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":8635,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-8636","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/8636","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=8636"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/8636\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/8635"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=8636"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=8636"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=8636"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}