{"id":1348,"date":"2023-11-08T17:59:00","date_gmt":"2023-11-08T17:59:00","guid":{"rendered":"https:\/\/byte-bucket.com\/2023\/11\/08\/mlcommons-zeigt-mehr-beschleuniger-bessere-ergebnisse-fuer-datacenter-training-und-hpc\/"},"modified":"2023-11-08T17:59:00","modified_gmt":"2023-11-08T17:59:00","slug":"mlcommons-zeigt-mehr-beschleuniger-bessere-ergebnisse-fuer-datacenter-training-und-hpc","status":"publish","type":"post","link":"https:\/\/byte-bucket.com\/?p=1348","title":{"rendered":"MLCommons zeigt: Mehr Beschleuniger, bessere Ergebnisse f\u00fcr Datacenter-Training und HPC"},"content":{"rendered":"<p>Im Bereich der K\u00fcnstlichen Intelligenz (KI) spielen HPC (High Performance Computing) und Datacenter-Training eine entscheidende Rolle. Hier werden stetig nach neuen M\u00f6glichkeiten und Technologien gesucht, um die Leistung und Skalierbarkeit zu verbessern. Die MLCommons hat k\u00fcrzlich neue Ergebnisse pr\u00e4sentiert, die vielversprechende Fortschritte in diesem Bereich aufzeigen.<\/p>\n<p>Besonders interessant sind die Trainings-Ergebnisse, bei denen erstmals eine gr\u00f6\u00dfere Anzahl von Beschleunigern in der Hardware eingesetzt wird als zuvor. Dabei konnten NVIDIA und Azure herausragende Ergebnisse mit ihren Systemen erzielen. Azure setzt pro Knoten auf zwei Intel Xeon Platinum 8480C Prozessoren mit jeweils 56 Kernen und acht H100-Beschleunigern. Insgesamt werden somit 10.752 H100-Beschleuniger eingesetzt. Der EOS-Supercomputer von NVIDIA nutzt Xeon Platinum 8462Y Prozessoren mit 32 Kernen und verf\u00fcgt ebenfalls \u00fcber 1.344 Knoten und 10.752 H100-Beschleuniger. Dank dieser Entwicklung k\u00f6nnen NVIDIA und Azure ihre Systeme im Vergleich zu den bisherigen Ergebnissen um fast das Dreifache skalieren. Das bedeutet eine enorme Leistungssteigerung und eine drastische Reduzierung der Trainingszeit gro\u00dfer KI-Netzwerke um zwei Drittel.<\/p>\n<p>Besonders bei solch umfangreichen Systemen gewinnt die Netzwerk-Infrastruktur und die Interkonnektivit\u00e4t eine besondere Bedeutung. Bei EOS wird eine Fat Tree Topologie genutzt, um das Netzwerk zu vereinfachen und die Skalierungseffekte optimal zu nutzen.<\/p>\n<p>Auch Google hat erstmals Ergebnisse f\u00fcr die TPU-v5e eingereicht, wobei ein Cluster mit 4.096 TPUs verwendet wurde. Zus\u00e4tzlich hat Google eine Software-Optimierung vorgenommen, bei der in sieben von acht Schichten des Trainingsprozesses INT8 anstelle von BFloat16 genutzt wird. Dies f\u00fchrt zu einer weiteren Leistungssteigerung.<\/p>\n<p>\u00c4hnliche Schritte wurden auch bei Intel unternommen, wo nun bei den Gaudi2-Beschleunigern mit FP8 gerechnet wird. Dies hat zu einer Verdopplung der Benchmarks im Vergleich zu den vorherigen Ergebnissen gef\u00fchrt. Damit n\u00e4hert sich Intel dem Konkurrenten NVIDIA an und das Preis-Leistungs-Verh\u00e4ltnis verschiebt sich zugunsten von Intel.<\/p>\n<p>NVIDIA bleibt jedoch weiterhin f\u00fchrend in vielen Datacenter-Anwendungen, insbesondere im Bereich der KI-Anwendungen. Das Unternehmen verf\u00fcgt \u00fcber gro\u00dfe Kapazit\u00e4ten bei TSMC f\u00fcr die Fertigung und das Packaging seiner Produkte. Aufgrund der hohen Nachfrage bleiben die Preise jedoch weiterhin auf einem hohen Niveau. Intel tritt hier als kosteng\u00fcnstigere Alternative auf und bietet mit den Gaudi2-Beschleunigern eine attraktive Option f\u00fcr bestimmte Anwendungen.<\/p>\n<p>Es ist jedoch wichtig, bei verschiedenen Anwendungen genau hinzusehen und Unterschiede festzustellen. NVIDIA hat zweifellos einen deutlichen Vorsprung im Bereich KI-Anwendungen, aber je nach spezifischem Anwendungsfall k\u00f6nnen auch andere L\u00f6sungen wie die von Intel von Vorteil sein.<\/p>\n<p>Die kontinuierliche Weiterentwicklung und der Wettbewerb in diesem Bereich sind sehr spannend und versprechen zuk\u00fcnftig noch leistungsf\u00e4higere und effizientere Systeme f\u00fcr HPC und Datacenter-Training. Es bleibt spannend, welche neuen Technologien und M\u00f6glichkeiten in Zukunft noch entdeckt werden und wie sich der Markt weiterentwickelt.<\/p>\n<p>Schlagw\u00f6rter: MLCommons + DatacenterTraining + HPC<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Im Bereich der K\u00fcnstlichen Intelligenz (KI) spielen HPC (High Performance Computing) und Datacenter-Training eine entscheidende Rolle. Hier werden stetig nach neuen M\u00f6glichkeiten und Technologien gesucht, um die Leistung und Skalierbarkeit zu verbessern. Die MLCommons hat k\u00fcrzlich neue Ergebnisse pr\u00e4sentiert, die vielversprechende Fortschritte in diesem Bereich aufzeigen. Besonders interessant sind die&#46;&#46;&#46;<\/p>\n","protected":false},"author":4,"featured_media":1347,"comment_status":"","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[],"class_list":["post-1348","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-uncategorized"],"_links":{"self":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/1348","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/users\/4"}],"replies":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=1348"}],"version-history":[{"count":0,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/posts\/1348\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=\/wp\/v2\/media\/1347"}],"wp:attachment":[{"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=1348"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=1348"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/byte-bucket.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=1348"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}