{"id":1001226,"date":"2026-05-07T13:17:17","date_gmt":"2026-05-07T13:17:17","guid":{"rendered":"https:\/\/www.europesays.com\/de\/1001226\/"},"modified":"2026-05-07T13:17:17","modified_gmt":"2026-05-07T13:17:17","slug":"amd-instinct-mi350p-ultraschneller-ki-beschleuniger-als-pci-express-karte","status":"publish","type":"post","link":"https:\/\/www.europesays.com\/de\/1001226\/","title":{"rendered":"AMD Instinct MI350P: ultraschneller KI-Beschleuniger als PCI-Express-Karte"},"content":{"rendered":"<p>    close notice<\/p>\n<p class=\"notice-banner__text a-u-mb-0\">\n      This article is also available in<br \/>\n        <a href=\"https:\/\/www.heise.de\/en\/news\/AMD-Instinct-MI350P-ultra-fast-AI-accelerator-as-a-PCI-Express-card-11286125.html\" class=\"notice-banner__link a-u-inline-link\" rel=\"nofollow noopener\" target=\"_blank\">English<\/a>.<\/p>\n<p>      It was translated with technical assistance and editorially reviewed before publication.\n    <\/p>\n<p class=\"notice-banner__link a-u-mb-0\">\n    Don\u2019t show this again.\n<\/p>\n<p>AMDs Instinct MI350P f\u00fcr regul\u00e4re PCIe-5.0-Steckfassungen soll sich prim\u00e4r f\u00fcr Agentic AI eignen, also KI-Agenten, die ihren Nutzern automatisiert zur Hand gehen und Aufgaben abnehmen k\u00f6nnen. Die Karte hat mit ihrer GPU au\u00dfer enorm hoher KI-Rechenleistung und viel Speicherdurchsatz aber noch ein paar andere Funktionen in petto. Darunter auch die Beschleunigung aktueller Videocodecs bis AV1 und die Unterteilung in bis zu vier virtuelle GPUs.<\/p>\n<p>        Weiterlesen nach der Anzeige<\/p>\n<p>Und obwohl sie auch in normalen Rechnern laufen k\u00f6nnte, zielt AMD mit ihr auf Serversysteme, denen die MI350P zur KI-Eignung verhelfen soll. Schon die passive K\u00fchlung der rund 26,7 cm langen Dual-Slot-Karte ist auf den starken Luftstrom von Rackservern ausgelegt. Laut AMD soll sie sich mit ihren 144 GByte Stapelspeicher vom Typ HBM3e f\u00fcr KI-Modelle mit rund 200 bis 250 Milliarden Parametern eignen. Workstation-Karten wie die <a class=\"heiseplus-lnk\" href=\"https:\/\/www.heise.de\/tests\/AMDs-erster-KI-Beschleuniger-fuer-daheim-im-Test-Radeon-AI-Pro-9700-11114141.html\" rel=\"nofollow noopener\" target=\"_blank\">Radeon AI Pro 9700<\/a> mit nur 32 GByte machen deutlich fr\u00fcher schlapp, etwa bei 40 bis 50 Milliarden Parametern.<\/p>\n<p>Halbierte Schwester<\/p>\n<p>Die MI350P teilt sich ihre GPU mit <a href=\"https:\/\/www.heise.de\/news\/Instinct-MI350X-MI355X-AMD-opfert-Compute-fuer-KI-Rechenleistung-10442505.html\" rel=\"nofollow noopener\" target=\"_blank\">Beschleunigern in der Bauform Open Accelerator Module (OAM) vom Typ Instinct MI350X\/355X<\/a>, allerdings sind bei der MI350P nur 128 Compute Units aktiv, w\u00e4hrend bei den OAM-Modellen 256 CUs rechnen. Au\u00dferdem halbiert AMD den schnellen HBM3e-Stapelspeicher von 288 auf 144 GByte. AMD gibt dies zwar nicht schriftlich zu Protokoll, aber die Abbildung der Karte zeigt, was nahe liegt: Bei der MI350P kommt nur ein I\/O-Die (IOD) mit vier Compute-Dies (XCDs) zum Einsatz, das GPU-Package wird gegen\u00fcber den gr\u00f6\u00dferen Geschwistern also halbiert.<\/p>\n<p>      <a href=\"https:\/\/www.heise.de\/imgs\/18\/5\/0\/7\/8\/1\/4\/4\/Instinct_Stack-e72ef859ffcbb37b.png\" rel=\"nofollow noopener\" target=\"_blank\"><\/p>\n<p>  <img loading=\"lazy\" decoding=\"async\" alt=\"\" height=\"948\" src=\"data:image\/svg+xml,%3Csvg xmlns='http:\/\/www.w3.org\/2000\/svg' width='696px' height='391px' viewBox='0 0 696 391'%3E%3Crect x='0' y='0' width='696' height='391' fill='%23f2f2f2'%3E%3C\/rect%3E%3C\/svg%3E\" style=\"aspect-ratio: 1682 \/ 948; object-fit: cover;\" width=\"1682\"\/><\/p>\n<p>      <\/a><\/p>\n<p>Die Instinct MI350P soll die OAM-Serverboards nach unten erg\u00e4nzen und zum Beispiel bestehenden Rackserver auf die KI-Spr\u00fcnge helfen.<\/p>\n<p class=\"a-caption__source\">\n      (Bild:\u00a0AMD)\n    <\/p>\n<p>Auch die Leistungsaufnahme sinkt deutlich und gleich mit nominell 600 Watt TDP der <a href=\"https:\/\/www.heise.de\/news\/RTX-Pro-6000-Blackwell-Die-bessere-GeForce-RTX-5090-10323275.html\" rel=\"nofollow noopener\" target=\"_blank\">einer Nvidia RTX Pro 6000 Blackwell<\/a> oder <a href=\"https:\/\/www.heise.de\/news\/Nvidia-H200-Hopper-auch-als-PCIe-Karte-lieferbar-10080768.html\" rel=\"nofollow noopener\" target=\"_blank\">H200 NVL<\/a>, mit denen sie offensichtlich auch konkurrieren soll. Zur Versorgung mit Energie setzt AMD auf den <a href=\"https:\/\/www.heise.de\/news\/Asus-Equalizer-Kabel-fuer-12V2x6-mit-fragwuerdigem-Nutzen-11281059.html\" rel=\"nofollow noopener\" target=\"_blank\">kontroversen ATX-Stecker 12V-2\u00d76<\/a>. Alternativ l\u00e4sst sich die Karte in einen Modus mit 450 Watt versetzen.<\/p>\n<p>Um mehrere Nutzer zugleich zu versorgen, gibt es drei Partitionierungsoptionen: SPX, DPX und CPX. Ersterer entspricht dem Vollbetrieb, bei DPX teilen sich zwei Nutzer die Ressourcen (CUs, RAM, Video- und JPEG-Engine, L2-Cache und DMA-Engines) h\u00e4lftig und bei CPX sind es vier Nutzer. Im CPX-Modus konkurrieren zwei Partitionen um jeweils eine Video- und einen Zehnerblock JPEG-Engines. Die sollten aber noch \u00fcber genug Reserven verf\u00fcgen, denn der komplette Chip etwa schafft 99 AV1-Streams (1080p30, 4:2:0) und 4425 JPEG-Bilder pro Sekunde in 1080p.<\/p>\n<p>Hohe Rechenleistung<\/p>\n<p>        Weiterlesen nach der Anzeige<\/p>\n<p>Konkrete Leistungseinsch\u00e4tzungen teilte AMD im Vorfeld nicht, aber die theoretische Rechenleistung \u2013 multipliziert aus Anzahl der Ausf\u00fchrungseinheiten und der Taktfrequenz \u2013 liegt mit FP8-Genauigkeit bei 2300 Teraflops (dicht besetzte Matrizen, mit Sparsity verdoppelt sich der jeweilige Wert grob). MXFP4 verdoppelt diese Rate auf 4600 Tflops, MXFP6, anders als etwa bei Nvidia, ebenso. Damit liegt die theoretische Rechenleistung bei etwas weniger als der H\u00e4lfte einer MI355X. Nvidias H200 NVL schafft auf dem Papier bei voll besetzten Matrizen rund 1670 Tflops (mit Sparsity dann 3340 Tflops).<\/p>\n<p>AMD liefert auch eine Einsch\u00e4tzung zum tats\u00e4chlich erreichten Durchsatz, in den auch Speichertransfers und Begrenzungen durch die Leistungsaufnahme einflie\u00dfen. Demnach liegt die Instinct MI350P zwischen 60 und 70 Prozent ihrer maximalen Durchsatzraten. Der Ausrei\u00dfer nach unten ist MXFP6 mit 40 Prozent des theoretischen Durchsatzes, sodass der Wert nur um ein gutes Drittel steigt, statt sich im Vergleich zur (MX)FP8 zu verdoppeln.<\/p>\n<p>      <a href=\"https:\/\/www.heise.de\/imgs\/18\/5\/0\/7\/8\/1\/4\/4\/Rechendurchsatz-981ba1a3911e53b0.png\" rel=\"nofollow noopener\" target=\"_blank\"><\/p>\n<p>  <img loading=\"lazy\" decoding=\"async\" alt=\"\" height=\"946\" src=\"data:image\/svg+xml,%3Csvg xmlns='http:\/\/www.w3.org\/2000\/svg' width='696px' height='391px' viewBox='0 0 696 391'%3E%3Crect x='0' y='0' width='696' height='391' fill='%23f2f2f2'%3E%3C\/rect%3E%3C\/svg%3E\" style=\"aspect-ratio: 1687 \/ 946; object-fit: cover;\" width=\"1687\"\/><\/p>\n<p>      <\/a><\/p>\n<p>Die theoretische und praktisch erzielbare Rechenleistung der Instinct MI350P weicht zum Teil deutlich voneinander ab. Gr\u00fcnde sind unter anderem die verf\u00fcgbare elektrische Leistung sowie die n\u00f6tigen Speicher- und Bustransfers.<\/p>\n<p class=\"a-caption__source\">\n      (Bild:\u00a0AMD)\n    <\/p>\n<p>(<a class=\"redakteurskuerzel__link\" href=\"https:\/\/www.heise.de\/news\/mailto:csp@heise.de\" title=\"Carsten Spille\" rel=\"nofollow noopener\" target=\"_blank\">csp<\/a>)<\/p>\n<p>\n      Dieser Link ist leider nicht mehr g\u00fcltig.\n    <\/p>\n<p>Links zu verschenkten Artikeln werden ung\u00fcltig,<br \/>\n      wenn diese \u00e4lter als 7\u00a0Tage sind oder zu oft aufgerufen wurden.\n    <\/p>\n<p><strong>Sie ben\u00f6tigen ein heise+ Paket, um diesen Artikel zu lesen. Jetzt eine Woche unverbindlich testen \u2013 ohne Verpflichtung!<\/strong><\/p>\n","protected":false},"excerpt":{"rendered":"close notice This article is also available in English. It was translated with technical assistance and editorially reviewed&hellip;\n","protected":false},"author":2,"featured_media":1001227,"comment_status":"","ping_status":"","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[135],"tags":[21202,215501,29,30,196,1256,216156,53348,190,189,194,191,193,192],"class_list":{"0":"post-1001226","1":"post","2":"type-post","3":"status-publish","4":"format-standard","5":"has-post-thumbnail","7":"category-wissenschaft-technik","8":"tag-amd","9":"tag-amd-instinct","10":"tag-deutschland","11":"tag-germany","12":"tag-it","13":"tag-kuenstliche-intelligenz","14":"tag-mi350p","15":"tag-pci-express","16":"tag-science","17":"tag-science-technology","18":"tag-technik","19":"tag-technology","20":"tag-wissenschaft","21":"tag-wissenschaft-technik"},"share_on_mastodon":{"url":"https:\/\/pubeurope.com\/@de\/116533490370410671","error":""},"_links":{"self":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts\/1001226","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/comments?post=1001226"}],"version-history":[{"count":0,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/posts\/1001226\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/media\/1001227"}],"wp:attachment":[{"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/media?parent=1001226"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/categories?post=1001226"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.europesays.com\/de\/wp-json\/wp\/v2\/tags?post=1001226"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}