Intel Gaudi 3: KI-Beschleuniger mit 128 GB offiziell vorgestellt

Share

Intel hat seinen neuesten KI-Beschleuniger, den Gaudi 3, offiziell vorgestellt. Das hochmoderne Gerät basiert auf einem 5nm-Prozess und ist ein direkter Konkurrent des H100 von NVIDIA.

50 % schneller als NVIDIA, 40 % effizienter und 900 Watt

Der Gaudi 3 ist 50 % schneller in der KI-Leistung als das Angebot von Nvidia und gleichzeitig 40 % effizienter, mit einem maximalen Stromverbrauch von 900 Watt.

Intels Gaudi KI-Beschleuniger haben sich als starke Konkurrenten und einzigartige Alternativen zu NVIDIAs Grafikprozessoren im KI-Bereich etabliert. Kürzlich durchgeführte Benchmark-Vergleiche zwischen dem älteren Gaudi 2 und den A100- und H100-GPUs von NVIDIA haben gezeigt, dass Intel bei Leistung und Preis die Nase vorn hat, während NVIDIA bei der Leistung die Nase vorn hat.

128 GB HBM2e DRAM

Mit der Einführung des Gaudi 3-Beschleunigers beginnt nun das dritte Kapitel von Intels KI-Abenteuer. Der Gaudi-3-Beschleuniger verfügt über die neueste Tensor-Core-Architektur (5. Generation) mit insgesamt 64 Tensor-Cores, die auf zwei Compute-Dies verteilt sind. Der Chip selbst enthält einen 96 MB großen Cache-Pool, der von beiden Dies gemeinsam genutzt wird, sowie acht HBM-Sites, die jeweils mit 8-hi-Stapeln von 16 GB HBM2e DRAM bestückt sind, was eine Gesamtkapazität von bis zu 128 GB ergibt. Der Chip wird mit TSMCs 5-nm-Prozesstechnologie hergestellt und bietet insgesamt 24 200-GbE-Anschlüsse.

Bis zu 600 W TDP bei passiver Kühlung

Die Intel Gaudi 3 KI-Beschleuniger sind im Mezzanine OAM (HL-325L) Formfaktor erhältlich, mit Varianten, die standardmäßig bis zu 900W und flüssig gekühlt über 900W unterstützen, sowie als PCIe AIC mit voller Höhe, doppelter Breite und 10,5 Zoll (ca. 27 cm) Länge. Die Gaudi 3 HL-338 PCIe Karten sind passiv gekühlt und unterstützen bis zu 600W TDP mit den gleichen Spezifikationen wie die OAM-Version.

Auf der Intel Vision Konferenz wurde der Intel Gaudi 3 KI-Beschleuniger vorgestellt, der im Vergleich zu seinem Vorgänger die vierfache KI-Rechenleistung für BF16, die 1,5-fache Speicherbandbreite und die doppelte Netzwerkbandbreite für massives System-Scale-out bietet. Dies stellt einen bedeutenden Sprung in der Leistung und Produktivität für das Training und die Inferenz von KI auf populären großen Sprachmodellen (LLMs) und multimodalen Modellen dar.

Fazit

Der Intel Gaudi 3 Beschleuniger wird diese Anforderungen erfüllen und dank offener, Community-basierter Software und offenem Industriestandard Ethernet vielseitig einsetzbar sein, sodass Unternehmen ihre KI-Systeme und -Anwendungen flexibel skalieren können.