Supermicro ve Nvidia Simülasyonlarını Hızlandıracak Çözümler Üretiyor

Supermicro ve Nvidia Simülasyonlarını Hızlandıracak Çözümler Üretiyor

 

Supermicro ve Nvidia Simülasyonlarını Hızlandıracak Çözümler Üretiyor.

Nvidia Veri Merkezi GPU’larına sahip Supermicro Sunucular, CFD Simülasyonları için Önemli Hızlandırma Sağlayarak Üretim İşletmelerinin Pazara Çıkış Süresini Kısaltıyor.

 

Yönetici Özeti

Otomotiv şirketleri araç geliştirme süresini kısaltmaya ve yeni araçları pazara daha hızlı sunmaya çalıştıkça, otomotiv geliştirme için bilgisayar destekli mühendisliğe duyulan ihtiyaç da artmaktadır. Yüksek performanslı bilgi işlem (HPC) alanındaki son gelişmelerden biri, karbon ayak izini ve maliyeti azaltırken hesaplama süresini önemli ölçüde hızlandırmak için hesaplamalı akışkanlar dinamiği (CFD) için GPU’lardan yararlanmak olmuştur.
Supermicro ve NVIDIA, optimum donanım yapılandırmalarına sahip HPC uygulamaları için bir referans mimari geliştirmek üzere ortaklık kurdu. Bu Çözüm Özeti’nde, Hesaplamalı Akışkanlar Dinamiği (CFD) için GPU hızlandırmadan en iyi şekilde yararlanmak için temel gereksinimleri gözden geçireceğiz.

 

Simülasyon Yoluyla Araç Tasarımının İyileştirilmesi

Araç verimliliğini, maliyetini ve konforunu iyileştirme ihtiyacı otomotiv endüstrisinde kritik hedeflerdir. Hibrit ve elektrikli araçlara geçişle birlikte, araç menzilinin iyileştirilmesi özellikle önemli hale gelmiştir. Menzilin sürtünme ile doğru orantılı olduğu düşünüldüğünde, araç tasarımının erken aşamalarında sürtünmeyi anlamak ve azaltmak kritik önem taşımaktadır. Bilgisayar Destekli Mühendislik (CAE), mühendislerin pahalı ve zaman alıcı prototipler oluşturmaya gerek kalmadan değişiklikleri hızlı bir şekilde değerlendirmelerini sağlar. Siemens Simcenter STAR-CCM+ gibi Hesaplamalı Akışkanlar Dinamiği (CFD) araçları, mühendislik profesyonellerinin aerodinamik performansı hemen anlamalarına olanak tanır. GPU performansını değerlendirmek için standart bir otomotiv CFD kıyaslama vakası kullanılır

 

GPU’ları Kullanarak Simülasyonda Yeni Dönem

2021 yılında araç mühendisleri arasında yapılan bir ankete katılanların %52’si, tasarım döngülerini tamamlamak için gereken süreyi azaltma taleplerinin işlerinin en zorlu yönlerinden biri olduğunu ifade etmiştir. Bu artan hızlandırma ihtiyacını karşılamak için NVIDIA, son 15 yılda GPU’ların devasa paralel işleme gücünün ve bellek ile GPU çekirdekleri arasındaki ışık hızındaki arayüzün avantajlarını araç simülasyonuna getirmek için simülasyon yazılımı liderleriyle yakın bir şekilde çalıştı. Önde gelen simülasyon yazılımı sağlayıcıları, araç simülasyonu uygulamalarını GPU’larda çalıştırarak uygulamalarının 30 kata kadar hızlandığını göstermiş, böylece mühendis üretkenliğini artırmış ve araçların piyasaya sürülme süresini kısaltmaya yardımcı olmuştur.

 

Daha Azıyla Daha Fazlasını Yapmak – Simülasyon için Sermaye Harcamalarının İyileştirilmesi

Artan hesaplama verimliliği, iş yükü hızlandırmadan daha fazlası anlamına gelir, ancak aynı derecede önemli olarak, daha küçük bir sermaye harcaması ayak izi içermelidir. Bilgisayar destekli mühendislik için GPU’ların inanılmaz verimliliği, otomotiv müşterileri için büyük altyapı maliyeti tasarrufu sağlar. Modern sunuculara 10 adede kadar çift yuvalı GPU sığabildiğinden, hesaplama açısından ağır iş yüklerinin GPU’lara aktarılması, müşterilerin büyük miktarda sunucu konsolidasyonu elde etmesini sağlar. Supermicro ve NVIDIA arasındaki ortak çalışma sayesinde, 10 NVIDIA H100 GPU’lu tek bir sunucunun Siemens Simcenter STAR-CCM+ gibi CFD iş yükleri için her biri 2 x CPU’ya sahip 30 sunucunun yerini aldığını gösterdik. Eşdeğer performans için bu, 3 kat maliyet tasarrufu sağlar.

 

Hızlandırılmış Bilgi İşlem Sürdürülebilir Bilgi İşlemdir

Her ne kadar dikkatler araç egzoz emisyonlarının ve elektrikli araç güç tüketiminin azaltılmasına odaklansa da, tüm araç tasarımı, test ve üretim iş akışları boyunca karbon ayak izinin azaltılması da aynı derecede önemlidir. Bilgisayar destekli mühendislik için NVIDIA GPU’lara sahip Supermicro sunucularının üçüncü değer önerisi, hesaplama açısından ağır olan bu iş yükleri için gerekli olan hesaplama gücünde sağladığı inanılmaz tasarruftur. Performans sonuçları bölümünde gösterildiği gibi, eşdeğer performans için NVIDIA GPU’lar üzerinde çalıştırıldığında 5 kat güç tasarrufu sağlanır.

 

İş Yükünüz için En Uygun Sunucuyu Yapılandırma

Supermicro’nun sunucuları, destekledikleri GPU sayısındaki çok yönlülükleri nedeniyle CAE için idealdir. NVIDIA, çift hassasiyetli (FP64) hesaplama ve yüksek bellek bant genişliği ihtiyaçları nedeniyle CAE uygulamaları için 100 ve 200 sınıfı ürünlerin (NVIDIA A100, NVIDIA H100, NVIDIA H200, NVIDIA B100) kullanılmasını önermektedir.
Sistem için doğru GPU sayısına karar vermek için GPU bellek boyutu kritik bir faktördür. CFD için, ağ boyutu genellikle bir simülasyonun boyutunun bir ölçüsü olarak kullanılır. Kullanılan toplam GPU belleği de kullanılan fiziğin karmaşıklığına göre belirlenir. Genel bir kural olarak, fiziğin karmaşıklığına bağlı olarak gerekli belleğin ağ boyutunun 1,2-5 katı arasında olabileceğini söyleyebiliriz. Örneğin, fizik açısından nispeten basit bir durum için, 100 milyon hücreli bir ağ (100×1.5) için 150 GB belleğe ihtiyacımız olacaktır. A100 ve H100’ün 80 GB belleğe sahip olduğu göz önüne alındığında, en az iki GPU’ya ihtiyaç duyarlar, ancak 3 GPU tavsiye edilir. Yazılım satıcıları, yazılımları için bellek gereksinimleri konusunda ek rehberlik sağlayabilir.

 

Uygulama Desteği

En önemli sorulardan biri, tercih ettiğiniz CFD aracının GPU hızlandırmayı destekleyip desteklemediğidir. Son birkaç yılda hem ana akım CAE yazılımlarından hem de yeni kurulan şirketlerden GPU çözücü desteğinin çoğaldığı görülmüştür. Simüle etmeyi düşündüğünüz fiziğin GPU hızlandırmalı olup olmadığını öğrenmek için yazılım satıcınıza danışın. Çözücünün büyük bir kısmı GPU üzerinde çalışır. CFD kodlarının çözücünün yalnızca bir kısmını hızlandırdığı birkaç yıl öncesine kıyasla çok iyi hızlanmanın nedeni, çözücüyü yüksek paralel GPU’larda çalıştırmaktır.

 

Supermicro Çözümü – Supermicro SYS-521GE-TNRT

Supermicro SYS-521GE-TNRT Sunucu (2 CPU, 10 x NVIDIA H100 PCIe GPU)
Supermicro SYS-521GE-TNRT sunucu, 10 adede kadar PCIe NVIDIA H100 GPU’yu barındıracak şekilde tasarlanmıştır. CPU’lar 4. veya 5. Nesil Intel Xeon işlemciler olabilir ve 8 TB’a kadar bellek tutabilir.

Test Vakası Detayları

  • Standart AeroSUV dış aerodinamik test örneği (AeroSUV by FKFS, Stuttgart, Almanya https://www.sae.org/publications/technical-papers/content/2019-01-0646/)
  • Ağ boyutu – Sunucu: 57, 106, 320 milyon hücre
  • Karışık hassasiyet
  • Siemens Simcenter STAR-CCM+: Sürüm 23.06
  • Birleştirilmiş çözücü

 

Performans Sonuçları

Aşağıdaki grafik, çeşitli ağ boyutlarındaki aynı AeroSUV test örneğinin sunucu yapılandırmasındaki farklı sayıda H100 GPU üzerinde çalıştırılmasına ilişkin sonuçları göstermektedir. Gerekirse 57 milyon hücre vakasının 4’ten az GPU üzerinde çalıştırılabileceğini unutmayın.

Önemli Sonuçlar:

  • En küçük ağ boyutu (57 milyon hücre) için 4 NVIDIA H100 PCIe GPU, 94 CPU çekirdeğinden 6,6 kat daha hızlıdır
  • Orta ağ boyutu (106 milyon hücre) için 6 NVDIDIA H100 PCIe GPU, 94 CPU çekirdeğinden 9,5 kat daha hızlıdır
  • En büyük ağ boyutu (322 milyon hücre) için 10 NVIDIA H100 PCIe GPU, 94 CPU çekirdeğinden 29,3 kat daha hızlıdır
    Yukarıdaki sonuçlar, Supermicro donanımından yararlanan NVIDIA GPU’larda CFD simülasyonları çalıştırılarak elde edilebilecek geri dönüş süresindeki önemli iyileştirmeleri göstermektedir. GPU’ların kullanılması, daha kısa sürede daha fazla tasarımın değerlendirilmesine olanak tanıyarak daha optimize bir ürün elde edilmesini sağlar.

 

Fiyat Performansı ve Sürdürülebilirlik

Bir sunucudaki saf performansı karşılaştırmanın yanı sıra, genel fiyat performansını da göz önünde bulundurmak önemlidir. Bir GPU sunucusu (8-10 H100 GPU) ve bir CPU sunucusuna kıyasla ~30 kat hız artışı varsayıldığında, müşterilerin bir GPU sunucusunun performansını eşleştirmek için 30 CPU sunucusuna yatırım yapması gerekecektir. Bu sonuçlar doğrusal ölçeklendirmeyi varsaymaktadır. Bu nedenle, GPU üzerinde çalıştırıldığında, eşdeğer performans için CPU’dan 3 kat daha ucuz olacağını tahmin edebiliriz. Alternatif olarak, CPU ile aynı bütçeyi GPU’ya harcamak iş hacminde 3 kat iyileşme sağlar.
Benzer maliyet tasarrufları aynı performans için gereken güçte de görülebilir. Termal tasarım gücünden yola çıkarak, GPU performansını eşleştirmek için 30 sunucuya ihtiyaç duyulduğu düşünüldüğünde, bir GPU düğümü CPU düğümü başına ~500W’a kıyasla yaklaşık 3000W gerektirecektir. Bu da 5 kat güç tasarrufu anlamına gelmektedir.

 

Optimum Performans – Ölçeklendirme

Önceki bölümlerde, simülasyonu çalıştırmak için gereken minimum GPU sayısını tartıştık, ancak optimum sayı nedir? Aşağıda, 57 milyon hücre aerodinamik vakası için hızlanma ve bellek kullanımını gösteren grafikler yer almaktadır. Performansın yaklaşık 8 GPU’ya kadar ölçeklendiğini görebiliriz. GPU başına bellek kullanımına baktığımızı varsayalım. 6 GPU’nun altında bellek kullanımı GPU başına 20 GB’ın altında, yani GPU’ların kullanılabilir belleğinin %25’inden daha az. Sonuç olarak, bir vakayı çalıştırmak GPU belleğinin yalnızca küçük bir yüzdesini kullanıyorsa ölçeklendirme zarar görecektir. Bu nedenle, GPU belleğinin en az %25’inin dolu olması makul ölçeklendirmeyi sürdürmek için iyidir.

Hızlanma

Supermicro ve Nvidia Simülasyonlarını Hızlandıracak Çözümler Üretiyor.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir