AI Sunucuları Daha Yüksek Soğutma Teknolojisi Talep Ettiğinde! Trend Neden "Hava Soğutma"dan "Sıvı Soğutma"ya Kayıyor?
Aug 23, 2024
Mesaj bırakın
NVIDIA CEO'su Jensen Huang, Supermicro Başkanı Charles Liang'ın konuşmasını desteklemek için COMPUTEX 2023'te özel bir görünüm sergiledi. Fanner Başkanı Lin Yushen, sahnede sergilenen sunucu ürünlerinin çoğunun Fanner'ın su soğutma modüllerini içerdiğini belirtti. Uzun yıllardır su soğutma modüllerine yatırım yapan Fanner, bu AI dalgasından yararlanmak için iyi bir konumda. Ancak, AI sunucuları giderek daha yüksek soğutma standartları talep ederken, trend neden "hava soğutma"dan "sıvı soğutma"ya kayıyor?
I Yüksek Hızlı İşlemden Sıvı Soğutmaya
Soğutma teknolojisi açısından, Lin Yushen mevcut soğutma modüllerinin çoğunlukla ısı borularını içeren hibrit soğutma teknolojisini kullandığını belirtti. Bu ısı borulu soğutma modülleri, dahili elektronik bileşenler için dengeli bir termal ortam yaratmak amacıyla fanlar, ısı emiciler ve ısı boruları gibi bileşenleri bir araya getirerek elektronik cihazların kararlılığını artırır. Ancak, alt akış terminal elektronik ürünleri daha çok işlevli ve kompakt hale geldikçe, soğutma modülü üreticileri buhar odaları ve ısı boruları merkezli soğutma çözümleri tasarlamaya yöneldi.
Günümüzde soğutma modülleri iki türe ayrılır: "hava soğutma" ve "sıvı soğutma." Hava soğutma, ısıyı ileten termal arayüz malzemeleri, buhar odaları (VC'ler) veya ısı boruları gibi malzemelerle bir ortam olarak havayı kullanır ve bu daha sonra hava konveksiyonu yoluyla ısı emiciler veya fanlar aracılığıyla dağıtılır. Buna karşılık, sıvı soğutma, yongaları daha verimli bir şekilde soğutan daldırma soğutması da dahil olmak üzere sıvı konveksiyonu yoluyla ısıyı dağıtır. Ancak yongalar daha fazla ısı üretip küçüldükçe ve termal tasarım gücü (TDP) arttıkça, hava soğutma giderek yetersiz hale gelir.

▲ Hava soğutma ve sıvı soğutma teknolojileri arasında bir karşılaştırma
ChatGPT'nin yükselişiyle birlikte, üretken AI sunucu sevkiyatlarında bir artışa yol açtı ve bu da soğutma modülleri için yükseltilmiş özelliklere yol açarak, sunucu soğutma ve kararlılığı için sıkı gereklilikleri karşılamak üzere sıvı soğutma çözümlerine doğru itti. Lin Yushen, Fanner'ın hava soğutma teknolojisiyle başladığını ve on yıl kadar önce IBM teknoloji transferi yoluyla sıvı soğutma teknolojisi edinmeye başladığını vurguladı. Müşterilerin mevcut veri merkezi altyapısını değiştirmeden dolaplara su soğutma eklemelerine olanak tanıyan su soğutma arka kapıları sağladılar.
II 2025'e Kadar Eş Zamanlı Hava ve Sıvı Soğutmanın Yeni Bir Çağı
Yapay zeka uygulamalarıyla ilgili yarı iletken teknolojisinin gelişmesiyle yönlendirilen ChatGPT'de GPT-3'nin tanıtılması, yapay zeka algoritma parametrelerini 175 milyara çıkararak GPU hesaplama gücünde yüz kat artış gerektirdi. Sektör, yüksek yoğunluklu sunucuların veya bileşenlerin ısı dağılımı zorluklarını çözmek için öncelikle sıvı soğutma içinde tek fazlı daldırma soğutma teknolojisini kullanıyor. Ancak bu yöntemin 600W sınırı varken, ChatGPT veya daha gelişmiş sunucular için soğutma ihtiyaçları 700W'ı aşıyor.

▲ Tek fazlı daldırma soğutma teknolojisinin çizimi
IoT, uç bilişim ve 5G uygulamalarının geliştirilmesiyle birlikte, veri AI küresel bilişim gücünü yüksek büyüme aşamasına taşıyor. Yeni nesil soğutma modülü tasarımları iki ana yönü izleyecek: mevcut soğutma modüllerini 3D buhar odalarıyla (3DVC) yükseltmek veya soğutma verimliliğini artırmak için termal konveksiyon ortamı olarak sıvı kullanan sıvı soğutma sistemlerini tanıtmak. Sonuç olarak, sıvı soğutma testlerinin sayısı 2023'te önemli ölçüde arttı. Ancak, 3DVC nihayetinde bir geçiş çözümüdür ve 2024-2025 itibarıyla eş zamanlı hava ve sıvı soğutma döneminin başlaması bekleniyor.
TrendForce'a göre, 2022'de GPGPU'larla (Genel Amaçlı GPU'lar) donatılmış AI sunucuları toplam sevkiyatların yaklaşık %1'ini oluşturuyordu. Ancak ChatGPT uygulamasıyla yönlendirilen AI sunucu sevkiyatlarının 2023'te %38,4 oranında büyümesi ve 2022 ile 2026 arasındaki AI sunucu sevkiyatlarının bileşik yıllık büyüme oranının %29'a ulaşması bekleniyor.
III "Sıvı Soğutma" Yapay Zeka Çipleri İçin Ana Akım Olacak
Yeni nesil sunucuların TDP'si hava soğutmanın sınırlarına yaklaşırken, önde gelen teknoloji şirketleri sıvı soğutmayı test etmeye veya soğutma alanını artırmaya başlıyor. Örneğin, Intel'in Eagle Stream'i ve AMD'nin Genoa TDP'si 350-400W hava soğutmanın sınırlarına ulaşarak sıvı soğutmayı AI çipleri için ana akım çözüm haline getirdi. NVIDIA'nın H100'ü 700W TDP'ye sahip ve 3DVC kullanan hava soğutması genellikle 4U'dan fazla alan gerektiriyor ve bu da yüksek yoğunluklu dağıtım mimarileri için uygun değil.

▲ NVIDIA'nın H100'ü
Soğutma sistemlerinin veri merkezlerindeki toplam enerji tüketiminin yaklaşık %33'ünü oluşturduğu göz önüne alındığında, toplam güç tüketimini azaltmak ve Güç Kullanım Etkinliğini (PUE) iyileştirmek, soğutma sistemlerini, BT ekipmanlarını optimize etmeyi ve yenilenebilir enerji kullanmayı içerir. Suyun termal kapasitesi havanın dört katı olduğundan, sıvı soğutma sistemlerini uygulamak sıvı soğutma plakası için yalnızca 1U alan gerektirir. NVIDIA'nın testlerine göre, aynı bilgi işlem gücünü elde etmek için sıvı soğutma, gereken kabin sayısını %66, enerji tüketimini %28 ve PUE'yi 1,6'dan 1,15'e düşürebilirken, aynı zamanda bilgi işlem performansını da iyileştirebilir.
IV Supermicro'nun Fanner Soğutma Modüllerini Kullanması Çok Önemli
Sıvı soğutma, "su soğutma" ve "yağ soğutma" olarak daha da ayrılır ve şu anda en yaygın kullanılan su soğutmadır. Lin Yushen, neredeyse tüm AI sunucularının artık su soğutma çözümleri kullandığını belirtti. Örneğin, 700W'ı aşan bir TDP'ye sahip NVIDIA'nın GH100'ü su soğutma kullanmak zorundadır. Su soğutma şu anda Fanner'ın gelirinin küçük bir bölümünü oluşturmasına rağmen, AI sunucularının ortalama satış fiyatı (ASP), geleneksel sunucularınkinden on kat daha yüksektir ve bu, yılın ikinci yarısında Fanner'ın ürün yapısını dönüştürmeye yardımcı olacaktır. AI sunucularının 2023'te işlerinin %5-10'ini oluşturabileceği tahmin edilmektedir.
Lin Yushen, Supermicro'nun NVIDIA GH100 GPU'larla donatılmış sunucular için Fanner'dan su soğutma modüllerini kullanmasının temel nedeninin, Fanner'ın on yıldan uzun süredir sıvı soğutma çözümleri üzerinde çalışıyor olması olduğunu vurguladı. Su soğutmayı uygulamanın zorlukları esas olarak maliyetler ve sızıntı önlemeyle ilgili olsa da, Fanner'ın on yılı aşkın araştırması bu sızıntı sorunlarının kademeli olarak üstesinden geldi. Fanner'ın su soğutma modüllerine yaptığı uzun vadeli yatırım, onları bu AI dalgasından yararlanmaya konumlandırdı.

▲ Supermicro Özel Sıvı Soğutma
Lin Yushen, yüksek hızlı bilgi işlem ve yapay zeka sunucularının artan soğutma talepleri tarafından yönlendirilen TDP'deki sürekli artışın, geleneksel ısı borusu soğutmasını sınırlarına kadar zorladığını ve su soğutma modüllerinin benimsenmesini gerektirdiğini vurguladı. Fanner'ın halihazırda çözümlerini benimseyen Supermicro ve Meta dahil olmak üzere birkaç müşterisi var. Su soğutmanın beklenenden daha hızlı benimsenmesine rağmen, 2023'te tam olarak uygulanması olası değil. Ancak, 2024'e kadar önemli bir atılım görmesi bekleniyor ve 2025'te patlayıcı bir büyüme bekleniyor.
