
Hiper ölçekleyiciler ve diğerleri olarak veri merkezi operatörler, üretim için gereken kapasiteyi sağlama çabalarını hızlandırıyor yapay zeka ve büyük ölçekli model eğitimi, veri merkezlerinin en son GPU teknolojileri için modernleştirilmesi, belirleyici bir zorluk haline geldi.
Son derece gelişmiş hızlandırıcılara geçiş, güç, soğutma ve yüksek hızlı bağlantıda radikal iyileştirmeler gerektiriyor. Birkaç yıl önce bile son teknoloji olarak kabul edilen şeyler artık günümüzün yapay zeka iş yüklerini desteklemeye yetmiyor, operatörleri raf tasarımından termal stratejiye kadar her şeyi yeniden düşünmeye zorluyor.
Onnec’te Veri Merkezi Direktörü.
Küresel yatırımın ölçeği bu pivotu yansıtıyor. McKinsey, veri merkezi harcamalarının 2030 yılına kadar 6,7 trilyon dolara ulaşacağını ve çoğunluğun yapay zeka için özel olarak tasarlanmış tesislere aktarılacağını tahmin ediyor.
Ancak sektörün hızlı büyümesi halihazırda büyük kısıtlamalarla karşı karşıya: GPU’lar ve ara bağlantılar için tedarik zinciri darboğazları, yoğunluğu kısıtlayan tasarım sınırlamaları ve karmaşık yapıları destekleyebilecek vasıflı mühendis eksikliği.
Bu baskılar, “neocloud” sağlayıcılarının yükselişini hızlandırdı. işletme modeller tamamen yüksek performanslı GPU hesaplaması etrafında dönüyor.
Bir neocloud dalgalanması
Neocloud’lar, veri merkezi altyapısını yeniden şekillendiren en dinamik güçlerden biri haline geldi. Yapay zeka kapasitesini daha geniş bulut taleplerine göre dengelemesi gereken geleneksel operatörlerin aksine, bu firmalar etrafındaki her şeyi tasarlıyor GPU hızlanma.
Üretken yapay zekaya olan talebin mevcut veri merkezlerinin yükseltilebileceğinden daha hızlı büyümesiyle birlikte, neocloud’lar olağanüstü hızda konuşlandırılarak ve rekabetçi fiyatlarda yüksek performanslı bilgi işlem sunarak ivme kazanıyor.
Bu projelerin ölçeği ve iddiası emsalsizdir. Örneğin CoreWeave, mütevazı dağıtımlardan yapı başına onbinlerce GPU’ya kadar hızlı bir şekilde büyümüştür ve bu da kullanıma sunulmasıyla tamamlanmıştır. NVIDIAGB300 NVL72 sistemleri.
Önceki nesillere kıyasla on kata kadar daha fazla yanıt verme ve enerji verimliliğinde önemli iyileşmeler gibi çarpıcı performans kazanımları elde edildi. Bu arada, NScale’in Norveç’teki 230 megavatlık tesisi, 2026 yılına kadar tamamen yenilenebilir enerjiyle çalışan 100.000 GPU sunmayı hedefliyor.
Nebius milyarlarca dolarlık GPU ile pazar iştahının boyutunu vurguladı altyapı ile anlaşma Microsoftpazar konumunu anında değiştiren bir anlaşma.
Motivasyon, kapasiteye yönelik teknik bir yarışın çok ötesine uzanıyor. Milletler giderek artan bir şekilde yapay zeka altyapısını uzun vadeli rekabet gücünün bir dayanağı olarak görüyor. Hızlı bir şekilde konuşlandırılabilen ülkeler, yatırım ve yetenek çekmeye hazır. Çok yavaş hareket edenler fırsatların başka yere gitmesini izleme riskiyle karşı karşıya kalırlar.
Mühendislik darboğazları
Yapay zekaya hazır altyapı oluşturmak, yeni inşa edilen tesislerin bile sınırlarını ortaya çıkarıyor. Güç yoğunluğu gereksinimleri keskin bir şekilde artarken, soğutma ve bant genişliği kısıtlamaları sıklıkla toptan yeniden tasarımlara ihtiyaç duyuyor.
Pek çok operatör, yenileme çalışmalarının beklenenden daha maliyetli veya daha yıkıcı olabileceği, bunun da projelerin gecikmesine veya genişletmelerin iptal edilmesine yol açabileceği rahatsız edici gerçekle karşı karşıyadır.
En önemli değişim, geleneksel hava soğutmalı sistemlerden, özellikle doğrudan çipe olmak üzere çeşitli sıvı soğutma biçimlerine geçiştir.
Bu sistemler, yoğun GPU kümelerinin kabul edilebilir termal sınırlar dahilinde çalışmasına olanak tanır, ancak sıvı dağıtımı ve güç entegrasyonu ve güvenlik protokollerinin muhafaza edilmesi gibi tamamen yeni tesis hususları gerektirir.
Bağlantı, başka bir kritik zorluğu da beraberinde getiriyor. Yapay zeka iş yükleri, GPU’lar arasındaki büyük doğu-batı trafik akışlarına bağlı olup InfiniBand ve gelişmiş gibi ara bağlantı teknolojilerini zorlar. lif Optik sınırlara kadar.
Bu bileşenlerin tedariki küresel olarak kısıtlı olmaya devam ederken, kurulumun kendisi uzmanlık becerileri ve dikkatli bir koordinasyon gerektiriyor. Yoğun GPU kumaşları yalnızca onları destekleyen kablolar kadar güçlüdür; kötü tasarlanmış veya ucuz dağıtımlar hızla performansta tıkanma noktaları haline gelir.
Karmaşıklıktaki bu artış, iş gücü gereksinimlerinde de yansımaktadır. Yapay zeka veri merkezi yapıları rutin olarak geleneksel projelere göre birkaç kat daha fazla insan gücü gerektirir ve genellikle fiber, güç ve soğutma konusunda uzmanlaşmış ekiplerin katılımını gerektirir.
Hızı, kaliteyi ve güvenliği korurken bu disiplinleri koordine etmek, yapay zeka çağının belirleyici bir operasyonel zorluğu haline geldi.
Doğru ortaklar neden önemlidir?
Bu nedenle veri merkezi operatörleri, teknik derinlik, küresel deneyim ve operasyonel ölçek sunabilen güvenilir iş ortaklarına giderek daha fazla yöneliyor. Boyutu ne olursa olsun hiçbir operatör yapay zeka projelerinin tüm yükünü tek başına üstlenemez.
Güçlü ortaklar, mühendislik, lojistik, uyumluluk ve iş gücü mobilizasyonu arasındaki boşlukların kapatılmasına yardımcı olarak operatörlerin kaliteden veya esneklikten ödün vermeden hızlı hareket etmelerine olanak tanır.
Bu ortaklar çeşitli kritik yollarla katkıda bulunmaktadır. Yüksek yoğunluklu kablolama mimarilerine, gelişmiş soğutma çözümlerine ve GPU kümesi entegrasyonuna olan aşinalıkları, yeni nesil yapay zeka sistemlerinin taleplerini karşılayan yükseltmeleri tasarlamalarına ve yürütmelerine olanak tanıyor.
Ayrıca yerel düzenleyici ve izin veren ortamlarda gezinmeye yardımcı olarak inşaatları durdurabilecek veya geciktirebilecek riskleri azaltırlar. Operasyonel tarafta, büyük ve yetenekli ekipleri hızla harekete geçirebilirler.
Bu, mühendislerin kaynak bulma, eğitim ve koordinasyonunu sağlarken sağlık ve güvenliğin sağlanması ve kalite kontrolün hızlandırılmış zaman çizelgeleri altında sağlam kalması anlamına gelir.
Kısacası, derin teknik kapasiteye ve çevik teslimat modellerine sahip iş ortaklarından yararlanma yeteneği, kağıt üzerinde iddialı bir tasarım ile işleyen bir yapay zeka arasındaki fark olabilir. veri merkez ticari iş yüklerine hazır.
Altyapı yarışını kazanmak
Yapay zekaya hazır veri merkezleri oluşturma yarışı artık en yeni GPU’ların dağıtımıyla ilgili değil. Teknoloji, düzenleme, işgücü ve tedarik zincirleri arasındaki koordinasyonun testidir. Güçlü iç liderliği doğru dış ortaklıklarla birleştiren operatörler, kapasiteyi hızlı ve güvenilir bir şekilde çevrimiçi hale getirmek için en iyi konumda olacaktır.
GPU bilişimine yönelik küresel talep, arzı aşmaya devam ederken, gelişmiş altyapıyı hızlı bir şekilde sunabilenler, belirleyici bir rekabet avantajı elde edecek. Hiper ölçekli yapay zekanın bu yeni çağında, işbirliği ve yetenek kimin liderlik edeceğini belirleyecektir.
En iyi veri taşıma aracını sunduk.
Bu makale, günümüz teknoloji endüstrisindeki en iyi ve en parlak beyinleri öne çıkardığımız TechRadarPro’nun Expert Insights kanalının bir parçası olarak üretildi. Burada ifade edilen görüşler yazara aittir ve mutlaka TechRadarPro veya Future plc’ye ait değildir. Katkıda bulunmak istiyorsanız buradan daha fazla bilgi edinin: https://www.techradar.com/news/submit-your-story-to-techradar-pro
