B
blog
Misafir
Misafir
NVIDIA Blackwell, yeni bir hesaplama çağının kapılarını aralıyor!
NVIDIA bugün GTC açılış konuşmasında NVIDIA Blackwell platformunun geldiğini duyurdu. NVIDIA Blackwell, kuruluşlara her yerde trilyon-parametreli büyük dil modellerinde gerçek zamanlı üretken yapay zeka (Generative AI) inşa etme ve çalıştırma imkanı sağlayarak maliyeti ve enerji tüketimini önceki nesile göre % 25’e kadar azaltıyor.
- Yeni Blackwell GPU ve NVLink Trilyon-Parametre Ölçekli AI Modellerini Hızlandırıyor.
- Yeni Tensor Çekirdekleri ve TensorRT – LLM Derleyici, LLM çıkarım işletme maliyetini ve enerji kullanımını% 25’e kadar azaltıyor.
- Yeni hızlandırıcılar veri işleme, mühendislik simülasyonu, elektronik tasarım otomasyonu, bilgisayar destekli ilaç tasarımı ve kuantum hesaplama alanlarında çığır açıyor.
NVIDIA, yeni B200 GPU’nun 208 milyar transistörden oluşan 20 petaflop FP4 gücü sunduğunu ve bir Grace CPU ile birleştirilmiş iki GPU’lu bir GB200’ün LLM çıkarım iş yükleri için performansını 30 kat artırabileceğini ve muhtemelen oldukça daha verimli olabileceğini söylüyor. Blackwell, H100’e göre “maliyeti ve enerji tüketimini %25’e kadar azaltıyor.
Verilere göre, 1,8 trilyon parametreli bir modelin eğitimi önceden 8.000 Hopper GPU’su ve 15 megawatt güç gerektiriyordu. NVIDIA’nın CEO’su Jensen açılış konuşmasında, 2.000 Blackwell GPU’sunun saece dört megawatt tüketerek bunu yapabileceğini söylüyor.
175 milyar parametreli bir GPT-3 LLM benchmark’ında, NVIDIA GB200’ün bir H100’e göre yaklaşık yedi kat performansa sahip olduğunu söylüyor.
Blackwell’in devrim niteliğindeki altı teknolojisi şunları içeriyor:
Dünyanın En Güçlü Yongası – 208 milyar transistörle dolu olan Blackwell mimarisi GPU’ları, 10 TB/saniye çipten çipe bağlantıyla tek, birleşik bir GPU’ya bağlanan özel bir 4NP TSMC süreci kullanılarak üretilir.
İkinci Nesil Dönüştürücü Motor – Yeni mikro-tensor ölçekleme desteği ve NVIDIA’nın gelişmiş dinamik aralık yönetimi algoritmaları, Blackwell’un, yeni 4-bit kayan nokta AI çıkarım yetenekleri ile hesaplama ve model boyutlarını ikiye katlamasını destekleyecek.
Beşinci Nesil NVLink – Çok trilyon parametreli AI modellerinde performansı hızlandırmak için, NVIDIA NVLink’in en son sürümü, en karmaşık LLM’ler için 576 GPU’ya kadar yüksek hızlı iletişimi sağlayan devrim niteliğinde 1,8TB/saniye iki yönlü iletişim kapasitesi sunar.
RAS Motoru – Blackwell destekli GPU’lar, güvenilirlik, kullanılabilirlik ve hizmet sağlamlığı için ayrılmış bir motor içerir. Ayrıca, Blackwell mimarisi, AI tabanlı önleyici bakımı kullanarak teşhis koymak ve güvenilirlik sorunlarını tahmin etmek için yetenekler ekler. Bu, sistemin kesintisiz bir şekilde çalışmasını sağlar ve masif ölçekli AI dağıtımları için işletme maliyetlerini azaltır.
Güvenli AI(Secure AI) – Gelişmiş gizli hesaplama yetenekleri, AI modellerini ve müşteri verilerini performansı tehlikeye atmadan korur; sağlık ve finans gibi gizlilik açısından hassas endüstriler için yeni yerel arayüz şifreleme protokollerini destekler.
Sıkıştırma Motoru (Decompression Engine)– Ayrı bir sıkıştırma motoru, en son formatları destekleyerek, veri tabanı sorgularını hızlandırır ve veri analitiğinde ve veri biliminde en yüksek performansı sağlar. Şirketlerin yıllık onlarca milyar dolar harcadığı veri işlemenin, önümüzdeki yıllarda giderek daha çok GPU ile hızlandırılması bekleniyor.
Bu bağlantıyı görüntüleyebilmek için kayıt olmalı zaten üyeyseniz üye girişi yapmalısınız.