NVIDIA GTC 2025: Blackwell Ultra, Vera Rubin ve AI Fabrikaları

NVIDIA GTC 2025: Blackwell Ultra, Vera Rubin ve AI Fabrikaları

Jensen Huang'ın "AI Endüstri Devrimi" Vizyonu

NVIDIA GTC 2025, 17-21 Mart tarihleri arasında San Jose'de gerçekleşti. CEO Jensen Huang'ın 2 saatlik keynote'u, şirketin artık bir GPU üreticisi olmadığını—tam kapsamlı bir AI altyapı platformu olduğunu net bir şekilde ortaya koydu.

Huang'ın ana mesajı: Veri merkezleri artık "AI fabrikaları"na dönüşüyor; hammadde olarak veri alıp, çıktı olarak dijital zeka üretiyorlar.

Blackwell Ultra: Mevcut Nesilden %50 Daha Güçlü

Blackwell Ultra, orijinal Blackwell mimarisinin güçlendirilmiş versiyonu:

ÖzellikB200 (Blackwell)B300 (Blackwell Ultra)Artış
FP4 AI Performansı20 PFLOPS30 PFLOPS%50
HBM Bellek192GB HBM3e288GB HBM3e%50
Bellek BW8 TB/s8 TB/s-
NVLink BW1.8 TB/s1.8 TB/s-
TDP1000W1400W%40
ÜretimTSMC 4NPTSMC 4NP+-

Blackwell Ultra'nın 288GB HBM3e belleği, büyük dil modellerinin (LLM) daha verimli çalışmasını sağlıyor. Örneğin Llama 4 Maverick gibi 400B parametreli MoE modelleri, tek bir GPU üzerinde çalıştırılabiliyor.

GB300 NVL72: Rack-Scale AI Süper Bilgisayar

GTC 2025'in ana duyurusu GB300 NVL72 sistemi:

ÖzellikGB300 NVL72
Konfigürasyon36x GB300 Süper Çip (72x B300 GPU + 36x Grace CPU)
Toplam Bellek27 TB HBM3e
AI Performansı1.1 exaFLOPS (dense FP4)
Bağlantı259 TB/s NVLink 6
Güç Tüketimi~140 kW (sıvı soğutma)

GB200 NVL72 ile kıyaslandığında %50 artış. Tek bir raf, Frontier süperbilgisayarın (1.2 exaFLOPS) performansını geçiyor.

Vera Rubin: Gelecek Nesil Mimari (2026)

NVIDIA, Blackwell'in ardından gelecek nesil mimariyi de tanıttı: Vera Rubin (astronom Vera Rubin'den esinlenmiş).

ÖzellikBlackwell Ultra (2025)Vera Rubin (2026)Rubin Ultra (2027)
GPU mimarisiBlackwell+RubinRubin+
CPU mimarisiGrace (Arm)Vera (Arm)Vera+ (Arm)
HBM teknolojisiHBM3eHBM4HBM4e
ÜretimTSMC 4NP+TSMC 3nm özelTSMC 3nm+
NVLink nesliNVLink 6NVLink 7NVLink 7+

NVIDIA artık yıllık kadans ile yeni mimari çıkarıyor: Hopper (2022) → Blackwell (2024) → Blackwell Ultra (2025) → Vera Rubin (2026) → Vera Rubin Ultra (2027). Bu, Moore Yasası'nın ötesinde bir hız.

NVIDIA DGX SuperPOD ve DGX Cloud

DGX GB300 SuperPOD: 576 GPU'dan oluşan büyük ölçekli AI eğitim sistemi. 11.5 exaFLOPS FP4 AI performansı. xAI'ın Colossus kümesi gibi büyük AI laboratuvarlarının tercih edeceği sistem.

DGX Cloud güncellemeleri: NVIDIA'nın bulut AI platformu önemli güncellemeler aldı:

bash
1# DGX Cloud üzerinde model eğitimi başlatma
2# NVIDIA NeMo Framework ile
3
4# Ortam hazırlama
5pip install nemo-toolkit[all]
6
7# Llama fine-tuning konfigürasyonu
8cat > config.yaml << EOF
9model:
10  name: meta/llama-3.1-70b
11  precision: bf16
12training:
13  epochs: 3
14  batch_size: 4
15  learning_rate: 2e-5
16  lora:
17    rank: 16
18    alpha: 32
19data:
20  train: /data/train.jsonl
21  eval: /data/eval.jsonl
22infrastructure:
23  gpus: 8  # 8x B300 GPU
24  framework: nemo
25EOF
26
27# Eğitimi başlat
28nemo train --config config.yaml

NVIDIA Cosmos: Fiziksel AI İçin World Foundation Model

GTC 2025'in en vizyoner duyurusu Cosmos—fiziksel dünya simülasyonu için bir temel model:

  • Robotik eğitim: Robotlar sanal ortamda milyonlarca senaryo deneyerek gerçek dünyaya hazırlanıyor
  • Otonom sürüş: Milyarlarca mil sanal sürüş verisi üretme
  • Dijital ikiz: Fabrika ve lojistik operasyonlarının tam simülasyonu
  • Video üretimi: Fizik kurallarına uygun video oluşturma

Cosmos, OpenAI'ın Sora'sından farklı olarak "eğlence" değil "endüstriyel" kullanım hedefliyor.

NVIDIA Dynamo: AI Çıkarım Altyapısı

Yeni açık kaynak Dynamo framework'ü, AI model çıkarımını optimize ediyor:

python
1# NVIDIA Dynamo ile model serving
2# https://github.com/ai-dynamo
3
4from dynamo import serve
5
6# Otomatik optimizasyon: KV-cache, batching, quantization
7model = serve(
8    model_path="meta/llama-3.1-70b",
9    gpus=4,
10    optimization={
11        "kv_cache": "paged",
12        "batching": "continuous",
13        "quantization": "fp8",
14        "speculative_decoding": True
15    }
16)
17
18# Sonuç: 3x daha yüksek throughput, %40 düşük gecikme

Dynamo, NIM ve vLLM ile entegre çalışıyor.

Isaac GR00T N1: İnsansı Robot AI

NVIDIA'nın insansı robotlar için geliştirdiği GR00T N1 (Neural One) modeli:

  • Dil anlama + fiziksel eylem planlama
  • Simülasyondan gerçeğe transfer (sim-to-real)
  • 50'den fazla robot üreticisiyle ortaklık
  • Isaac Lab simülasyon ortamında eğitim
Robot OrtağıRobot ModeliKullanım Alanı
FigureFigure 02Fabrika montajı
AgilityDigitLojistik
1XNEOEv yardımcısı
UnitreeH1Araştırma
Boston DynamicsAtlasEndüstriyel

Müşteriler ve Pazar

GTC 2025'te açıklanan yeni anlaşmalar:

  • Toyota: Otonom sürüş için NVIDIA DRIVE Thor platform anlaşması
  • GM/Cruise: Robotaxi altyapısı için Blackwell Ultra
  • Amazon: AWS'de GB300 tabanlı AI hizmetleri
  • Microsoft: Azure'da Blackwell Ultra + Cosmos entegrasyonu
  • Meta: Llama eğitimi için 350.000+ GPU siparişi

NVIDIA'nın veri merkezi geliri 2024'te $115 milyar'ı aştı ve 2025'te $200 milyar hedefleniyor. Şirket, dünyanın en değerli şirketlerinden biri olma konumunu koruyor.

Sonuç

GTC 2025, NVIDIA'nın "GPU şirketi"nden "AI bilişim platformu"na dönüşümünü somutlaştırdı. Blackwell Ultra, Vera Rubin yol haritası, Cosmos world model ve robotik platformu—hepsi bir bütün olarak NVIDIA'nın AI ekosisteminin her katmanında var olma stratejisini yansıtıyor.

Geliştiriciler için en önemli çıkarım: NVIDIA'nın yazılım katmanı (NIM, Dynamo, NeMo, Isaac) artık donanım kadar önemli. CUDA ekosistemi'nin kilidi, rakiplerin işini giderek zorlaştırıyor.

Kaynaklar: