Grok 3 Yayınlandı: xAI'ın 200.000 GPU ile Eğittiği En Güçlü Model

Grok 3 Yayınlandı: xAI'ın 200.000 GPU ile Eğittiği En Güçlü Model

Grok 3 Nedir? xAI'ın 100.000 GPU ile Eğittiği Yapay Zeka Modeli

Elon Musk'ın yapay zeka şirketi xAI, Şubat 2025'te Grok 3 modelini duyurdu. Memphis, Tennessee'deki Colossus süper bilgisayarında 100.000 NVIDIA H100 GPU ile ön-eğitimi tamamlanan ve sonrasında 200.000 GPU'ya genişletilen kümede eğitilen model, bu ölçekte tek bir eğitim kümesi için kullanılan en büyük GPU sayısını temsil ediyor. Musk, Grok 3'ü "dünyanın en akıllı AI modeli" olarak tanıtırken, bağımsız benchmark'lar daha nüanslı bir tablo çiziyor.

Colossus: Dünyanın En Büyük AI Süper Bilgisayarı

xAI'ın Colossus veri merkezi, yapay zeka altyapısı tarihinde benzersiz bir mühendislik başarısı:

ÖzellikColossus
GPU Sayısı100.000 x NVIDIA H100 (ön-eğitim), 200.000'e genişletildi
Toplam AI Performansı~400 exaflop FP8
Ağ BağlantısıInfiniBand, her GPU arası tam bağlantı
Güç Tüketimi~150-250 MW (tahmini)
İnşa Süresi~4 ay (Temmuz-Kasım 2024)
KonumMemphis, Tennessee

Colossus'un 4 ayda kurulması sektörde şaşkınlık yarattı. Tipik bir veri merkezi inşaatı 18-24 ay sürerken, xAI bu süreyi agresif bir şekilde kısalttı. Musk bunu "startup hızında" çalışmaya bağladı ancak yerel yetkililer ve çevre grupları, uygun izinler alınmadan inşaata başlandığını iddia etti.

Perspektif: Meta'nın tüm AI altyapısı 2024 sonunda ~600.000 GPU. xAI tek bir tesiste bunun üçte birine sahip.

Grok 3 Benchmark Sonuçları

xAI'ın yayınladığı benchmark sonuçları:

BenchmarkGrok 3GPT-4oClaude 3.5 SonnetGemini 2.0
AIME 202586.7%74.3%-78.2%
MATH-50093.3%74.6%78.3%83.9%
GPQA Diamond84.6%53.6%59.4%62.1%
HumanEval92.7%90.2%92.0%89.6%
MMLU91.2%88.7%88.7%85.9%
Codeforces2061 Elo---
LMSys Arena (ELO)1402135813721345

Önemli not: Bu sonuçların bir kısmı xAI tarafından açıklandı ve bağımsız olarak doğrulanması bekleniyor. LMSys Arena sıralaması topluluk tarafından doğrulanmış ve Grok 3'ün gerçekten üst sıralarda yer aldığını gösteriyor.

Grok 3 "Think" Modu: Reasoning Yeteneği

Grok 3, OpenAI o1 ve DeepSeek R1'e benzer bir "Think" (düşünme) modu sunuyor. Bu modda model, yanıt üretmeden önce adım adım muhakeme yapıyor:

text
1Kullanıcı: 2^2024 mod 1000 nedir?
2
3[Think modu - iç muhakeme]:
41. 2'nin kuvvetlerinin son 3 basamağının döngüsünü bulmalıyım
52. 2^10 = 1024 → son 3 basamak: 024
63. φ(1000) = 400, yani 2^400 ≡ 1 (mod 1000)
74. 2024 = 400 × 5 + 24
85. 2^2024 ≡ 2^24 (mod 1000)
96. 2^24 = 16,777,216 → son 3 basamak: 216
10
11Yanıt: 2^2024 mod 1000 = 216

Think modu etkinleştirildiğinde model 10-120 saniye düşünme süresi alabiliyor. Bu sürede kullanıcıya düşünme sürecinin bir özeti gösteriliyor.

DeepSearch: Derinlemesine Araştırma

Grok 3 ile birlikte duyurulan DeepSearch özelliği, Google'ın Deep Research özelliğine benzer:

  1. Kullanıcı karmaşık bir araştırma sorusu sorar
  2. Grok, X platformu ve web üzerinde kapsamlı arama yapar
  3. Birden fazla kaynaktan bilgi toplar ve sentezler
  4. Kaynaklı, detaylı bir rapor sunar

X platformunun gerçek zamanlı verilerine doğrudan erişimi, Grok'un en büyük avantajı: Son dakika haberleri, trend konular ve topluluk tartışmaları hakkında anında bilgi sunabiliyor.

X (Twitter) Entegrasyonu

Grok 3, X platformuyla derin entegrasyona sahip:

  • Gerçek zamanlı post analizi: "Bu konu hakkında X'te ne konuşuluyor?" sorularına anında yanıt
  • Trend analizi: Yükselen konular ve duygu analizi
  • Görüntü anlama: Paylaşılan fotoğraf ve grafikleri analiz etme
  • Metin üretimi: X postları, thread'ler ve yanıtlar için taslak oluşturma
  • Profil analizi: Hesap geçmişi ve paylaşım paternleri hakkında bilgi

X Premium+ aboneleri ($40/ay) Grok 3'e tam erişim hakkına sahip. Ücretsiz X kullanıcıları sınırlı erişim alıyor.

xAI API ve Geliştirici Erişimi

xAI, Grok 3 için OpenAI uyumlu bir API sunuyor:

python
1from openai import OpenAI
2
3# xAI API - OpenAI SDK ile uyumlu
4client = OpenAI(
5    api_key="xai-...",
6    base_url="https://api.x.ai/v1"
7)
8
9response = client.chat.completions.create(
10    model="grok-3",
11    messages=[
12        {
13            "role": "system",
14            "content": "Sen bir yazılım mimarısın."
15        },
16        {
17            "role": "user",
18            "content": "Mikroservis mimarisinde event-driven "
19                       "iletişim için Kafka vs RabbitMQ karşılaştırması yap."
20        }
21    ]
22)
23
24print(response.choices[0].message.content)

API Fiyatlandırması:

ModelGirişÇıkış
Grok 3$3/M token$15/M token
Grok 3 Mini$0.30/M token$0.50/M token

Grok'un Farklı Kişiliği

Grok serisi, diğer AI modellerinden farklı bir kişilik yaklaşımı benimsiyor: Daha "eğlenceli" ve filtresiz. Musk, Claude ve ChatGPT'nin aşırı güvenli ve sıkıcı olduğunu eleştiriyor. Grok ise:

  • Daha cesur yanıtlar veriyor
  • Mizahi ve alaycı olabiliyor
  • Hassas konularda daha az red (refusal) yapıyor
  • X'teki güncel tartışmalar hakkında yorum yapabiliyor

Bu yaklaşım tartışmalı: Bazı kullanıcılar "dürüst ve filtresiz" AI'ı tercih ederken, eleştirmenler bunun yanlış bilgi ve zararlı içerik riskini artırdığını savunuyor.

Rakiplerle Karşılaştırma

ÖzellikGrok 3Claude 3.7GPT-4oGemini 2.5
ReasoningThink moduExtended thinkingo1 ayrı modelThinking modu
Gerçek zamanlı bilgiX entegrasyonuWeb aramaChatGPT SearchGoogle Arama
API fiyatı (giriş)$3/M$3/M$5/M$1.25/M
Açık kaynakHayırHayırHayırHayır
Ses desteğiYokYokVarVar
Bağlam penceresi1M200K128K1M

Sonuç: xAI Ciddi Bir Oyuncu mu?

Grok 3, xAI'ın yapay zeka yarışında ciddi bir rakip olduğunu kanıtlıyor. 100.000+ GPU'luk altyapı, güçlü benchmark sonuçları ve X platformunun veri avantajı, şirkete benzersiz bir konum sağlıyor. Ancak soru şu: Grok 3, X ekosisteminin dışında ne kadar etkili olacak?

OpenAI'ın geliştirici topluluğu, Google'ın ekosistem genişliği ve Anthropic'in güvenlik odaklı yaklaşımı karşısında xAI'ın uzun vadeli stratejisi henüz netleşmedi. Ama Musk'ın kaynak gücü ve agresif yaklaşımı, bu yarışın 5 değil en az 4 büyük oyuncuyla devam edeceğini gösteriyor.

Kaynaklar: xAI Grok | xAI API Dokümantasyonu