OpenAI'ın 12 Günlük Lansman Maratonu: o3, Sora ve ChatGPT Pro

OpenAI'ın 12 Günlük Lansman Maratonu: o3, Sora ve ChatGPT Pro

OpenAI 12 Days of Shipmas: 12 Günde 12 Büyük Duyuru

OpenAI, 5-20 Aralık 2024 tarihleri arasında her gün canlı yayınla yeni bir ürün veya özellik duyurduğu "12 Days of OpenAI" etkinliğini gerçekleştirdi. CEO Sam Altman'ın sunumuyla başlayan bu maraton, yapay zeka tarihinin en yoğun lansman dönemlerinden biri oldu. Sora'nın halka açılmasından o3 reasoning modeline, ChatGPT Pro'dan yeni API özelliklerine kadar kapsamlı bir duyuru seli yaşandı.

Gün Gün Tüm Duyurular

Gün 1: ChatGPT'ye o1 Tam Sürüm ve ChatGPT Pro (5 Aralık)

o1 modelinin tam sürümü ChatGPT Plus'a açıldı. Aynı gün ChatGPT Pro duyuruldu:

PlanFiyatİçerik
Free$0GPT-4o (sınırlı)
Plus$20/ayGPT-4o, o1, DALL-E, Sora sınırlı
Pro$200/ayo1 pro mode, sınırsız GPT-4o, sınırsız Sora
Team$25/kişi/ayPlus + yönetim araçları

o1 pro mode, standart o1'den daha uzun düşünüyor ve daha yüksek doğruluk oranı sunuyor. Özellikle matematik, kodlama ve bilimsel araştırma görevlerinde fark belirgin.

Gün 2: Reinforcement Fine-Tuning (6 Aralık)

Geliştiriciler, kendi alanlarına özel reasoning modelleri oluşturabilen Reinforced Fine-Tuning (RFT) programı duyuruldu. Geleneksel fine-tuning'den farklı olarak RFT, modele "düşünme" yeteneği kazandırıyor:

python
1# Kavramsal olarak RFT süreci:
2# 1. Alan-spesifik soru-cevap veri seti hazırlayın
3# 2. Model bu verilerde reasoning yaparak öğrenir
4# 3. Sonuç: Alanınızda uzman bir reasoning modeli
5
6# Örnek: Hukuk alanında uzmanlaşmış o1 modeli
7# Vergi mevzuatı sorularına adım adım düşünerek yanıt verir

Harvard Tıp Fakültesi, nadir hastalık teşhisinde RFT ile eğitilmiş modelin standart o1'den %10+ daha iyi performans gösterdiğini raporladı.

Gün 3: Sora Halka Açıldı (9 Aralık)

Şubat'ta tanıtılan text-to-video modeli Sora nihayet halka açıldı. ChatGPT Plus ve Pro aboneleri Sora ile video üretebiliyor.

Sora fiyatlandırma:

  • Plus ($20/ay): 50 video/ay, 480p-720p, max 5-20 saniye
  • Pro ($200/ay): 500 video/ay, 1080p, max 20 saniye, eşzamanlı üretim

Ancak lansman sorunlu oldu:

  • İlk saatlerde yoğunluk nedeniyle erişim sorunları
  • Bazı kullanıcılar beklentilerin altında kalite raporladı
  • Avrupa'da düzenleyici endişeler nedeniyle erişim kısıtlı
  • Rekabet: Runway Gen-3 ve Pika Labs halihazırda piyasada

Gün 4: Canvas Güncellemesi (10 Aralık)

ChatGPT'nin yazma ve kodlama arayüzü Canvas, GPT-4o ile entegre edildi. Canvas artık:

  • Python kodunu doğrudan çalıştırabilir
  • Custom GPT'lerle kullanılabilir
  • Tüm ChatGPT kullanıcılarına açık (daha önce Plus'a özel)

Gün 5: Apple Intelligence Entegrasyonu (11 Aralık)

ChatGPT, Apple Intelligence ile entegre edildi. Siri, karmaşık sorularda kullanıcının onayıyla ChatGPT'ye yönlendirme yapabiliyor. iPhone 16 ve Apple Silicon Mac kullanıcıları bu özelliğe iOS 18.2 ile erişebiliyor.

Gün 6-8: API Geliştirmeleri (12-16 Aralık)

  • Gün 6: WebRTC ile gerçek zamanlı ses API'si. Geliştiriciler kendi sesli AI asistanlarını oluşturabilir
  • Gün 7: GPT-4o için video ve ekran paylaşımı desteği (API)
  • Gün 8: Structured Outputs iyileştirmeleri ve yeni SDK özellikleri

Gün 9: o1 API Tam Erişim (17 Aralık)

o1 modeli API'de tam erişime açıldı. Yeni özellikler:

python
1from openai import OpenAI
2client = OpenAI()
3
4# o1 ile reasoning - artık system prompt destekli
5response = client.chat.completions.create(
6    model="o1",
7    messages=[
8        {
9            "role": "developer",  # system yerine developer role
10            "content": "Sen bir güvenlik uzmanısın. "
11                       "Kod incelemelerinde OWASP Top 10'a odaklan."
12        },
13        {
14            "role": "user",
15            "content": "Bu Express.js endpoint'ini güvenlik açısından incele:\n"
16                       "app.get('/user', (req, res) => {\n"
17                       "  const id = req.query.id;\n"
18                       "  db.query(`SELECT * FROM users WHERE id = ${id}`);\n"
19                       "});"
20        }
21    ]
22)
23
24# o1 düşünerek SQL injection ve diğer açıkları tespit eder

Gün 10: ChatGPT Telefon ve WhatsApp (18 Aralık)

ChatGPT'ye telefonla (1-800-CHATGPT) ve WhatsApp üzerinden erişim. ABD ve seçili ülkelerde kullanılabilen bu özellik, internet erişimi olmayan veya teknolojiyle arası iyi olmayan kullanıcılar için tasarlandı.

Gün 11: ChatGPT Projects ve Santa Mode (19 Aralık)

ChatGPT'de sohbetleri proje bazında organize etme özelliği. Her projeye özel talimatlar ve dosyalar eklenebiliyor.

Gün 12: o3 ve o3-mini Tanıtıldı (20 Aralık)

Maratonun en büyük duyurusu sona saklandı: o3 reasoning modeli.

o3 Modeli: Reasoning'de Yeni Zirve

o3'ün benchmark sonuçları çarpıcı:

Benchmarko1o3o3 (yüksek compute)
ARC-AGI%25%75.7%87.5
Codeforces89. yüzdelik96. yüzdelik-
AIME 2024%83.3%96.7-
GPQA Diamond%78.3%87.7-
SWE-bench Verified%41%71.7-
EpochAI Frontier Math%9.3%25.2-

ARC-AGI %87.5 özellikle dikkat çekici. ARC-AGI, yapay zekanın "gerçek anlama" ve "genelleme" yeteneğini ölçen bir test. Önceki tüm modellerin %50 altında kaldığı bu testte o3'ün %87.5 alması, AGI tartışmalarını alevlendirdi.

Ancak ARC-AGI'nin yaratıcısı François Chollet, o3'ün brute-force hesaplama ile yüksek skor aldığını, bunun gerçek "anlama" olmadığını belirtti.

o3-mini ise o3'ün küçük ve hızlı versiyonu. "Düşünme eforu" ayarlanabiliyor:

  • Low: Hızlı, basit görevler için
  • Medium: Genel kullanım
  • High: Karmaşık problemler, daha uzun düşünme

Değerlendirme: OpenAI 2024'ü Nasıl Kapattı?

OpenAI'ın 12 günlük maratonu stratejik bir hamleydi:

Başarılı yönler:

  • o3'ün benchmark sonuçları gerçekten etkileyici
  • Apple Intelligence entegrasyonu milyarlarca cihaza erişim sağladı
  • API iyileştirmeleri geliştirici ekosistemini güçlendirdi

Eleştiriler:

  • Sora'nın kalitesi beklentilerin altında kaldı
  • ChatGPT Pro'nun $200/ay fiyatı çok yüksek
  • o3'ün maliyeti (yüksek compute modunda tek soru $1000+)
  • Bazı duyurular "filler" niteliğinde (Santa mode?)

Google'ın Gemini 2.0 ve Anthropic'in Claude modellerinin giderek güçlenmesiyle, 2025'te rekabetin daha da kızışması kaçınılmaz.

Kaynaklar: OpenAI 12 Days Blog | o3 Teknik Detaylar | Sora