
Google I/O 2024: Gemini ile Yapay Zeka Her Yerde
Google, 14-15 Mayıs 2024'te düzenlenen Google I/O 2024 konferansında yapay zeka vizyonunu tüm dünyaya sergiledi. CEO Sundar Pichai'nin açılış konuşmasında "AI" kelimesi tam 121 kez geçti. Google'ın mesajı açıktı: Gemini model ailesi, arama motorundan Android'e, Gmail'den YouTube'a kadar tüm Google ürünlerine entegre ediliyor. Bu, şirket tarihinin en kapsamlı AI entegrasyon hamlesi.
Gemini 1.5 Pro: 1 Milyon Token Bağlam Penceresi
Google I/O'nun en etkileyici teknik duyurusu, Gemini 1.5 Pro'nun bağlam penceresinin 1 milyon tokene genişletilmesiydi. Bir perspektif vermek gerekirse:
| Karşılaştırma | Token Kapasitesi | Ne İşleyebilir? |
|---|---|---|
| GPT-4 Turbo | 128K | ~90 sayfa metin |
| Claude 3 Opus | 200K | ~150 sayfa metin |
| Gemini 1.5 Pro | 1M | ~1.500 sayfa metin |
| Gemini 1.5 Pro (deneysel) | 2M | ~3.000 sayfa metin |
1 milyon token ile tek bir istekte yapabilecekleriniz:
- 1.500 sayfalık hukuk dokümanını analiz etme
- 1 saatlik videoyu izleyip sorulara cevap verme
- 30.000+ satır kodu tek seferde inceleme
- 100 e-postayı aynı anda özetleme
- 11 saatlik ses kaydını transkript edip analiz etme
Gemini 1.5 Pro API Kullanımı
1import google.generativeai as genai
2
3genai.configure(api_key="YOUR_API_KEY")
4model = genai.GenerativeModel('gemini-1.5-pro')
5
6# PDF dosyası yükleyip analiz etme
7pdf_file = genai.upload_file("annual_report_2024.pdf")
8
9response = model.generate_content([
10 "Bu yıllık faaliyet raporunu analiz et."
11 "Gelir artışını, risk faktörlerini ve "
12 "gelecek yıl projeksiyonlarını özetle.",
13 pdf_file
14])
15print(response.text)
16
17# Video analizi
18video_file = genai.upload_file("conference_talk.mp4")
19response = model.generate_content([
20 "Bu konuşmanın ana noktalarını özetle "
21 "ve konuşmacının temel argümanlarını listele.",
22 video_file
23])
24print(response.text)Google ayrıca Gemini 1.5 Flash modelini de duyurdu: 1.5 Pro'nun yeteneklerinin büyük kısmını sunan ama çok daha hızlı ve ucuz bir model. Yüksek hacimli API çağrıları ve gerçek zamanlı uygulamalar için ideal.
Project Astra: Geleceğin AI Asistanı
Google I/O'nun en çarpıcı demo'su Project Astra oldu. Google DeepMind tarafından geliştirilen bu prototip, gerçek zamanlı multimodal AI asistanı vizyonunu somutlaştırıyor:
Demo'da gösterilenler:
- Telefon kamerasıyla beyaz tahtayı tarayıp "Bu kodda hata var mı?" sorusuna anında yanıt verme
- Akıllı gözlük üzerinden çevreyi tarayıp "Bu bina ne?" sorusuna konumsal bilgiyle yanıt
- Ekranda kod yazarken gerçek zamanlı geri bildirim ve hata tespiti
- Konuşma sırasında bağlamı hatırlama: "Az önce masanın üzerinde gözlüğümü gördüm" → 10 dakika sonra "Gözlüğüm neredeydi?" → "Masanın üzerindeydi"
Astra, GPT-4o'nun ses modu ile doğrudan rekabet ediyor ancak farklı bir strateji izliyor: Sadece ses değil, sürekli görsel akış (continuous video stream) işleyebilme yeteneği Astra'yı farklılaştırıyor.
AI Overviews: Google Arama Değişiyor
Google Arama'ya entegre edilen AI Overviews, arama sonuçlarının üzerinde Gemini tarafından oluşturulan özetler gösteriyor. Bu özellik ABD'deki tüm kullanıcılara açıldı.
Örnek: "Python'da decorator nasıl yazılır?" araması yapıldığında, arama sonuçlarının üzerinde Gemini'nin hazırladığı kod örnekli bir özet görünüyor.
SEO üzerindeki etkisi büyük tartışma konusu:
- Organik arama sonuçları aşağı itiliyor
- Kullanıcılar yanıtı AI özetinde bulduğunda siteye tıklama oranı düşebilir
- İçerik üreticileri ve yayıncılar gelir kaybı endişesi taşıyor
Google, AI Overviews'ın aslında daha fazla tıklama getirdiğini iddia ediyor: "Kullanıcılar özeti okuduktan sonra daha spesifik sorgularla daha fazla arama yapıyor."
Gemini ile Google Workspace Entegrasyonu
Google, Gemini'yi Workspace ürünlerine derinlemesine entegre etti:
Gmail - Gemini ile E-posta:
- E-posta yazarken AI destekli taslak oluşturma
- Uzun e-posta zincirlerin özetleme ("Bu thread'de ne kararlaştırıldı?")
- E-postalardaki belirli bilgileri sorgulama ("Proje teslim tarihi ne?")
Google Docs - Help Me Write:
- Doküman oluşturma ve düzenleme
- Doküman içeriğini özetleme
- Stil ve ton değiştirme
Google Sheets - Side Panel:
- Doğal dille veri analizi: "Bu tablodan en çok satan 5 ürünü göster"
- Otomatik formül oluşturma
- Grafikler ve görselleştirmeler
Google Slides - Image Generation:
- Sunumlar için AI ile görsel oluşturma
- Slayt tasarım önerileri
Gemini Nano: Cihaz Üzerinde AI
Gemini Nano, mobil cihazlarda doğrudan çalışan en küçük Gemini modeli. Google I/O'da gösterilen yeni kullanım alanları:
- Çağrı Asistanı (Call Notes): Telefon görüşmelerini cihaz üzerinde özetleme. Veri telefonu terk etmiyor
- TalkBack iyileştirmesi: Görme engelli kullanıcılar için ekrandaki görselleri sesli olarak açıklama
- Smart Reply: Mesajlara bağlama uygun otomatik yanıt önerileri
- Gboard: Daha akıllı otomatik tamamlama ve metin önerileri
Nano'nun gizlilik avantajı kritik: Tüm bu işlemler internet bağlantısı olmadan, tamamen cihaz üzerinde gerçekleşiyor.
Android 15 ve AI Özellikleri
Google I/O'da tanıtılan Android 15 AI yenilikleri:
- Circle to Search genişlemesi: Ekrandaki herhangi bir nesneye daire çizerek arama yapma, artık ödev sorularını çözme özelliği de eklendi
- Gemini asistan: Google Assistant'ın Gemini ile değiştirilmesi süreci hızlandı
- AI ile telefon hırsızlığı koruması: Telefonun aniden alınıp kaçılmasını algılayan AI modeli, otomatik ekran kilitleme
- Scam algılama: Telefon görüşmelerinde dolandırıcılık kalıplarını tespit eden AI (cihaz üzerinde, gizlilik korunarak)
Firebase ve Geliştirici Araçları
Google, geliştiriciler için Gemini entegrasyonlarını genişletti:
- Firebase Genkit: AI uygulamaları geliştirmek için yeni framework (JavaScript/TypeScript)
- Vertex AI in Firebase: Mobil/web uygulamalardan doğrudan Gemini API çağrısı
- Google AI Studio: Gemini ile prototipleme ve test aracı, ücretsiz API anahtarları
1// Firebase Genkit ile Gemini kullanımı
2import { generate } from '@genkit-ai/ai';
3import { gemini15Pro } from '@genkit-ai/googleai';
4
5const response = await generate({
6 model: gemini15Pro,
7 prompt: 'Bu ürün yorumlarını analiz et ve duygu analizi yap',
8 context: customerReviews,
9 output: { schema: SentimentAnalysisSchema }
10});Rekabet Analizi: Google vs OpenAI vs Anthropic
Google I/O 2024, OpenAI'ın GPT-4o lansmanından sadece bir gün sonra gerçekleşti—zamanlamanın tesadüf olmadığı açık. Her iki şirketin de aynı hafta multimodal AI asistanı tanıtması, rekabetin ne kadar kızıştığını gösteriyor.
| Özellik | Google (Gemini) | OpenAI (GPT-4o) | Anthropic (Claude 3) |
|---|---|---|---|
| Bağlam penceresi | 1M-2M token | 128K token | 200K token |
| Multimodal | Metin+ses+görüntü+video | Metin+ses+görüntü | Metin+görüntü |
| Cihaz üzerinde AI | Gemini Nano | Yok | Yok |
| Arama entegrasyonu | AI Overviews | ChatGPT Search | Yok |
| Ekosistem | Workspace, Android, Chrome | ChatGPT, API | API, Claude.ai |
Google'ın en büyük avantajı ekosistem genişliği: Milyarlarca Android, Chrome ve Gmail kullanıcısına AI'ı doğrudan ulaştırabilme kapasitesi.
Sonuç: Google'ın AI Vizyonu
Google I/O 2024, şirketin yapay zekayı bir ürün değil, tüm ürünlerinin temel katmanı olarak konumlandırdığını gösterdi. 1 milyon token bağlam penceresi gerçek bir teknik başarı; Project Astra geleceğin AI asistanının ne olabileceğine dair güçlü bir vizyon; AI Overviews ise arama motorunun evriminde tarihi bir adım.
Ancak Google'ın savaşı henüz kazanmadığını da belirtmek gerek. OpenAI'ın geliştirici ekosistemi ve marka bilinirliği, Anthropic'in güvenlik odaklı yaklaşımı ve açık kaynak alternatiflerin (Llama 3 gibi) yükselişi, rekabetin 2024 boyunca kızışarak devam edeceğini gösteriyor.
Kaynaklar: Google I/O 2024 Keynote | Gemini API Dokümantasyonu | Project Astra Blog


