Skip to main content

Yapay zekâ destekli Google aramalar, Project Astra, Gemini 1.5 Pro, Gems ve daha fazlası Google I/O 2024’te öne çıktı.

OpenAI’ın geçen gün düzenlediği sürpriz GPT-4o lansmanından sadece bir gün sonra Google, yeni yapay zekâ asistanını ve inovasyonlarını Google I/O 2024 etkinliğinde tanıttı. CEO Sundar Pichai’nin açılış konuşmasıyla Türkiye saatiyle 20:00’de başlayan etkinlikte Google’ın yeni yapay zekâ asistanı Project Astra’nın yanı sıra birçok yenilik tanıtıldı.

Etkinlikte öne çıkanları sizler için derledik.

Project Astra

Çok modlu yapay zekâ aracısı (agent) olarak tanımlanan Project Astra, kamera aracılığıyla çalışıyor. Kullanıcılarla görüntülü veya sesli sohbetler sırasında gecikme olmadan bağlamı anlayıp gerçek zamanlı ve doğal bir şekilde etkileşime giriyor. Birden fazla bağlamda mantık yürütebilen, gördüğü şeyleri kavrayabilen ve hatırlayabilen Project Astra, Google gözlükleriyle kullanılabiliyor. Canlı demo için AI Sandbox Area’da kullanıcıların beğenisine sunulan Project Astra’nın Gemini App’e gelmesi bekleniyor.

Gemini 1.5 Pro yaygın kullanıma açıldı

Google’ın ilk olarak şubat ayında sayılı geliştiricinin kullanımına sunduğu Gemini 1.5 Pro, Google I/O 2024 ile birlikte 150’den fazla ülkede ve 35’ten fazla dilde Gemini Advanced abonelerine sunuldu. Paylaşılan bilgilere göre Gemini 1.5 Pro, son kullanıcıya açık chatbot’lar içinde en uzun bağlam penceresi olan ve 1 milyon parçadan başlayan genişletilmiş bağlam penceresi de dahil en son teknik yenilikleri getiriyor. Bu kadar uzun bir bağlam penceresi, Gemini Advanced’in birden fazla büyük belgeyi, 1.500 sayfaya kadar dosyaları anlamlandırabileceği veya 100 e-postayı özetleyebileceği anlamına geliyor. Yakında bir saatlik video içeriklerini veya 30.000’den fazla satıra sahip kod tabanlarını da işleyebilecek. Bu uzun bağlam penceresinden yararlanmak için Google, Google Drive aracılığıyla veya doğrudan cihazlardan Gemini Advanced’e dosya yükleme özelliğini ekliyor. Yakında Gemini Advanced, e-tablolar gibi yüklenen veri dosyalarından anında içgörüler ortaya çıkaracak ve özel görselleştirmeler oluşturarak bir veri analisti olarak hareket edecek. Doğası gereği çok modlu olan Gemini’ın 1.5 Pro modeli, görsel tanıma alanında da büyük yenilikler getiriyor. Örneğin, kullanıcılar en sevdiği restorandaki bir yemeğin fotoğrafını çekip tarifini isteyebilecek.

Gemini Live ile daha doğal sohbet

Google, kullanıcıların yazarak veya konuşarak Gemini ile daha doğal bir şekilde etkileşim kurmasını sağlayacak yeni yollar da ekledi. Kullanıcılar Google Mesajlar’da Gemini ile artık arkadaşlarına mesaj gönderdiği uygulamada Gemini ile sohbet edebilecek.

Google, önümüzdeki aylarda, Gemini ile konuşmayı daha sezgisel hale getirmek için Google’ın en son konuşma teknolojisini kullanan, mobil yeni bir konuşma deneyimi olan Live’ı Gemini Advanced abonelerinin kullanımına sunacak.

Gemini’ın özelleştirilmiş sürümleri: Gem

Gemini Advanced aboneleri yakında Gemini’ın özelleştirilmiş sürümleri olan Gem’leri kullanarak daha da kişisel bir deneyim yaşayabilecek. Kullanıcılar; kişisel bir spor salonu arkadaşı, aşçı yardımcısı, kodlama yazma ortağı ya da yaratıcı yazarlık rehberi gibi istedikleri Gem’i oluşturabilecek. Kurulum da son derece kolay. Kullanıcıların Gem’lerinin ne yapmasını ve nasıl tepki vermesini istediğini “koşu antrenörüm olarak bana günlük bir koşu planı hazırla ve pozitif, iyimser ve motive edici ol” şeklinde basitçe açıklaması yeterli. Gemini bu talimatları alıp tek tıklamayla bunları geliştirerek kullanıcıların özel ihtiyaçlarını karşılayan bir Gem oluşturabilecek.

Daha fazla Google uygulamasına bağlanmak mümkün

Geçtiğimiz yıl Gemini’a eklenen uzantılar sayesinde kullanıcılar Google uygulama ve hizmetleriyle daha fazla iş yapabildi. Google, YouTube Music Uzantısı gibi uzantılarla Google uygulamalarını Gemini’a getirmeye devam ediyor. Gemini ile kullanıcılar, şarkının adını bilmese bile favori bir dizeyi veya öne çıkan bir sanatçıyı belirterek favori müziğini arayabilir. Yakında Google Takvim, Görevler ve Keep uygulaması da dahil olmak üzere daha fazla Google aracı Gemini’a bağlanacak.

Gemini 1.5 Flash

Google, 1.5 Pro’yu kullanan geliştiriciler ve kurumsal müşterilerin; uzun bağlam penceresini, çok modlu akıl yürütme özelliklerini ve etkileyici performansını çok faydalı bulduklarını aktardığını ifade ediyor.

Google, kullanıcılardan aldığı geri bildirimlerden, bazı uygulamalarda düşük gecikme süresine ve daha uygun yayınlama maliyetlerine ihtiyaç duyulduğunun farkında olduğunu ifade ediyor. Bu nedenle Gemini 1.5 Flash’ı tanıtan Google, 1.5 Flash’ın 1.5’tan daha hafif, geniş ölçekte hizmet vermek üzere hızlı ve verimli olacak şekilde tasarlanmış bir model olduğunu söylüyor.

1.5 Flash Gemini ailesinin en yeni modeli, API ile kullanılan diğer modellerin de en hızlısı. Yüksek hacimli ve sık tekrar eden görevler için optimize. Uzun bağlam penceresinde çalışmasına ek olarak maliyet açısından daha verimli.

1.5 Pro’ya nazaran daha hafif bir model olmasına rağmen geniş veri üzerinde çok formatlı mantık yürütme kapasitesine sahip olan 1.5 Flash özet çıkarma, sohbet uygulamaları, görüntü ve videonun yazıya çevrilmesi, uzun belge ve tablolardan veri çıkarma ve benzer birçok görevde üst düzey performans sergiliyor.

Hem 1.5 Pro hem de 1.5 Flash, Google AI Studio ve Vertex AI’de 1 milyon parçalık bağlam penceresiyle genel önizlemede mevcut. 2 milyon parçalık bağlam penceresi de bekleme listesi aracılığıyla API kullanan Geliştiricilerin ve Google Cloud müşterilerinin erişimine açıldı.

Yapay zekâ destekli Google Aramalar

Gemini’ın çok adımlı akıl yürütme, planlama ve çok modluluk gibi gelişmiş yetenekleri Google Aramalar’a geliyor. Bazen sorularımızın hızlıca yanıtlanmasını isteriz ancak ihtiyacımız olan bilgileri bir araya getirecek zamanımız olmaz. Arama, Yapay Zekâ Özetleri ile (AI Overviews) bunu bizim yerimize yapacak.

Google, Yapay Zekâ Özetlerini şimdilik ABD’deki tüm kullanıcılara açtı. Yakında bu listeye daha fazla ülke eklenecek.

Gemini’ın çok adımlı muhakeme yetenekleri sayesinde Yapay Zekâ Özetleri, giderek daha karmaşık hale gelen soruların çözümüne yardımcı olacak. Yani kullanıcılar sorularını birden fazla aramaya bölmek yerine, en karmaşık sorularını akıllarındaki tüm nüansları ve gerekli uyarılarını da ekleyerek tek seferde sorabilecek.

Bu çok adımlı muhakeme yetenekleri yakında ABD’de yapılan İngilizce sorgular için Search Labs’te sunulacak.

Öte yandan Arama artık karmaşık bir sorunun doğru cevabını veya kullanıcının ihtiyacı olan bilgiyi bulmakla kalmayacak, kullanıcıyla birlikte plan yapabilecek. Kullanıcılar doğrudan Arama’daki planlama özellikleri sayesinde, yemeklerden ve tatillerden başlayarak ihtiyacı olan her şey için plan oluşturma konusunda yardım alabilecek.

Video ile arama

Arama sadece kelimelerden ibaret değil. Yapay zekâ, videoyla soru sorma olanağı sağlayarak görsel aramayı yepyeni bir seviyeye taşıyor. Video ile arama yakında ABD’deki Search Labs kullanıcılarına İngilizce olarak sunulacak. Zaman içinde daha fazla bölgede kullanılabilecek.

Ask Photos

Gemini ile fotoğraflarda arama yapmanın yeni bir yolu olan Ask Photos, Google Photos kullanıcılarının galerilerine soru sormasını sağlıyor. Ask Photos ile, belirli bir anı aramak veya galerinizde bulunan bilgileri hatırlamak artık daha da kolay olacak. Anıları yakalamak veya önemli detayları kaydetmek için çektiğimiz fotoğraflar karışıklık içinde kaybolabilir. Ask Photos, geçen yıl nerede tatil yaptığımızı sorduğumuzda, bu bilgileri bizim için ortaya çıkarır.

Veo

Google’ın yeni üretken yapay zekâ video modeli Veo, yüksek kalitede 1080p çözünürlüklü ve bir dakikadan uzun videolar üretebiliyor. Google’ın açıklamasına göre Veo, sinematik terimleri ve anlatımları anlıyor, özellikle drone ve timelapse sahnelerini kolayca hazırlayabiliyor.