Geçen yılki ilk çıkışından bu yana, şirketler tarafından belgeleri özetlemekten bilgisayar kodu yazmaya kadar çok çeşitli görevler için benimsenen ve büyük teknoloji şirketleri arasında üretken yapay zekâ yarışı başlatan OpenAI’ın popüler chatbot’u ChatGPT şimdi de görebilecek, duyabilecek ve konuşabilecek.
OpenAI’ın yayımladığı blog yazısına göre ChatGPT, aldığı güncellemeyle kullanıcılarla sesli konuşma yapabilecek ve görüntüleri kullanarak etkileşime girebilecek.
OpenAI’ya göre yeni ses ve görsel odaklı yetenekler, ChatGPT’yi günlük hayatta kullanmanın daha fazla yolunu sunuyor. Şirket, kullanıcıların seyahat ederken önemli bir yerin fotoğrafını çekerek buranın ilginç yönleri hakkında ChatGPT ile canlı sohbet yapabileceğini söylüyor. Aynı şekilde kullanıcılar evde olduğunda buzdolabının içindekilerin fotoğrafını çekerek ChatGPT’den akşam yemeği tarifi isteyebiliyor. Kullanıcıların ayrıca fotoğraflar sayesinde ChatGPT’den çocuklarının matematik problemini çözmesini istemesi de mümkün.
OpenAI, blog yazısında kullanıcıların ChatGPT ile sesli bir konuşma gerçekleştirebileceğini de söylüyor. Buna göre hareket halindeyken ChatGPT ile konuşulabilecek, kendisinden hikâye anlatması istenebilecek ya da yemek masası sohbetlerine ChatGPT dahil edilebilecek.
ChatGPT’nin yeni ses özelliğini kullanmak için mobil uygulamada Ayarlar’dan Yeni Özellikler sekmesinden sesli konuşmaları etkinleştirmek, ardından ana ekranın sağ üst köşesinde bulunan kulaklık butonundan 5 farklı ses seçeneği arasından tercih edilen sesi seçmek yeterli.
Yeni ses özelliği, yalnızca metinden ve birkaç saniyelik örnek konuşmadan insan benzeri ses üretebilen yeni bir metinden konuşma modeliyle destekleniyor. OpenAI, seslerin her birini oluşturmak için profesyonel seslendirme sanatçılarıyla işbirliği yaptığını belirtiyor.
OpenAI, yeni ses ve görsel odaklı özelliklerin önümüzdeki 2 hafta içinde kademeli olarak ChatGPT Plus ve Enterprise kullanıcılarına sunulacağını belirtiyor. Bu özellikler kısa süre sonra geliştiriciler de dahil olmak üzere diğer kullanıcı gruplarına da sunulacak. Açıklamada ses özelliğinin iOS ve Android sürümüne geleceği, görsel özelliğin ise tüm platformlardan erişime açık olacağı ifade ediliyor.
The underlying research — voice generation and image understanding — offers a glimpse at what much more advanced AI will be capable of in the future. Learn more about this update and our safety measures: https://t.co/uNZjgbR5Bm
— OpenAI (@OpenAI) September 25, 2023
Yorumlar