Shazam’i geliştirmeye akıllı telefonlardan, uygulama mağazalarından ve bugün bildiğimiz haliyle yapay zekâdan çok önce başladınız. İlk versiyon nasıldı?
Shazam’i açtığımız 2002 yılında uygulamalar yoktu. App Store 2008’de açıldı. Yani biz Shazam’i App Store’dan altı yıl önce açtık. Uygulamalar olmadığından o zaman elimizdekilerle, o günün cep telefonlarıyla çalışmak zorundaydık.
İlk olarak sadece Birleşik Krallık’ta piyasaya sürdük Sahazam’i. Kullanıma açtığımızda çalışma modeli -ki tüm cep telefonlarında çalışıyordu- dört haneli bir numara çevirip arama yapmak şeklindeydi. Bu numara 2580’di. Arama sesli yanıt sistemimize düşüyordu, United Airlines’ı aramak gibi. Sistem aramayı yanıtlayıp 15 saniyelik ses kaydı alıyordu. Sesi aldıktan sonra aramayı sonlandırıyordu ama telefon numarasını tutuyorduk. Sonra şarkı veritabanımızda milisaniyeler içinde arama yapıp telefonunuza şarkının ve sanatçının adını içeren bir SMS gönderiyorduk. Shazam’in 2002 yazında kullanıma açtığımız ilk versiyonu böyleydi.
Sadece bir SMS olduğundan ve telefonların yapabildiklerinin sınırlarından dolayı, bugün yapabildiğimiz pek çok şeyi o gün yapamıyorduk. Albüm kapağı yoktu, sadece metindi. Ses yoktu, şarkıyı dinleyemiyordun. Sözlerini göremiyor, satın alamıyor, indiremiyordun. Yani gelen tek şey şarkının adının yazdığı bir SMS’ti. O zamanlar cep telefonlarıyla sadece arama yapabiliyor, mesaj gönderebiliyor, zil sesi indirebiliyordun. Zil sesini değiştirip belki SMS’le maç skorları alabiliyordun, hepsi buydu. Yani Shazam gerçekten devrim niteliğinde nadir bir ek hizmetti.
Shazam’in AI’dan önceki AI olarak tanımlayabileceğimiz oldukça karmaşık bir algoritma ile çalıştığını düşünürsek, yakın zamanda gerçekleşen devrim size nasıl hissettiriyor?
Shazam AI’ın erken bir versiyonu. Aslında zamanla farklı AI türleri ve AI’ı çalışmalara dahil etmede farklı yollar ortaya çıktı. Kural tabanlı yaklaşımlar, örüntü tanıma yaklaşımları, yapay öğrenme ve son olarak da yapay sinir ağları kullanan bir yapay öğrenme şekli olan derin öğrenme. Shazam de AI’ın erken bir versiyonuydu ve araştırmalarıma göre, kitlesel tüketim ürünü haline gelen AI temelli ilk üründü. Google Translate, Apple Siri, Google Now gibi şeyler daha sonra geldi. Hepsi sonradan kitlesel tüketim ürünü haline geldi ama Shazam’den önce AI ile piyasaya sürülen ürünler küçüktü. Hatta popüler olan tek şey ses tanımaydı. DRAGON tarafından geliştirilmişti ama o da aslında tüketici kullanımından ziyade iş içindi.
Gerçek şu ki AI uzun zamandır var. Çeviri, bilgisayar görüşü, sürücüsüz araçlar yıllardır kullanımda. Onu bir devrim gibi hissettiren iki büyük atılımdan ilki, AI ile iletişim kurabileceğiniz ve insanların iletişim kurma biçimine benzer yanıtlar alabileceğiniz LLM’ler (büyük dil modelleri). İkincisi ise AI’ın sadece size doğru yanıtı vermediği, yanıtını bir şiir ya da bir resim şeklinde yarattığı üretken yapay zekâ.
Orijinal bir fikirle yola çıkmış olsanız da insanları bir uygulamayı kullanmaya hatta benimsemeye ikna etmek zor olmuştur. Bunu nasıl başardınız?
Gerçekten büyük bir zorluk ve bunu tüm şirketlerin tüm ürünleri için söylüyorum. Eğer kullanıcı davranışını değiştirmeniz gerekiyorsa, bu yapması çok zor bir şey ki Shazam’le bile gerçekten zordu. İnsanlara Shazam’i ilk kez gösterdiğimizde bile sevdiler, büyülü buldular ama onları eğitmemiz, şarkıları cep telefonlarıyla tanımlayabileceklerini söylememiz gerekiyordu ki bu daha önce kimsenin kalkışmadığı bir davranış değişimiydi.
İnsanları herhangi bir konuda eğitmek maliyetli. Bizim gelirimizle insanların bizi fark etmesi için gereken meblağ arasındaki oran iyi değildi. Piyasaya sürdükten sonraki altı yıl çok az kullanıcımız vardı çünkü mesajı yayıp davranışı değiştirmenin maliyetini karşılayamadık. Davranışı değiştirmemizi sağlayansa platformun ve uygulamaların kombinasyonu oldu. Uygulamalar insanların davranışını değiştirdi; arama ve SMS dışında şeyler de yapabileceklerini gösterdi. Bunu mümkün kılan App Store oldu. Shazam de uygulama olduktan sonra yükseldi. İnsanlar birbirlerine anlatmaya başladılar ve tavsiyeyle devasa rakamlara ulaştı; 2 milyardan fazla indirme ve her ay kullanan yüzmilyonlarca insan…
Shazam, 2018’de Apple tarafından satın alındı. Ardından deneyimlerinizden yola çıkarak, keynote’lar ve Start From Zero adını verdiğiniz ilkeler aracılığıyla insanlara bilgi ve ilham vermeye başladınız. Bu ilkeleri özetleyebilir misiniz?
Shazam’de yaptıklarımıza bakınca, onu yaratmanın benzersiz bir deneyim olduğunu fark ettim. Zamanının çok ötesindeydi. Ne yaptık, nasıl yaptık kısmından çok etkilendim. Ayrıca Google ve Dropbox’a katıldım ve yaklaşık 12 yıl geçirdim. Örüntüler görmeye başladığımı fark ettim. Onlar da yüzmilyonlarca insanın benimsediği harika şeyler, harika teknolojiler ve kullanıcı deneyimleri yarattılar.
Gerçekten inovasyon yapmak, büyülü şeyler yaratmak, engelleri aşıp imkânsız fikirleri hayata geçirmek için farklı düşünmenin beş yolunu saptadım. Bu benim Start From Zero/ Sıfırdan Başlama anlayışım. Birincisi, gerçekten yeni, insanların düşünmedikleri fikirler üretmek. İkincisi tüm engelleri aşmak. Yaklaşımın ne olmalı? Zihin yapın nasıl olmalı? Çünkü bir fikrin var ama hayata geçirirken pek çok engelle karşılaşacaksın. Üçüncüsü, senin sahip olduğun ama diğerlerinin sahip olmadıkları bazı anahtar içgörüleri belirlemek ve başarmak için gerçekten nasıl odaklanmak zorunda kalabileceğini öğrenmek. Ben buna “takıntını seç” diyorum. Dördüncüsü, efora gerçekten odaklanmak. Çünkü bir şeyler ürettiğimizde, onları kullanmak efor gerektirir. Peki eforu nasıl ortadan kaldırabilirsin? İşleri nasıl kolaylaştırabilirsin? Sürtünmeyi ortadan kaldırmak diyorum ben buna. Ve son olarak gerçekten tüm bu zor şeyleri yapmak için yakıtı nasıl bulursun? Kişisel hale getirerek.
Guard adlı yeni bir startup’ınız var. Bu yeni şirketle başarmayı hedeflediğiniz şeyler neler?
Guard, bootstrap edilen, misyon odaklı erken dönem bir startup ve nihai amaçhayat kurtarmak. Dünyanın her yerinde yüzme havuzlarında zaman zaman boğulmalar yaşanıyor. Ben de AI hatta daha spesifik olarak, bilgisayar görüşü kullanarak boğulmayı engelleyebilsek harika olmaz mıydı diye düşündüm. Bilgisayar görüşü; sürücüsüz araçlarda olduğu gibi AI’ın dünyayı kameralar da dahil olmak üzere sensörler üzerinden gördüğü ve neler olduğunu saptadığı bir formu. İnsan gibi düşünmeye benziyor. Yani bir havuzda boğulan birini belirleyen ve uyaran kameralar olacak ki hayat kurtarılabilsin.
Shazam kullanıcılarına bir tavsiyeniz var mı?
İki tavsiyem var. Birincisi, keyfini çıkarın. Aklıma gelen ilk yol, Shazam’i bilinmeyen şarkıları bulmak için kullanmak. Bazen kulüpte, sinemada, markette gerçekten bilinmeyen şarkılar duyarsınız. Öğrenmenin yolu da şarkıyı bulduktan sonra kaç kez Shazam’lendiğine bakmak. Eğer milyonlar yerine binler hatta yüzlerle karşılaşırsanız şarkının bilinmediği anlamına gelir. Tebrikler, çok az kişinin duyduğu bir şarkıyı buldunuz.
İkincisiyse, akış dünyasında yaşıyoruz; Apple Music, Spotify var ve eğer bu servislerin abonesiyseniz bu, tüm müziklerin parmak uçlarınızda olduğu anlamına geliyor. Ek ücret ödemeden istediğiniz kadar dinleyebilirsiniz. Shazam’i bu servislerin her ikisine de bağlamanızı öneriyorum. Böylelikle Shazam’lediğiniz herhangi bir şarkıyı istediğiniz zaman dinleyebilirsiniz.
Not: Bu söyleşi ilk olarak MediaCat dergisinin Şubat 2024 sayısında yayımlanmıştır.
Yorumlar