Hatırlarsanız OpenAI, geçen hafta yeni üretken yapay zekâ modeli GPT-4o’yu tanıtmıştı. Modelin sesli asistan seçeneklerinden Sky’ın, Scarlett Johansson’ın Samantha adlı bir yapay zekâ işletim sistemini seslendirdiği 2013 yapım Her filmindeki ses tonuna benzerliği tartışma yarattı. Ardından OpenAI CEO’su Sam Altman’ın GPT-4o’ın tanıtımından hemen sonra X paylaşımında “Her” ifadesini kullanması da bu tartışmaları daha da alevlendirdi.
her
— Sam Altman (@sama) May 13, 2024
Daha önceden chatbot’ta kendi sesinin kullanılması yönünde şirketin teklifini geri çevirdiğini dile getiren Johansson ise Sam Altman’ı kasıtlı olarak sesini kopyalamakla suçlayan bir açıklama yaptı. Johansson, “ChatGPT’nin sesimi taklit etmesine şoke oldum ve kızdım” dedi.
Bunun üzerine OpenAI, blog yazısında “Her” filmindeki Scarlett Johansson’ın sesini taklit etmediklerini açıkladı. Açıklamada, “Yapay zekâ seslendirmelerinin kasten bir ünlünün özgün sesini taklit etmemesi gerektiğine inanıyoruz. Sky’ın sesi, Scarlett Johansson’ın bir taklidi değil, kendi doğal konuşma sesini kullanan farklı bir profesyonel oyuncuya ait” ifadesi kullanıldı.
OpenAI ayrıca X paylaşımında Sky adlı ses seçeneğinin duraklatılması için çalışmaların sürdüğünü belirtti. OpenAI, ayrıca Johansson’un temsilcileriyle iletişime geçtiğini de söyledi.
We’ve heard questions about how we chose the voices in ChatGPT, especially Sky. We are working to pause the use of Sky while we address them.
Read more about how we chose these voices: https://t.co/R8wwZjU36L
— OpenAI (@OpenAI) May 20, 2024
OpenAI, sesleri nasıl belirliyor?
OpenAI blog yazısında, 2023’ün başlarında sesleri belirlemek için bağımsız, tanınmış, ödüllü cast direktörleri ve yapımcılarla ortaklık kurduğunu belirtiyor. ChatGPT’nin sesleri için bir dizi kriter oluşturduğunu ifade eden OpenAI, bu kriterleri şöyle sıralıyor:
- Farklı kültürlerden gelen veya birden fazla dil konuşabilen aktörler
- Zamansız hissettiren bir ses
- Güven uyandıran, samimi bir ses
- Sıcak, çekici, güven veren, karizmatik ve ton bakımından zengin bir ses
- Doğal ve dinlemesi kolay bir ses
OpenAI ayrıca, 400’den fazla başvuru aldıklarını ve süreç sonunda Breezze, Cove, Ember, Juniper ve Sky olmak üzere beş ses seçtiklerini de belirtiyor.
Yorumlar