Meta tarafından Cuma günü duyurulan Voicebox, sesi 2 saniye gibi kısa bir sürede klonlayabiliyor. Önceden kaydedilmiş sesleri düzenleyebilen Voicebox ayrıca ses içeriğini ve stilini koruyarak ses klipleri üretiyor. Voicebox aynı zamanda kişinin sesini alarak İngilizce, Fransızca, Almanca, İspanyolca, Lehçe ve Portekizce gibi dillerde seslendirmeyi sağlıyor.
Meta, Voicebox’ın, insanların çalışmak, oyun oynamak ve takılmak için bir araya geleceği dijital dünyalar olan metaverse’teki sanal asistanlara veya oyuncu olmayan karakterlere doğal bir ses vermek için kullanılabileceğini söylüyor. Şirket ayrıca, bu tür bir teknolojinin, gelecekte içerik oluşturucuların ses parçalarını kolayca düzenlemesine yardımcı olmak, görme engelli kişilerin arkadaşlarından gelen yazılı mesajları kendi seslerinden duymalarını sağlamak ve insanların herhangi bir yabancı dili kendi sesleriyle konuşmalarını sağlamak için kullanılabileceğini ifade ediyor.
Meta, bununla birlikte gerçek konuşma ile Voicebox tarafından üretilen sesi birbirinden ayırmanın etkili bir yolu üzerinde çalıştığını da söylüyor.
Voicebox’ın hâlâ geliştirilme aşamasında olduğunu ve kullanıma açılmadığını belirtelim.
Kaynak: Meta’s Voicebox Generative AI Makes Anyone Speak a Foreign Language – CNET
Yorumlar