Yapay zekâ ile ilgili araştırmalarına devam eden Meta, bu konuda önemli bir adım atarak LLaMA adlı yeni dil modelini duyurdu. Şirket cuma günü, araştırmacıların büyük dil modeli LLaMA’ya erişmek için başvurabileceklerini söyledi.
Meta CEO’su Mark Zuckerberg bir Facebook gönderisinde, araştırmacıların çalışmalarını ilerletmelerine yardımcı olmak için tasarlanmış LLaMA adlı yeni bir son teknoloji yapay zekâ büyük dil modelini piyasaya sürdüklerini belirtti. Zuckerberg, büyük dil modellerinin “metin oluşturmada, konuşmalarda, yazılı materyalleri özetlemede ve matematik teoremlerini çözme veya protein yapılarını tahmin etme gibi daha karmaşık görevlerde çok fazla umut vadettiğini” yazdı.
Modelin piyasaya sürülmesi, yapay zekânın kullanıcılar ve teknoloji şirketleri için nasıl önemli bir odak noktası olmaya devam ettiğini gösteriyor. Makaleler, sanat eserleri ve diğer içerikleri üretebilen yapay zekâ araçlarının artan popülaritesi, yanlış bilgilendirme, intihal ve önyargıyla ilgili etik kaygıları da artırıyor. Meta, yapay zekâ dil modellerinin bu sorunların çözümünde yardımcı olacağını söylüyor.
ChatGPT ve Bing’den farklı olarak sohbet arayüzü sunmayan LLaMA’yı üniversiteler, STK’lar ve endüstri laboratuvarları gibi kurumlar için erişime açan Meta bir blog gönderisinde, “Yapay zekâ topluluklarının (akademik araştırmacılar, sivil toplum, politika yapıcılar ve endüstri) genel olarak sorumlu yapay zekâ ve özel olarak sorumlu büyük dil modelleri hakkında net yönergeler geliştirmek için birlikte çalışması gerektiğine inanıyoruz” dedi. Meta, topluluğun LLaMA kullanarak neler öğrenebileceğini ve en sonunda neler inşa edebileceğini görmek için sabırsızlandıklarını ifade etti. Ancak LLaMA’ya erişimin, Meta’nın onayladığı araştırmacılarla sınırlı olduğunu belirtelim.
Şubat ayında Zuckerberg, Meta’nın şirketteki işten çıkarmalar ve yeniden yapılanma sonrasında “mühendislerin daha üretken olmasına yardımcı olmak için yapay zekâyı kullandığını” söyledi. Facebook ayrıca, yapay zekâyı insanların ilgilerini çekebilecek içerik önermek için kullanıyor ve şirketin reklam işlerine uyguluyor.
Meta blog gönderisine göre LLaMA;
- LLaMA 65B,
- LLaMA 33B,
- LLaMA 13B ve
- LLaMA 7B
olmak üzere farklı boyutlu dört modelin birleşiminden oluşuyor. Modellerin isimlerinde yer alan sayılar, her modeldeki milyarlarca parametreyi ifade ediyor. Diğer büyük dil modelleri gibi, LLaMA da bir dizi kelimeyi girdi olarak alarak çalışıyor ve yinelemeli olarak metin oluşturmak için bir sonraki kelimeyi tahmin ediyor.
Kaynak: Facebook Parent Meta Wants to Show It’s Still a Big Contender in AI Race – CNET
Yorumlar