Meta, çok modlu işleme, müzik üretimi ve daha fazlası için beş AI modelini tanıttı

Date:

Meta var açıklanmış Hem metni hem de görüntüleri işleyebilen çok modlu sistemler, yeni nesil dil modelleri, müzik üretimi, yapay zeka konuşma algılama ve yapay zeka sistemlerindeki çeşitliliği artırma çabaları dahil olmak üzere beş önemli yeni yapay zeka modeli ve araştırması.

Yayınlar, on yılı aşkın bir süredir açık araştırma ve işbirliği yoluyla yapay zekayı geliştirmeye odaklanan Meta’nın Temel Yapay Zeka Araştırması (FAIR) ekibinden geliyor. Yapay zeka hızla yenilik yaptıkça Meta, küresel toplulukla çalışmanın çok önemli olduğuna inanıyor.

Meta, “Bu araştırmayı kamuya açık olarak paylaşarak, yinelemelere ilham vermeyi ve sonuçta yapay zekanın sorumlu bir şekilde ilerlemesine yardımcı olmayı umuyoruz” dedi.

Bukalemun: Çok modlu metin ve görüntü işleme

Sürümler arasında Meta’nın araştırma lisansı kapsamındaki ‘Chameleon’ modellerinin temel bileşenleri de yer alıyor. Bukalemun, genellikle tek modlu olan çoğu büyük dil modelinin aksine, hem metni hem de görüntüleri aynı anda anlayabilen ve oluşturabilen çok modlu modellerden oluşan bir ailedir.

Meta, “Tıpkı insanların kelimeleri ve görüntüleri aynı anda işleyebildiği gibi, Chameleon da hem görüntüyü hem de metni aynı anda işleyebilir ve iletebilir” diye açıkladı. “Chameleon herhangi bir metin ve görüntü kombinasyonunu girdi olarak alabilir ve ayrıca herhangi bir metin ve görüntü kombinasyonunun çıktısını alabilir.”

Potansiyel kullanım durumları, yaratıcı altyazılar oluşturmaktan metin ve görsellerle yeni sahneleri harekete geçirmeye kadar neredeyse sınırsızdır.

Daha hızlı dil modeli eğitimi için çoklu belirteçli tahmin

Meta ayrıca ticari olmayan bir araştırma lisansı altında ‘çoklu belirteç tahmini’ kullanan kod tamamlama için önceden eğitilmiş modeller de yayınladı. Geleneksel dil modeli eğitimi yalnızca bir sonraki kelimeyi tahmin etmede verimsizdir. Çoklu belirteçli modeller, daha hızlı eğitim için aynı anda birden fazla gelecek kelimeyi tahmin edebilir.

“Sırasında [the one-word] yaklaşım basit ve ölçeklenebilir, aynı zamanda verimsiz. Meta, çocukların aynı düzeyde dil akıcılığını öğrenmek için ihtiyaç duyduğu miktardan birkaç kat daha fazla metin gerektiriyor” dedi.

JASCO: Geliştirilmiş metinden müziğe dönüştürme modeli

Yaratıcı tarafta, Meta’nın JASCO’su, akorlar ve vuruşlar gibi girdileri kabul ederek daha fazla kontrol sağlarken, metinden müzik klipleri oluşturulmasına olanak tanıyor.

Meta şöyle açıkladı: “MusicGen gibi mevcut metinden müziğe modeller, müzik üretimi için çoğunlukla metin girişlerine dayanırken, yeni modelimiz JASCO, oluşturulan müzik çıktıları üzerindeki kontrolü geliştirmek için akorlar veya vuruş gibi çeşitli girişleri kabul etme kapasitesine sahiptir.” .

AudioSeal: Yapay zeka tarafından oluşturulan konuşmayı algılama

Meta, AudioSeal’in yapay zeka tarafından oluşturulan konuşmayı tespit etmek için tasarlanmış ilk ses filigranlama sistemi olduğunu iddia ediyor. Daha büyük ses kliplerinde yapay zeka tarafından oluşturulan belirli bölümlerin yerini önceki yöntemlere göre 485 kata kadar daha hızlı belirleyebilir.

“AudioSeal ticari bir lisans altında piyasaya sürülüyor. Bu, üretken yapay zeka araçlarının kötüye kullanımını önlemeye yardımcı olmak için paylaştığımız birkaç sorumlu araştırmadan sadece biri” dedi Meta.

Metin-görüntü çeşitliliğini iyileştirme

Bir diğer önemli sürüm, çoğunlukla coğrafi ve kültürel önyargılar sergileyebilen metinden resme modellerinin çeşitliliğini geliştirmeyi amaçlıyor.

Meta, potansiyel coğrafi eşitsizlikleri değerlendirmek için otomatik göstergeler geliştirdi ve insanların küresel olarak coğrafi temsili nasıl algıladıklarını anlamak için 65.000’den fazla büyük bir açıklama çalışması yürüttü.

Meta, “Bu, yapay zeka tarafından oluşturulan görüntülerde daha fazla çeşitlilik ve daha iyi temsil sağlıyor” dedi. Üretken modeller arasındaki çeşitliliğin artırılmasına yardımcı olmak için ilgili kod ve ek açıklamalar yayımlandı.

Meta, bu çığır açan modelleri kamuya açık olarak paylaşarak, yapay zeka topluluğu içinde işbirliğini teşvik etmeyi ve yeniliği teşvik etmeyi umduğunu söylüyor.

(Fotoğrafı çeken Dima Solomin)

Ayrıca bakınız: NVIDIA görsel yapay zekadaki en son gelişmeleri sunuyor

Sektör liderlerinden yapay zeka ve büyük veri hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, aşağıdakiler de dahil olmak üzere diğer önde gelen etkinliklerle aynı yerde bulunuyor: Akıllı Otomasyon Konferansı, BlockX, Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

TechForge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

Etiketler: ai, yapay zeka, audioseal, bukalemun, fuar, jasco, meta, meta ai, modeller, müzik üretimi, açık kaynak, metinden resme

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Subscribe

spot_img

Popular

More like this
Related