Amazon, 980M parametre LLM’yi ‘ortaya çıkan yeteneklerle’ eğitiyor

Date:

Amazon’daki araştırmacılar, “ortaya çıkan” yetenekler sergilediğini iddia ettikleri metinden konuşmaya yönelik yeni bir büyük dil modeli (LLM) geliştirdiler.

BASE TTS adı verilen 980 milyon parametreli model, şimdiye kadar oluşturulmuş en büyük metinden konuşmaya modelidir. Araştırmacılar, belirli bir ölçeği aştıklarında doğal dil işleme modellerinde meydana gelen performans sıçramalarının aynısını gözlemleyip gözlemleyemeyeceklerini görmek için çeşitli boyutlardaki modelleri 100.000 saate kadar kamuya açık konuşma verileri üzerinde eğitti.

10.000 saatlik ses ile eğitilmiş orta büyüklükteki 400 milyon parametreli modellerinin zorlu test cümlelerinde çok yönlülük ve sağlamlık açısından belirgin bir gelişme gösterdiğini buldular.

Test cümleleri, normalde metinden konuşmaya sistemlerini tetikleyen bileşik isimler, duygular, yabancı kelimeler ve noktalama işaretleri gibi karmaşık sözcüksel, sözdizimsel ve dil dışı özellikler içeriyordu. BASE TTS bunları mükemmel bir şekilde ele almasa da, mevcut modellere göre vurgu, tonlama ve telaffuzda önemli ölçüde daha az hata yaptı.

Araştırmacılar, “Bu cümleler, BASE TTS’nin hiçbiri açıkça gerçekleştirmek üzere eğitilmediği zorlu görevleri içerecek şekilde tasarlandı” diye açıkladı.

Modelin 100.000 saatlik ses ile eğitilmiş en büyük 980 milyon parametreli versiyonu, 400 milyon parametreli versiyonun ötesinde başka yetenekler göstermedi.

Deneysel bir süreç olsa da, BASE TTS’nin oluşturulması, bu modellerin ölçeklendikçe yeni çok yönlülük eşiklerine ulaşabildiğini gösteriyor; bu, konuşmaya dayalı yapay zeka için cesaret verici bir işaret. Araştırmacılar, ortaya çıkan yetenekler için en uygun model boyutunu belirlemek amacıyla daha fazla çalışma planlıyor.

Model aynı zamanda hafif ve akıcı olacak, duygusal ve prozodik verileri ayrı ayrı paketleyecek şekilde tasarlandı. Bu, doğal ses veren konuşma sesinin düşük bant genişliğine sahip bağlantılar üzerinden iletilmesine izin verebilir.

BASE TTS belgesinin tamamını arXiv’de bulabilirsiniz Burada.

(Fotoğrafı çeken Nik Açık Sıçratmayı kaldır)

Ayrıca bakınız: OpenAI, belirli kullanıcılara ChatGPT belleği sunuyor

Sektör liderlerinden yapay zeka ve büyük veri hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, aşağıdakiler de dahil olmak üzere diğer önde gelen etkinliklerle aynı yerde bulunuyor: BlockX, Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

TechForge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

Etiketler: ai, Amazon, yapay zeka, temel tts, konuşmaya dayalı yapay zeka, geniş dil modeli, llm

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Popular

More like this
Related

Kanada, ABD Yaklaşımını Yansıtarak 2025 Federal Bütçesinde Stablecoin’leri Düzenlemeye Yönelik Harekete Geçiyor

Kanada, 2025 federal bütçesi kapsamında fiat destekli stablecoin'ler için...

Çin, ABD Mallarına Yönelik %24 Tarifeyi Askıya Alırken Bitcoin Başarı veya Kırılma Seviyesine Yakın

Bitcoin Bitcoin$101.607,60 ABD-Çin tecim gerilimlerindeki azalma işaretlerinin ortasında,...

Solana 4 Ayın En Düşük Seviyesine Ulaştı: 171 Doları Geri Alabilir mi?

Solana, Temmuz başından bu yana en düşük seviyesine geriledi...

UBS, Chainlink’in DTA’sını Kullanarak Tokenize Fon İşlemini Tamamladı – Zincir İçi Finansta Yeni Bir Dönem mi?

Yatırım bankası UBS, Chainlink Dijital Aktarma Aracısı (DTA) teknik...