Coin Haber

Yeni model tasarımı, yüksek kurumsal yapay zeka maliyetlerini düzeltebilir

calm ai model enterprise ai costs architecture design artificial intelligence.jpg

Suni zeka modellerini devreye almanın yüksek maliyetleriyle boğuşan kurumsal liderler, yeni mimari tasarım yardımıyla bu durumdan kurtulabilir.

Üretken suni zekanın kabiliyetleri çekici olsa da, hem eğitim hem de çıkarım için çok önemli hesaplama talepleri, fahiş harcamalara ve çevresel kaygıların artmasına niçin oluyor. Bu verimsizliğin merkezinde, modellerin metni sırayla, simge bazında üreten otoregresif bir süreçteki “temel darboğaz”ı içeriyor.

Geniş veri akışlarını işleyen kuruluşlar için Nesnelerin İnterneti ağları Finansal piyasalar açısından bu sınırlama, uzun biçimli analizlerin oluşturulmasını hem yavaş hem de ekonomik açıdan sıkıntılı hale getirmektedir. Sadece yeni bir araştırma makalesi Tencent yapay zeka Ve Tsinghua Üniversitesi bir alternatif önermektedir.

Suni zeka verimliliğine yeni bir yaklaşım

Araştırma Devamlı Otoregresif Dil Modellerini (CALM) tanıtıyor. Bu yöntem, ayrı bir belirteç yerine devamlı bir vektörü kestirmek için üretim sürecini tekrardan tasarlar.

Yüksek kaliteli bir otomatik kodlayıcı “sıkıştır[es] oldukca daha yüksek bir anlamsal bant genişliğine haiz olan bir yığın K tokeni tek bir devamlı vektöre dönüştürür.

Model, “the”, “cat”, “sat” şeklinde bir şeyi üç adımda işlemek yerine bu tarz şeyleri tek adımda sıkıştırıyor. Bu tasarım direkt “üretken adımların sayısını azaltır” ve hesaplama yüküne saldırır.

Deneysel sonuçlar daha iyi bir performans-bilgisayar değişimini göstermektedir. Dört jetonu gruplandıran CALM AI modeli, bir müessese için “kuvvetli ayrı temellerle karşılaştırılabilir, sadece mühim seviyede daha düşük hesaplama maliyetiyle” performans sağlamış oldu.

Mesela bir CALM modeli, benzer kapasiteye haiz bir temel Transformer’a kıyasla yüzde 44 daha azca eğitim FLOP’u ve yüzde 34 daha azca çıkarım FLOP’u gerektiriyordu. Bu, hem eğitimin başlangıç ​​ana para giderinde hem de çıkarımların yinelenen operasyonel giderlerinde tasarrufa işaret etmektedir.

Devamlı tesir alanı için vasıta setinin tekrardan oluşturulması

Sonlu, ayrık bir kelime dağarcığından sonsuz, devamlı bir vektör uzayına geçiş, standart Yüksek Lisans vasıta setini bozar. Araştırmacıların yeni modeli uygulanabilir kılmak için “kapsamlı, olasılıksız bir çerçeve” geliştirmeleri gerekiyordu.

Eğitim için model standart bir softmax katmanını yada maksimum olabilirlik tahminini kullanamaz. Bunu çözmek için ekip, modeli açık olasılıkları hesaplamadan doğru tahminler için ödüllendiren bir Enerji Transformatörü ile “olasılıksız” bir hedef kullandı.

Bu yeni eğitim yöntemi bununla birlikte yeni bir değerlendirme ölçütünü de gerektiriyordu. Şaşkınlık şeklinde standart kıyaslamalar, modelin artık hesaplamadığı aynı olasılıklara dayandıkları için uygulanamaz.

Ekip, yalnızca model örneklerinden tahmin edilebilecek, Brier puanına dayalı yeni bir ölçüm olan BrierLM’yi önerdi. Doğrulama, BrierLM’nin güvenilir bir alternatif bulunduğunu doğruladı ve geleneksel yitik ölçümleriyle “Spearman’ın sıra korelasyonu -0,991” bulunduğunu gösterdi.

Son olarak çerçeve, kurumsal kullanımın mühim bir özelliği olan kontrollü üretimi geri yükler. Olasılık dağılımı olmadan standart sıcaklıkta örnekleme mümkün değildir. Makalede, çıktı doğruluğu ve çeşitlilik arasındaki dengeyi yönetmek için ergonomik bir toplu yaklaşım yöntemi de dahil olmak suretiyle yeni bir “olasılıksız örnekleme algoritması” tanıtılmaktadır.

Kurumsal suni zeka maliyetlerinin azaltılması

Bu araştırma, üretken suni zekanın yalnızca giderek artan parametre sayılarıyla değil, mimari verimlilikle tanımlandığı bir geleceğe dair bir bakış sunuyor.

Ölçeklendirme modellerinin mevcut yolu, azalan getiriler ve artan maliyetlerle dolu bir duvara çarpıyor. CALM çerçevesi “LLM ölçeklendirmesi için yeni bir tasarım ekseni oluşturur: her üretken adımın anlamsal bant genişliğinin arttırılması”.

Bu bir araştırma çerçevesi olmasına ve kullanıma hazır bir ürün olmamasına karşın, ultra verimli dil modellerine doğru kuvvetli ve ölçeklenebilir bir yola işaret ediyor. Satıcı yol haritalarını değerlendirirken teknoloji liderleri model boyutunun ötesine bakmalı ve mimari verimlilik hakkında sorular sormaya başlamalıdır.

Üretilen jeton başına FLOP’ları azaltma kabiliyeti, belirleyici bir rekabet pozitif yanları haline gelecek ve suni zekanın, veri merkezinden veri ağırlıklı uç uygulamalara kadar maliyetleri azaltmak için müessese genelinde daha ekonomik ve sürdürülebilir bir halde konuşlandırılmasına olanak tanıyacak.

Ek olarak bakınız: Kusurlu suni zeka kıyaslamaları kurumsal bütçeleri riske atıyor

TechEx etkinliklerinin Yapay Zeka ve Büyük Veri Fuarı için Banner.

Sektör liderlerinden suni zeka ve büyük veri hakkında daha çok data edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, TechEx ve aşağıdakiler de dahil olmak suretiyle öteki önde gelen teknoloji etkinlikleriyle aynı yerde bulunmaktadır: Siber Güvenlik Fuarıtıklamak Burada daha çok data için.

AI News tarafınca desteklenmektedir TechForge Medyası. Yaklaşan öteki kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

Exit mobile version