Microsoft, Phi-3 kompakt dil modelleri ailesini tanıttı

Date:

Microsoft’un sahip olduğu duyuruldu Phi-3 açık küçük dil modelleri (SLM’ler) ailesi, bunların mevcut boyutları arasında en yetenekli ve uygun maliyetli modeller olduğunu öne sürüyor. Microsoft araştırmacıları tarafından geliştirilen yenilikçi eğitim yaklaşımı, Phi-3 modellerinin dil, kodlama ve matematik kıyaslamalarında daha büyük modellerden daha iyi performans göstermesine olanak tanıdı.

“Görmeye başlayacağımız şey, büyükten küçüğe bir geçiş değil, tekil bir model kategorisinden, müşterilerin kendileri için en iyi modelin ne olduğuna karar verme olanağına sahip olduğu bir model portföyüne geçiş olacaktır. Senaryo,” dedi Microsoft Üretken Yapay Zeka Baş Ürün Müdürü Sonali Yadav.

3,8 milyar parametreli ilk Phi-3 modeli Phi-3-mini artık halka açık durumda. Azure AI Model Kataloğu, Sarılma Yüz, Ollamave bir NVIDIA NIM mikro hizmet. Kompakt boyutuna rağmen Phi-3-mini, iki katı büyüklüğündeki modellerden daha iyi performans gösterir. Phi-3-small (7B parametreleri) ve Phi-3-medium (14B parametreleri) gibi ek Phi-3 modelleri yakında gelecektir.

Microsoft Yapay Zekadan Sorumlu Başkan Yardımcısı Luis Vargas, “Bazı müşteriler yalnızca küçük modellere ihtiyaç duyabilir, bazıları büyük modellere ihtiyaç duyabilir ve birçoğu da her ikisini de çeşitli şekillerde birleştirmek isteyecektir” dedi.

SLM’lerin temel avantajı, ağ bağlantısı olmadan düşük gecikmeli yapay zeka deneyimleri için cihaz üzerinde dağıtıma olanak tanıyan daha küçük boyutlarıdır. Potansiyel kullanım örnekleri arasında akıllı sensörler, kameralar, tarım ekipmanları ve daha fazlası yer alır. Gizlilik, verileri cihazda tutmanın başka bir avantajıdır.

(Kredi: Microsoft)

Büyük dil modelleri (LLM’ler), geniş veri kümeleri üzerinde karmaşık akıl yürütme konusunda üstündür; bilimsel literatürdeki etkileşimleri anlayarak ilaç keşfi gibi uygulamalara uygun güçlü yönlerdir. Bununla birlikte, SLM’ler daha basit sorgu yanıtlama, özetleme, içerik oluşturma ve benzerleri için ilgi çekici bir alternatif sunar.

CTO ve Kurucu Ortak Victor Botev, “Microsoft, daha büyük modelleri kovalamak yerine, daha dikkatli bir şekilde seçilmiş veriler ve özel eğitim içeren araçlar geliştiriyor” dedi. Iris.ai.

“Bu, trilyonlarca parametreye sahip modellerin devasa hesaplama maliyetleri olmadan gelişmiş performans ve muhakeme yeteneklerine olanak tanıyor. Bu sözün yerine getirilmesi, yapay zeka çözümleri arayan işletmeler için büyük bir benimseme engelinin ortadan kaldırılması anlamına gelecektir.”

Çığır açan eğitim tekniği

Microsoft’un SLM kalite sıçramasını sağlayan şey, uyku öncesi hikaye kitaplarından ilham alan yenilikçi veri filtreleme ve oluşturma yaklaşımıydı.

“Yalnızca ham web verileriyle eğitim vermek yerine neden son derece yüksek kalitede veriler aramıyorsunuz?” diye sordu SLM araştırmasının önde gelen Microsoft Başkan Yardımcısı Sebastien Bubeck.

Ronen Eldan’ın kızıyla her gece okuma rutini, 4 yaşındaki bir çocuğun bileceği kelime kombinasyonlarından oluşan büyük bir modelin yönlendirilmesiyle oluşturulan milyonlarca basit anlatıdan oluşan bir ‘Küçük Hikayeler’ veri seti oluşturma fikrini ateşledi. Dikkat çekici bir şekilde, TinyStories üzerinde eğitilen 10 milyon parametreli bir model, mükemmel dilbilgisine sahip akıcı hikayeler üretebilir.

Bu erken başarının üzerine ekip, ‘CodeTextbook’ veri kümesini oluşturmak için eğitim değeri açısından incelenmiş yüksek kaliteli web verilerini tedarik etti. Bu, hem insanlar hem de büyük yapay zeka modelleri tarafından yapılan yönlendirme, oluşturma ve filtreleme turları yoluyla sentezlendi.

Bubeck, “Bu sentetik verilerin üretilmesine büyük özen gösteriliyor” dedi. “Ürettiğimiz her şeyi almıyoruz.”

Yüksek kaliteli eğitim verilerinin dönüştürücü olduğu kanıtlandı. Bubeck, “Ders kitabına benzer bir materyalden okunduğu için dil modelinin bu materyali okuma ve anlama görevini çok daha kolay hale getiriyorsunuz” diye açıkladı.

Yapay zeka güvenlik risklerinin azaltılması

Dikkatli veri iyileştirmeye rağmen Microsoft, tüm üretken yapay zeka modelleri için standart süreçlerini yansıtan Phi-3 sürümüne ek güvenlik uygulamaları uygulamayı vurguluyor.

Bir blog yazısında, “Tüm üretken yapay zeka modeli sürümlerinde olduğu gibi, Microsoft’un ürün ve sorumlu yapay zeka ekipleri, Phi-3 modellerinin geliştirilmesinde riskleri yönetmek ve azaltmak için çok katmanlı bir yaklaşım kullandı” ifadesine yer verildi.

Bu, beklenen davranışları güçlendirmek için daha fazla eğitim örnekleri, kırmızı ekip aracılığıyla güvenlik açıklarını belirlemeye yönelik değerlendirmeler ve müşterilere Phi-3 üzerinde güvenilir uygulamalar oluşturmaları için Azure AI araçları sunmayı içeriyordu.

(Fotoğrafı çeken Tadas Sar)

Ayrıca bakınız: Microsoft, Güney Koreli teknoloji liderleriyle yapay zeka ortaklıkları kuracak

Sektör liderlerinden yapay zeka ve büyük veri hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, aşağıdakiler de dahil olmak üzere diğer önde gelen etkinliklerle aynı yerde bulunuyor: BlockX, Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

TechForge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

Etiketler: ai, yapay zeka, dil modelleri, microsoft, açık kaynak, phi-3, küçük dil modelleri

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Subscribe

spot_imgspot_img

Popular

More like this
Related

ALGO, AVAX, HNT, LINK Fiyat Analizi: 5 Mayıs

ALGO'nun fiyatı 0,21 dolara yükselebilirken AVAX 40,00 dolarlık direnci...

XRP, SEC’in 6 Mayıs’ta Yayınlayacağı Yanıt Özeti Öncesinde Düşüşte

Kullanıcılar SEC'in 6 Mayıs'taki yanıt özetini beklerken XRP Cumartesi...

İlk 4 ICO: BlockDAG Vs. 5. Manzara, Duman, Meme Kombat

İlk Para Teklifleri (ICO'lar), kripto para birimi sektöründe fon...

UNI Yatırımcılarının Faaliyetleri Ortasında BDAG’ın Ön Satış Artışı; BCH Fiyat Güncellemeleri

Uniswap yatırımcıları SEC'in yasal tehditlerine tepki gösterirken ve Bitcoin...