Alibaba’nın yeni Qwen Akıl Yürütme AI modeli açık kaynaklı kayıtlar ayarlıyor

Date:

Alibaba’dan Qwen ekibi, etkisinde bırakan ölçütlerle açık kaynaklı akıl yürütme AI modellerinin yeni bir versiyonunu yayınladı.

Qwen3-235B-A22B-Düşünme-2507 ile tanışın. Son üç ay süresince, Qwen ekibi, akıl yürütmesinin hem standardını hem de derinliğini artırmayı amaçlayan suni zekalarının “düşünme kabiliyeti” dediklerini ölçeklendirmek için zor oldu.

Çabalarının sonucu, hakkaten zor şeylerde muhteşem olan bir modeldir: mantıksal akıl yürütme, karmaşık matematik, bilim problemleri ve ileri kodlama. Tipik olarak bir insan uzmanı gerektiren bu alanlarda, bu yeni Qwen modeli artık açık kaynaklı modeller için standardı belirliyor.

Akıl yürütme ölçütlerinde, Qwen’in son olarak açık kaynaklı AI modeli, kodlama için AIME25’te 92.3 ve LiveCodeBench V6’da 74.1’e ulaşır. Ek olarak, insan tercihleriyle ne kadar iyi hizalandığını ölçen Arena-Hard V2’de 79.7 puan alan daha genel kabiliyet testlerinde kendi başına.

Alibaba Qwen ekibinin en son Qwen3-235B-A22B-Düşünme-2507 açık kaynaklı akıl yürütme AI modeli için rakiplere kıyasla ölçütleri.

Kalbinde, bu toplamda 235 milyar parametreye haiz Qwen ekibinden büyük bir akıl yürütme suni zeka modeli. Bununla beraber, ekspertlerin (MOE) karışımını kullanır, bu da herhangi bir zamanda bu parametrelerin yalnız bir kısmını-yaklaşık 22 milyar-aktive etmiş olduğu anlamına gelir. Bunu çağrıda 128 uzmandan oluşan büyük bir ekibe haiz olmak şeklinde düşünün, sadece hakkaten üstünde çalışmak için yalnız belirli bir vazife için en uygun sekiz şahıs getirildi.

Kim bilir en etkisinde bırakan özelliklerinden biri büyük hafızasıdır. Qwen’in açık kaynaklı akıl yürütme suni zeka modeli, 262.144 jetonlu mahalli bağlam uzunluğuna haizdir; Fazlaca oranda bilgiyi anlamayı içeren görevler için büyük bir avantaj.

Oradaki geliştiriciler ve tamirciler için Qwen ekibi başlamayı kolaylaştırdı. Model şu adreste mevcut Sarılma Yüzü. Kendi API uç noktanızı oluşturmak için Sglang yada VLLM şeklinde araçları kullanarak dağıtabilirsiniz. Ekip ek olarak, modelin vasıta çağırma becerilerini kullanmanın en iyi yolu olarak Qwen-Agent çerçevelerine işaret ediyor.

Açık kaynaklı AI akıl yürütme modellerinden en iyi performansı elde etmek için Qwen ekibi birkaç ipucu paylaştı. Bir çok vazife için ortalama 32.768 jeton çıkış uzunluğu öneriyorlar, sadece hakkaten karmaşık zorluklar için, AI’ya “düşünmek” için kafi alan vermek için 81.920 jetona yükseltmelisiniz. Ek olarak, en doğru ve iyi yapılandırılmış cevapları elde etmek için matematik problemleri için “adım adım” istemek şeklinde, modeline hususi talimatlar vermenizi önerirler.

Bu yeni Qwen modelinin piyasaya sürülmesi, bilhassa karmaşık, beyin bükme görevleri söz mevzusu olduğunda, en iyi tescilli modellerden bazılarına rakip olabilecek kuvvetli sadece açık kaynaklı bir akıl yürütme suni zeka sunuyor. Geliştiricilerin sonucunda nihai olarak ne inşa ettiğini görmek coşku verici olacak.

(Fotoğraf Tung lam)

Ek olarak bakınız: AI Fiil Planı: ABD liderliği ’emsalsiz’ olmalı

Sanayi liderlerinden suni zeka ve büyük veriler hakkında daha çok data edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, öteki önde gelen etkinliklerle beraber toplanır. Akıllı Otomasyon KonferansıBlockx Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.

Techforge tarafınca desteklenen öteki yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Popular

More like this
Related