Karınca Grubu girildi Çinli fintech devinin hesaplama verimliliğini gelişmiş akıl yürütme kabiliyetleriyle dengelemede bir atılım olarak konumlandırdığı yeni açık kaynaklı dil modeli Ling-1T ile trilyon parametreli suni zeka modeli arenası.
9 Ekim’deki duyuru, suni zeka altyapısını birden fazla model mimarisinde hızla inşa eden Alipay operatörü için mühim bir dönüm noktasına işaret ediyor.
Trilyon parametreli suni zeka modeli, karmaşık matematiksel akıl yürütme görevlerinde rekabetçi bir performans göstererek, suni zeka sistemlerinin sorun çözme kabiliyetlerini değerlendirmek için kullanılan bir standart olan 2025 Amerikan Davetli Matematik Imtihanı (AIME) kıyaslamasında %70,42 doğruluk elde ediyor.
Ant Group’un teknik özelliklerine bakılırsa Ling-1T, mesele başına averaj 4.000’den fazla çıktı tokeni tüketirken bu performans seviyesini koruyor ve netice kalitesi açısından firmanın “sınıfının en iyisi suni zeka modelleri” olarak tanımladığı modelin yanına yerleşiyor.
İçindekiler
Suni zekanın ilerlemesine çift yönlü yaklaşım
Trilyon parametreli suni zeka modelinin piyasaya sürülmesi, Ant Group’un, yayılma dili modelleri için tasarlanmış hususi bir çıkarım çerçevesi olan dInfer’i piyasaya sürmesiyle aynı zamana denk geliyor. Bu paralel sürüm stratejisi, firmanın tek bir mimari paradigma yerine çoklu teknolojik yaklaşımlara olan inancını yansıtıyor.
Difüzyon dili modelleri, ChatGPT şeklinde yaygın olarak kullanılan söyleşi robotlarının temelini oluşturan otoregresif sistemlerden bir sapmayı temsil eder. Sıralı metin oluşturmanın aksine, dağıtım modelleri çıktıları paralel olarak üretir; bu, görüntü ve video oluşturma araçlarında aslına bakarsanız yaygın olan sadece dil işlemede daha azca yaygın olan bir yaklaşımdır.
Ant Group’un dInfer’e yönelik performans ölçümleri mühim verimlilik kazanımları ortaya koyuyor. Firmanın LLaDA-MoE yayılma modeli üstünde meydana getirilen testler, HumanEval kodlama kriterinde saniyede 1.011 token elde ederken, Nvidia’nın Fast-dLLM çerçevesi için saniyede 91 token ve Alibaba’nın vLLM altyapısı üstünde çalışan Qwen-2.5-3B modeli için saniyede 294 token elde edildi.
Ant Group’taki araştırmacılar, ekteki teknik belgelerde “dInfer’in, hızla büyüyen dLLM alanında araştırma ve geliştirmeyi hızlandırmak için hem ergonomik bir vasıta seti hem de standartlaştırılmış bir platform sağladığına inanıyoruz” dedi.
Dil modellerinin ötesinde ekosistem genişlemesi
Ling-1T trilyon parametreli suni zeka modeli, Ant Group’un son aylarda bir araya getirmiş olduğu daha geniş bir suni zeka sistemleri ailesi içinde yer ediniyor.
Firmanın portföyü artık üç ana seriyi kapsıyor: standart dil görevleri için düşünmeyen Ling modelleri, karmaşık akıl yürütme için tasarlanmış Ring düşünme modelleri (daha ilkin piyasaya sürülen Ring-1T önizlemesi dahil) ve görüntüleri, metni, sesi ve videoyu işleyebilen Ming multimodal modelleri.
Bu çeşitlendirilmiş yaklaşım, LLaDA-MoE olarak adlandırılan deneysel bir modele kadar uzanır; bu model, Uzmanların Karması (MoE) mimarisini kullanır; bu teknik, belirli görevler için büyük bir modelin yalnızca ilgili bölümlerini etkinleştirerek kuramsal olarak verimliliği artırır.
Ant Group’un baş teknoloji sorumlusu He Zhengyu, firmanın bu sürümler etrafındaki konumunu deklare etti. “Ant Group olarak, Suni Genel Zekanın (AGI) bir kamu malı, insanlığın akıllı geleceği için ortak bir kilometre taşı olması gerektiğine inanıyoruz” dedi ve hem trilyon parametreli suni zeka modelinin hem de Ring-1T önizlemesinin açık kaynaklı sürümlerinin “açık ve işbirliğine dayalı ilerlemeye” yönelik adımları temsil ettiğini ekledi.
Kısıtlı bir ortamda rekabet dinamikleri
Ant Group’un açıklamalarının zamanlaması ve niteliği, Çin’in suni zeka sektöründeki stratejik hesaplamalara ışık tutuyor. İhracat kısıtlamaları sebebiyle son teknoloji yarı iletken teknolojisine erişimin sınırı olan olduğu Çinli teknoloji firmaları, rekabette fark yaratan unsurlar olarak algoritmik inovasyonu ve yazılım optimizasyonunu giderek daha çok vurguluyor.
TikTok’un ana şirketi ByteDance, benzer şekilde Temmuz ayında Seed Diffusion Preview adlı bir difüzyon dili modelini tanıttı ve karşılaştırılabilir otoregresif mimarilere bakılırsa beş kat hız artışı iddia etti. Bu paralel çabalar, verimlilik avantajları sunabilecek alternatif model paradigmalarına sektör çapında ilgi duyulduğunu gösteriyor.
Sadece, yayılma dili modellerinin ergonomik benimsenme yörüngesi belirsizliğini koruyor. Otoregresif sistemler, müşteriye yönelik uygulamaların temel gereksinimleri olan naturel dil anlama ve oluşturmadaki kanıtlanmış performansı sebebiyle ticari dağıtımlarda hakim olmaya devam ediyor.
Pazar konumlandırması olarak açık kaynak stratejisi
Ant Group, trilyon parametreli suni zeka modelini dInfer çerçevesinin yanı sıra kamuya açık hale getirerek, bazı rakiplerinin kapalı yaklaşımlarıyla çelişen işbirlikçi bir geliştirme modeli izliyor.
Bu strateji potansiyel olarak inovasyonu hızlandırırken, Ant’ın teknolojilerini daha geniş suni zeka topluluğu için temel altyapı olarak konumlandırıyor.
Şirket eş zamanlı olarak, otonom suni zeka aracılarında devamlı öğrenmeyi desteklemeyi amaçlayan bir çerçeve olan AWorld’ü de geliştiriyor; bu sistemler, kullanıcılar adına görevleri bağımsız olarak tamamlamak suretiyle tasarlanmış sistemlerdir.
Bu birleşik çabaların Ant Group’u küresel suni zeka gelişiminde mühim bir güç haline getirip getiremeyeceği, kısmen performans iddialarının gerçek dünyada doğrulanmasına ve kısmen de yerleşik platformlara alternatif arayan geliştiriciler arasındaki benimseme oranlarına bağlıdır.
Trilyon parametreli suni zeka modelinin açık kaynak yapısı, hızla gelişen teknolojinin başarısına yatırım meydana getiren bir kullanıcı topluluğu oluştururken bu doğrulama sürecini kolaylaştırabilir.
Şimdilik açıklamalar, büyük Çinli teknoloji firmalarının mevcut suni zeka ortamını, aynı anda birden fazla boyutta yenilik hayata geçirmeye istekli yeni girişimcileri barındıracak kadar akıcı olarak gördüklerini gösteriyor.
Ek olarak bakınız: Ant Group, suni zeka modellerini eğitmek ve maliyetleri düşürmek için yerli çipleri kullanıyor
Sektör liderlerinden suni zeka ve büyük veri hakkında daha çok informasyon edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, TechEx ve aşağıdakiler de dahil olmak suretiyle öteki önde gelen teknoloji etkinlikleriyle aynı yerde bulunmaktadır: Siber Güvenlik Fuarıtıklamak Burada daha çok informasyon için.
AI News tarafınca desteklenmektedir TechForge Medyası. Yaklaşan öteki kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.