Moonshot AI, maliyetin çok altında bir maliyetle GPT-5 ve Claude’u nasıl yendi?

Date:

Çinli bir suni zeka girişimi olan Moonshot, Kimi K2 Thinking modelinin birden fazla performans kriterinde OpenAI’nin GPT-5’ini ve Anthropic’in Claude Sonnet 4.5’ini geçmesinin arkasından suni zeka gelişimindeki beklentileri bozdu ve ABD’nın suni zeka hakimiyetinin uygun maliyetli Çin inovasyonuyla tehdit edilip edilmediği mevzusunda yenilenen tartışmaları ateşledi.

Kıymeti 3,3 milyar ABD doları olan ve teknoloji devleri Alibaba Group Tüm ortaklık ile Tencent Holdings tarafınca desteklenen Pekin merkezli Moonshot AI, 6 Kasım’da açık kaynaklı Kimi K2 Thinking modelini piyasaya sürdü ve sanayi gözlemcilerinin başka bir “DeepSeek anı” olarak adlandırdığı şeyi başardı; Hangzhou merkezli startup’ın suni zeka maliyet varsayımlarını daha ilkin bozmasına bir gönderme.

Performans ölçümleri ABD modellerine meydan okuyor

Firmanın GitHub bloguna nazaran postalamakKimi K2 Thinking, geniş bir mevzu yelpazesinde 2.500 sorudan oluşan geniş bir dil modeli ölçütü olan Humanity’s Last Exam’de GPT-5’in %41,7’sini aşan %44,9 puan aldı.

Model hem de web tarama yeterliliğini ve büyük dil modeli aracılarının informasyon arama kalıcılığını değerlendirenBrowseComp kıyaslamasında %60,2 elde etti ve gerçek dünya araştırma sorgularında arama destekli modellere meydan okumak için tasarlanan Seal-0 kıyaslamasında %56,3 puan alarak önder oldu.

VentureBeat rapor edildi GPT-5’in puanlarını karşılayan yada aşan tamamen açık ağırlık sürümünün, kapalı sınır sistemleri ile kamuya açık modeller arasındaki boşluğun üst düzey akıl yürütme ve kodlama açısından etkin bir halde çöktüğü bir dönüm noktasına işaret etmiş olduğu.

Maliyet verimliliği soruları gündeme getiriyor

Modelin popülaritesi, CNBC’nin eğitim maliyetinin yalnızca 4,6 milyon ABD doları bulunduğunu bildirmesinin arkasından arttı, sadece Moonshot AI maliyet hakkında yorum yapmadı. Meydana getirilen hesaplamalara nazaran Güney Çin Sabah PostasıKimi K2 Thinking’in uygulama programlama arayüzünün maliyeti, OpenAI ve Anthropic modellerine nazaran altı ila 10 kat daha ucuzdu.

Model, çıkarım başına 32 milyarı etkinleştirilen bir trilyon toplam parametreye haiz bir Uzmanlar Karması mimarisini kullanıyor ve son olarak teknoloji performansı korurken kabaca iki kat üretim hızı artışı elde etmek için INT4 nicelemesi kullanılarak eğitildi.

Hugging Face’in kurucu ortağı Thomas Wolf, yorum yaptı X’te Kimi K2 Thinking’in açık kaynaklı bir modelin kapalı kaynaklı bir modelden geçmesinin bir başka örneği bulunduğunu söyleyerek şu suali sordu: “Bu başka bir DeepSeek anı mı? Beklemeli miyiz? [one] artık birkaç ayda bir mi?”

Teknik kabiliyetler ve sınırlamalar

Moonshot AI araştırmacıları söz konusu Kimi K2 Thinking, “akıl yürütme, kodlama ve temsilci kabiliyetlerini değerlendiren kriterlerde yeni rekorlar” kırdı. Model, karmaşık sorunları çözmek için yüzlerce adımda tutarlı bir halde akıl yürüterek, insan müdahalesi olmadan 200-300’e kadar sıralı vasıta çağrısını gerçekleştirebilir.

Suni Çözümleme danışmanlığı tarafınca meydana getirilen bağımsız testler, Kimi K2’yi Tau-2 Bench Telecom temsilcilik kıyaslamasında %93 doğrulukla zirveye yerleştirdi. tarif edildi bağımsız olarak ölçtüğü en yüksek puan olarak.

Sadece Allen Suni Zeka Enstitüsü’nden araştırmacı Nathan Lambert, en iyi kapalı ve açık modeller içinde ham performansta hala ortalama dört ila altı aylık bir vakit farkı bulunduğunu öne sürdü. kabul edildi Çin laboratuvarlarının yakınlaştığını ve temel ölçütlerde oldukça kuvvetli performans sergilediğini görüyoruz.

Piyasa tesirleri ve rekabet baskısı

Pekin merkezli bir informasyon teknolojisi sistemi mimarı olan Zhang Ruiwang, eğilimin Çinli şirketlerin maliyetleri düşük tutması bulunduğunu söyleyerek şöyleki deklare etti: “Çin modellerinin genel performansı hâlâ en iyi ABD modellerinin arkasında kalıyor, bundan dolayı bir çıkış yolu bulabilmek için maliyet etkinliği alanında rekabet etmeleri gerekiyor.”

Danışmanlık iiMedia’nın baş analisti Zhang Yi, Çin suni zeka modellerinin eğitim maliyetlerinde, model mimarisi ve eğitim tekniklerindeki yenilikler ve kaliteli eğitim verilerinin girişi sebebiyle “yar benzeri bir düşüş” görüldüğünü ve bunun da ilk günlerde informasyon işlem kaynaklarının yığılmasından uzaklaşmaya işaret ettiğini söylemiş oldu.

Model, tek bir kısıtlamayla tüm ticari ve türev hakları elde eden Değiştirilmiş MIT Lisansı altında piyasaya sürüldü: aylık 100 milyondan fazla etken kullanıcıya hizmet veren dağıtımcılar yada üreten Ayda 20 milyon ABD dolarının üstünde gelir elde etmek için, ürünün kullanıcı arayüzünde belirgin bir halde “Kimi K2” yazılmalıdır.

Sektörün tepkisi ve geleceğe bakış

Erken aşama risk sermayesi şirketi Menlo Ventures’ın ortağı Deedy Das, X’teki bir gönderide şöyleki yazdı: “Bugün suni zekada bir dönüm noktası. Çin açık kaynaklı modeli 1 numara. Suni zekada ufuk açıcı bir an”.

Nathan Lambert, bir Substack makalesinde, Moonshot AI ve DeepSeek dahil olmak suretiyle Çinli açık kaynaklı suni zeka geliştiricilerinin başarısının, “kapalı laboratuvarları iyi mi terlettiklerini” gösterdiğini yazdı ve şunları ekledi: “Ciddi fiyat baskısı ve beklentiler var [the US developers] yönetmemiz gerekiyor”.

Bu sürüm, Moonshot AI’yi, uygun maliyetli inovasyon ve açık kaynak geliştirme stratejileri vasıtasıyla ABD’nın suni zeka üstünlüğü söylemine giderek daha çok meydan okuyan DeepSeek, Qwen ve Baichuan şeklinde öteki Çinli suni zeka şirketlerinin yanında konumlandırıyor.

Bunun sürdürülebilir bir rekabet pozitif yanları mı yoksa kabiliyetlerde geçici bir yakınlaşmayı mı temsil etmiş olduğu, hem ABD’li hem de Çinli firmalar modellerini geliştirmeye devam ettikçe görülecektir.

Açıklamaların kamuoyuna açık olması ve piyasanın tepkisi, yakında ciddi tartışmaların başlayabileceğini gösteriyor.

Suni zeka çip ortamı bir değişiklik dönemine giriyor. Kuruluşlar altyapı stratejilerinde esnekliği korumalı ve Tesla-Intel şeklinde ortaklıkların suni zeka donanım üretiminin rekabetçi dinamiklerini iyi mi tekrardan şekillendirebileceğini izlemelidir.

Çip üretim ortaklıkları hakkında bugün alınan kararlar, gelecek yıllarda hangi kuruluşların uygun maliyetli, yüksek performanslı suni zeka altyapısına erişebileceğini belirleyebilir.

Fotoğraf: Ay Atışı Yapay Zekası)

Ek olarak bakınız: DeepSeek’te kesinti: Çin’deki suni zeka inovasyonu küresel teknoloji uçurumunu daraltıyor

Sektör liderlerinden suni zeka ve büyük veri hakkında daha çok informasyon edinmek ister misiniz? Çıkış yapmak Yapay Zeka ve Büyük Veri Fuarı Amsterdam, Kaliforniya ve Londra’da gerçekleşiyor. Bu kapsamlı etkinlik, TechEx ve öteki önde gelen teknoloji etkinlikleriyle aynı yerde bulunuyor. Tıklamak Burada daha çok informasyon için.

AI News tarafınca desteklenmektedir TechForge Medyası. Yaklaşan öteki kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Popular

More like this
Related

Japonya Faiz Oranlarını 30 Yılın En Yüksek Seviyesine Çıkaracak ve BTC’ye Başka Bir Tehdit Oluşturacak

Japonya Merkez Bankası'nın (BoJ) Ocak ayından bu yana ilk...

Do Kwon, Terra Çöküşü Nedeniyle 15 Yıl Hapse Mahkûm Edildi

Terraform Labs'ın kurucu ortağı Do Kwon, tahmini 40 milyar...

USDT İhraççısı, Futbol Kulübüne 1 Milyar Dolar Yatırım Yaparak Tam Devralma İstiyor

Dünyanın en büyük stablecoini USDT'nin arkasındaki kripto şirketi Tether...