Deepseek’in yeni AI modeli R2’yi Huawei’nin Ascend çipleri üstünde eğitme planı başarısız oldu ve lansmanı geciktirirken Nvidia’ya geri çekilmeyi zorladı.
Aylar süresince Pekin’in itmiş olduğu anlatı, durdurulamaz teknolojik ilerleme ve kendi kendine yeterliliğe doğru bir yürüyüş oldu. Sadece, gerçekliğin ısırma alışkanlığı vardır. Çin Ai Darling Deepseek’in son sorunları, hırsın teknik sınırlamaların sert duvarını karşıladığı bir ders kitabı örneğidir.
R1 modelinin Ocak ayında başarıya ulaşmış bir halde piyasaya sürülmesinden sonrasında, Deepseek kendisini Çin’den ulusal davayı korumak için çaba sarfetmek için baskısı altında buldu. Üç kişiye bakılırsa Finansal Zamanlarbildiri açıktı: Huawei’nin çiplerini kullanın, Nvidia’nın değil.
Yeni R2 modellerini eğitmeye ulaştığında, kaynaklar Deepseek’in Huawei’nin AI cipsleriyle “kalıcı teknik sorunlara” girdiğini söylüyor. Problemler o denli temeldi ki proje durmaya başladı. Durum hakkında data sahibi bir şahıs, Mayıs ayında modelin planlanan lansmanının hurdaya çıkarılmasının ana sebebi bulunduğunu ve şirketi kimseyi beklemeyen bir pazara koyduğunu söylemiş oldu.
Bunun niçin bu kadar mühim bulunduğunu idrak etmek için, AI eğitimi ve çıkarım arasındaki farkı bilmelisiniz. Eğitim, senelerce devam eden yoğun öğrenme için bir öğrenciyi üniversiteye göndermek benzer biçimde zor kısımdır. Çok büyük oranda güç ve istikrar gerektirir. Çıkarım, mezuna bir sual sormak benzer biçimde nispeten ‘kolay’ kısımdır.
Deepseek, Huawei’nin cipslerinin final sınavına hazır olabileceğini keşfetti, hemen hemen yorucu üniversite kursuna kadar olmadıklarını keşfetti. Firmanın eğitimi yapmak için Nvidia’nın kuvvetli sistemlerine geri dönmekten başka seçeneği yoktu. Kaynaklar, Deepseek’in ekibinin hala daha azca sıkıntılı çıkarım aşaması için R2 modelini Huawei Chips ile çalışmasını sağlamaya çalıştığını söylüyor.
İki şahıs, Huawei’nin R2 modelini kaldırmalarına ve fişlerinde çalıştırmalarına destek olmak için Deepseek’in ofislerine kendi mühendis ekibini bile gönderdiğini doğruladı. Sadece odadaki uzmanlarla bile başarıya ulaşmış bir eğitim koşusu alamadılar.
Sektördeki hep beraberce konuşun ve bunun büyük bir sürpriz olmadığını söyleyecekler. Huawei CEO’su Ren Zhengfei, bu senenin başlarında ABD’nin “Huawei’nin başarılarını abarttığını” ve firmanın “hemen hemen o denli da büyük olmadığını” söylemiş oldu, en iyi yongalarının hala bir nesil bulunduğunu belirtti.
Bununla beraber, Pekin hala teknoloji devlerini mahalli donanımı tercih etmek benzer biçimde etken olarak zorluyor ve Financial Times, firmaların şimdi NVIDIA’nın ihracata uyumlu H20 çiplerinin emirlerini haklı çıkarması icap ettiğini bildiriyor. Yerli bir şampiyon oluşturmak için bir stratejinin bir parçasıdır, sadece şirketleri teknik olarak daha uygun seçimler halletmeye zorlayabilir.
Deepseek’in kurucusu Liang Wenfeng’in ekibine R2 modeline yönelik genel ilerlemeden memnun olmadığını söylemiş oldu. Onları daha yükseğe hedeflemeye ve şirketi AI sanayi liderleri içinde dokunabilecek bir şey inşa etmeye itmiş olduğu söyleniyor.
Tüm yukarıdan aşağıya direktifler ve ulusal gurur için mühendislik yasaları hala geçerlidir. Deepseek’in hikayesi, AI üstünlüğü için küresel yarışta kısayol olmadığını hatırlatıyor. Çin uzun oyunu oynuyor, sadece şimdilik performans tacı sıkıca Nvidia’nın kafasında kalıyor.
Ek olarak bakınız: Ren Zhengfei: Çin’in AI geleceği ve Huawei’nin uzun oyunu
Sanayi liderlerinden suni zeka ve büyük veriler hakkında daha çok data edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, öteki önde gelen etkinliklerle beraber toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
Techforge tarafınca desteklenen öteki yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.