Suni zeka her şeyi hissedebilse de, ilk olarak dünyanın 7.000 dilinin ufak bir kısmında çalışır ve küresel nüfusun büyük bir kısmını geride bırakır. Nvidia Bu göze çarpan kör noktayı, bilhassa Avrupa’da düzeltmeyi amaçlıyor.
Şirket, geliştiricilere 25 değişik Avrupa dili için yüksek kaliteli konuşma suni zekası oluşturma gücü vermeyi amaçlayan yeni bir yeni açık kaynaklı vasıta seti yayınladı. Bu büyük dilleri ihtiva eder, sadece daha da önemlisi, Hırvat, Estonya ve Malta benzer biçimde büyük teknoloji tarafınca çoğunlukla göz ardı edilenlere bir yaşam çizgisi sunar.
Amaç, geliştiricilerin sizi hakikaten anlayan oldukca dilli söyleşi botlarından, göz açıp kapayıncaya kadar çalışan oldukca dilli söyleşi botlarından, çoğumuzun verdiği türden kaynaklı araçlar yaratmasına izin vermektir.
Bu girişimin merkezi Granarlıkçok büyük bir insan konuşma kütüphanesi. Suni zeka, konuşma tanıma ve çevirinin nüanslarını öğretmeye destek olmak için küratörlüğünde ortalama bir milyon saatlik ses ihtiva eder.
Bu konuşma verilerini kullanmak için NVIDIA ek olarak dil görevleri için tasarlanmış iki yeni AI modeli sunuyor:
- Canary-1B-V2karmaşık transkripsiyon ve tercüme işlerinde yüksek doğruluk için inşa edilmiş büyük bir model.
- Parakakeet-TDT-0.6B-V3Hızın her şey olduğu gerçek zamanlı uygulamalar için tasarlanmıştır.
Arkasındaki bilime dalmak istiyorsanız, Granary üzerine kağıt Bu ay Hollanda’daki evler arası konferansta sunulacak. Ellerini kirletmeye istekli geliştiriciler için veri kümesi ve her iki model de sarılma yüzünde mevcuttur.
Sadece gerçek sihir, bu verilerin iyi mi yaratıldığı mevzusunda yatmaktadır. Çoğumuz biliyoruz ki antrenman suni zeka oldukca oranda veri gerektirir, sadece bunu elde etmek çoğu zaman yavaş, pahalı ve açıkçası can sıkan bir insan ek açıklaması sürecidir.
Bunu aşmak için, Nvidia’nın Konuşma AI ekibi – araştırmacılarla çalışmak Carnegie Mellon Üniversitesi Ve Fondazione Bruno Kessler – Otomatik bir boru hattı oluşturdu. Kendi Nemo vasıta setlerini kullanarak, pişmemiş, etiketsiz ses alabildiler ve bir AI’nın öğrenebileceği yüksek kaliteli, yapılandırılmış verilere kırbaçlayabildiler.
Bu yalnız teknik bir başarı değil; Dijital kapsayıcılık için büyük bir sıçrama. Riga yada Zagreb’deki bir geliştiricinin sonunda mahalli dillerini doğru bir halde anlayan sesle çalışan AI araçları oluşturabileceği anlamına gelir. Ve bunu daha verimli yapabilirler. Araştırma ekibi, tahıl ambarı verilerinin o denli etkili bulunduğunu ve öteki popüler veri kümelerine kıyasla hedef doğruluk seviyesine ulaşmanın ortalama yarısının ortalama yarısını aldığını buldu.
İki yeni model bu gücü gösteriyor. Kanarya açıkçası bir canavardır, rakiplerin büyüklüğünün üç katı, sadece hızın on katına kadar modelleri olan tercüme ve transkripsiyon kalitesi sunar. Ayrıca Parkeet, bir seferde 24 dakikalık bir toplantı kaydını çiğneyebilir ve otomatikman hangi dilin konuşulduğunu otomatikman bulabilir. Her iki model de noktalama, büyük harf kullanımı ve ustalaşmış derslik uygulamaları oluşturmak için lüzumlu olan kelime seviyesi vakit damgalarını sağlayacak kadar akıllıdır.
Bu kuvvetli araçları ve onların arkasındaki şekilleri küreselin ellerine koyarak geliştirici topluluğuNvidia yalnız bir ürünü yayınlamakla kalmıyor. Nereden olursanız olun, AI’nın dilinizi konuşmuş olduğu bir dünya yaratmayı umarak yeni bir inovasyon dalgası başlatıyor.
(Fotoğraf Aedrian Salazar)
Ek olarak bakınız: Huawei AI yongası başarısız olduktan sonrasında Deepseek R2 modeli için Nvidia’ya döner
Sanayi liderlerinden suni zeka ve büyük veriler hakkında daha çok data edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, öteki önde gelen etkinliklerle beraber toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
Techforge tarafınca desteklenen öteki yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.