Yapay zeka her şeyi hissedebilse de, öncelikle dünyanın 7.000 dilinin küçük bir kısmında çalışır ve küresel nüfusun büyük bir kısmını geride bırakır. Nvidia Bu göze çarpan kör noktayı, özellikle Avrupa’da düzeltmeyi amaçlıyor.
Şirket, geliştiricilere 25 farklı Avrupa dili için yüksek kaliteli konuşma yapay zekası oluşturma gücü vermeyi amaçlayan yeni bir yeni açık kaynaklı araç seti yayınladı. Bu büyük dilleri içerir, ancak daha da önemlisi, Hırvat, Estonya ve Malta gibi büyük teknoloji tarafından sıklıkla göz ardı edilenlere bir yaşam çizgisi sunar.
Amaç, geliştiricilerin sizi gerçekten anlayan çok dilli sohbet botlarından, göz açıp kapayıncaya kadar çalışan çok dilli sohbet botlarından, çoğumuzun verdiği türden kaynaklı araçlar yaratmasına izin vermektir.
Bu girişimin merkezi Granarlıkmuazzam bir insan konuşma kütüphanesi. Yapay zeka, konuşma tanıma ve çevirinin nüanslarını öğretmeye yardımcı olmak için küratörlüğünde yaklaşık bir milyon saatlik ses içerir.
Bu konuşma verilerini kullanmak için NVIDIA ayrıca dil görevleri için tasarlanmış iki yeni AI modeli sunuyor:
- Canary-1B-V2karmaşık transkripsiyon ve çeviri işlerinde yüksek doğruluk için inşa edilmiş büyük bir model.
- Parakakeet-TDT-0.6B-V3Hızın her şey olduğu gerçek zamanlı uygulamalar için tasarlanmıştır.
Arkasındaki bilime dalmak istiyorsanız, Granary üzerine kağıt Bu ay Hollanda’daki evler arası konferansta sunulacak. Ellerini kirletmeye istekli geliştiriciler için veri kümesi ve her iki model de sarılma yüzünde mevcuttur.
Ancak gerçek sihir, bu verilerin nasıl yaratıldığı konusunda yatmaktadır. Hepimiz biliyoruz ki antrenman yapay zeka çok miktarda veri gerektirir, ancak bunu elde etmek genellikle yavaş, pahalı ve açıkçası sıkıcı bir insan ek açıklaması sürecidir.
Bunu aşmak için, Nvidia’nın Konuşma AI ekibi – araştırmacılarla çalışmak Carnegie Mellon Üniversitesi Ve Fondazione Bruno Kessler – Otomatik bir boru hattı oluşturdu. Kendi Nemo araç setlerini kullanarak, çiğ, etiketsiz ses alabildiler ve bir AI’nın öğrenebileceği yüksek kaliteli, yapılandırılmış verilere kırbaçlayabildiler.
Bu sadece teknik bir başarı değil; Dijital kapsayıcılık için büyük bir sıçrama. Riga veya Zagreb’deki bir geliştiricinin sonunda yerel dillerini doğru bir şekilde anlayan sesle çalışan AI araçları oluşturabileceği anlamına gelir. Ve bunu daha verimli yapabilirler. Araştırma ekibi, tahıl ambarı verilerinin o kadar etkili olduğunu ve diğer popüler veri kümelerine kıyasla hedef doğruluk seviyesine ulaşmanın yaklaşık yarısının yaklaşık yarısını aldığını buldu.
İki yeni model bu gücü gösteriyor. Kanarya açıkçası bir canavardır, rakiplerin büyüklüğünün üç katı, ancak hızın on katına kadar modelleri olan çeviri ve transkripsiyon kalitesi sunar. Bu arada Parkeet, bir seferde 24 dakikalık bir toplantı kaydını çiğneyebilir ve otomatik olarak hangi dilin konuşulduğunu otomatik olarak bulabilir. Her iki model de noktalama, büyük harf kullanımı ve profesyonel sınıf uygulamaları oluşturmak için gerekli olan kelime seviyesi zaman damgalarını sağlayacak kadar akıllıdır.
Bu güçlü araçları ve onların arkasındaki yöntemleri küreselin ellerine koyarak geliştirici topluluğuNvidia sadece bir ürünü yayınlamakla kalmıyor. Nereden olursanız olun, AI’nın dilinizi konuştuğu bir dünya yaratmayı umarak yeni bir inovasyon dalgası başlatıyor.
(Fotoğraf Aedrian Salazar)
Ayrıca bakınız: Huawei AI yongası başarısız olduktan sonra Deepseek R2 modeli için Nvidia’ya döner

Endüstri liderlerinden yapay zeka ve büyük veriler hakkında daha fazla bilgi edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, diğer önde gelen etkinliklerle birlikte toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
Techforge tarafından desteklenen diğer yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.