AIBABA’nın AI transkripsiyon araçlarını süper şarj etmek için yeni Qwen modeli

Date:

AI konuşma transkripsiyon araçları Alibaba ile oldukca daha rekabetçi olmak suretiyle Qwen Qwen3-ASR-flash modelini açığa çıkaran ekip.

Kuvvetli Qwen3-Omni istihbaratı üstüne inşa edilmiş ve on milyonlarca saatlik konuşma verisine haiz büyük bir veri kümesi kullanılarak eğitilmiş, bu yalnız başka bir AI konuşma tanıma modeli değil. Ekip, zor akustik ortamlarla yada karmaşık dil kalıplarıyla karşılaştığında bile son aşama doğru performans sunmak için tasarlandığını söylüyor.

Peki, rekabete karşı iyi mi birikiyor? Ağustos 2025’te meydana getirilen testlerden performans verileri oldukça etkisinde bırakan bulunduğunu gösteriyor.

Standart Çinliler için halka açık bir testte, Qwen3-ASR-Flash yalnız yüzde 3,97’lik bir hata oranı elde etti ve Gemini-2.5-Pro ​​(%8.98) ve GPT4O-transkribe (%15.72) şeklinde rakipleri daha rekabetçi AI konuşma transkripsiyon araçları için vaat etti.

Qwen3-ASR-Flash, Çin aksanlarını ele almada yüzde 3,48’lik bir hata oranı bulunduğunu kanıtladı. İngilizce olarak, Gemini’nin yüzde 7,63’ünü ve GPT4O’nun yüzde 8,45’ini yenerek rekabetçi bir yüzde 3,81 puan aldı.

Fakat hakkaten kafaları döndürdüğü yerde fena şöhretli zor bir alanda: müzik kopyası.

Şarkılardan şarkı sözlerini tanımakla görevlendirildiğinde, Qwen3-Asr-Flash yalnız yüzde 4,51’lik bir hata oranı yayınladı, bu da rakiplerinden oldukca daha iyi. Müziği anlama kabiliyeti, tam şarkılardaki dahili testlerde doğrulandı ve burada yüzde 9,96’lık bir hata oranı attı; İkizler 2.5-Pro’dan yüzde 32.79 ve GPT4O-transkribe’den yüzde 58,59 üstünde büyük bir gelişme.

ASR Hata Oranları Alibaba Qwen'in Qwen3-ASR-Flash Testi Transkripsiyon araçları için kullanılan diğer popüler AI konuşma tanıma modellerini karşılaştırır.

Etkisi altına alan doğruluğunun ötesinde, model yeni nesil AI transkripsiyon araçları için masaya bazı yenilikçi özellikler getiriyor. En büyük oyun değiştiricilerden biri esnek bağlamsal önyargısıdır.

Başlıca anahtar kelime listelerini titizlikle biçimlendiren günleri unutun, bu sistem kullananların özelleştirilmiş sonuçlar elde etmek için model arka plan metnini nerede ise her şekilde beslemelerine olanak tanır. Anahtar kelimelerin, tüm belgelerin ve hatta her ikisinin de dağınık bir karışımının kolay bir listesini sağlayabilirsiniz.

Bu süreç, bağlamsal bilginin karmaşık ön işlemine olan ihtiyacı ortadan kaldırır. Model, doğruluğunu keskinleştirmek için bağlamı kullanacak kadar akıllıdır; Sadece, sağladığınız metin tamamen alakasız olsa bile genel performansı zor etkilenmektedir.

Alibaba’nın bu AI modeli için tutkusu küresel bir konuşma transkripsiyon aracı olmaktır. Hizmet, oldukca sayıda lehçe ve aksanla tamamlanan 11 dili kapsayan tek bir modelden doğru transkripsiyon sunar.

Çince desteği bilhassa derindir, Mandarin’i Kantonca, Sichuanese, Minnan (Hokkien) ve Wu şeklinde büyük lehçelere ek olarak kapsar.

İngiliz konuşmacılar için İngiliz, Amerikan ve öteki bölgesel aksanları ele alıyor. Öteki desteklenen dillerin etkisinde bırakan ekibi, Fransızca, Almanca, İspanyolca, İtalyanca, Portekizce, Rus, Japon, Koreli ve Arapça içeriyor.

Hepsini yuvarlamak için, model 11 dilden hangisinin konuşulduğunu tam olarak belirleyebilir ve sessizlik yada arka plan gürültüsü şeklinde konuşma dışı segmentleri reddetme mevzusunda yetersizdir, bu da AI konuşma transkripsiyon araçlarından daha temiz çıkış sağlar.

Ek olarak bakınız: Siddhartha Choudhury, Booking.com: AI ile çevrimiçi dolandırıcılıkla savaşım etmek

AI & Big Data Expo Etkinlik Serisi için Banner.

Sanayi liderlerinden suni zeka ve büyük veriler hakkında daha çok data edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik bir parçası Techex ve öteki önde gelen teknoloji etkinlikleriyle beraber bulunuyor, tıklayın Burada Daha çok data için.

AI haberleri tarafınca desteklenmektedir Techforge Medya. Yaklaşan öteki kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Share post:

Popular

More like this
Related