Aslına bakarsanız ses asistanlarında mühim bir oyuncu olan Soundhound AI, teknolojisine bir çift göz veriyor.
Bir dönüm noktasının ötesine geçtiğini ve telefonunuzu çekmeden otomobilinize “Orada bina ne?” Diye sorduğunuzu hayal edin. Ve anında yanıt almak. Soundhound Ai’nin inşa etmiş olduğu şey bu.
Vision AI’nın lansmanı ile Soundhound’un yeni sistemi, teknolojiyle etkileşim kurmanın oldukca daha akıllı ve daha naturel bir yolu yaratmak için görüşü sesle birleştiriyor. Düşünce, insanoğlu olarak iyi mi işlediğimizi yansılamak etmektir; Yalnız birini dinlemiyoruz, bununla birlikte hareketlerini ve neye baktıklarını da görüyoruz.
Aynı bağlamsal anlayışı AI’ya getirerek, Soundhound, günümüz akıllı cihazlarının çoğunda haiz olduğumuz hantal ve sık sık sinir bozucu deneyimi düzeltmeyi umuyor. Şirket, bir sonraki arabanızda, ister restoranda yada bir yapınak katında olsun, bu kombine duyunun büyük bir fark yaratabileceği gerçek dünya uygulamalarını hedefliyor.
Soundhound AI CEO’su Keyvan Mohajer şunları söylemiş oldu: “Soundhound’da AI’nın geleceğinin yalnız oldukca modlu olmadığına inanıyoruz-derinden entegre, duyarlı ve gerçek dünya tesiri için inşa ediliyor.
“Vision AI ile, insanların işletmeler tarafınca sunulan ve kullanılan ürün ve hizmetlerle iyi mi etkileşime girdiğini tekrardan tanımlamak için ses ve konuşma suni zekasında liderliğimizi genişletiyoruz.”
Peki iyi mi çalışır? Vision AI, bir kameradan canlı bir yem alır ve firmanın naturel konuşmayı anlamada muhteşem olan ses teknolojisi ile kaynaştırır. Sistem, gördüklerini ve aynı anda duyduklarını işleyerek, kullanıcının gerçek niyetini kolay bir ses asistanı asla yapamayacağı şekilde kavrayabilir.
Bir motor kısmına bakabilen ve talimatlar isteyebilen, araçlarını bırakmadan anında görsel ve ses rehberliği alabilen akıllı gözlükler giyen bir tamirciyi düşünün. Bir dükkanda, bir personel yalnız gerçek zamanlı bir envanter sayısı elde etmek için onlara bakarak rafları tarayabilir. Geri kalanımız için, söylediğimiz anda ekrandaki siparişimizi görsel olarak doğrulayan bir sürüş kiosk anlamına gelebilir.
Bu şekilde bir sistem yaratmada en büyük teknik sorunlardan biri, ses ve görsel öğelerin muhteşem bir halde senkronize edilmesini sağlamaktır. Herhangi bir gecikme naturel bir konuşma yanılsamasını parçalayacaktır.
Pranav Singh, VP of Engineering at SoundHound AI, commented: “With Vision AI, we are fusing visual recognition and conversational intelligence into a single, synchronised flow. Every frame, every utterance, every intent is interpreted within the same ecosystem—ensuring faster, more natural user experiences that scale across surfaces from kiosks to embedded devices.
“Bu, danışma ve infazın kesişiminde yenilik, gördüklerinizi gören, söylediklerinizi duyan ve şu anda yanıt veren suni zeka sunuyor.”
Bu teknolojiyi benimseyen işletmeler için söz, daha süratli hizmet, daha azca hata ve daha mutlu müşteriler sağlamaktır. Sürtünmeyi ortadan kaldırmak ve teknolojiyi daha azca çalıştırmanız ihtiyaç duyulan bir vasıta şeklinde hissettirmek ve daha oldukca şeyleri yapmanıza destek olan bir ortak şeklinde yapmakla ilgilidir.
Bu yeni görsel kabiliyeti, ses çıkardığı tek yükseltme değil. Şirket ek olarak yeni bir güncelleme olan Amelia 7.1 ile sisteminin “beynini” geliştirdi. Bu geliştirme bunu yapar AI ajanları Daha süratli, daha doğru ve işletmelere iyi mi çalışmış oldukları mevzusunda daha çok denetim ve şeffaflık kazandırır.
Soundhound, görme ve sesi birleştirerek bizi AI ile etkileşimin başka biriyle konuşmak kadar kolay ve sezgisel hissettiği bir dünyaya yaklaşmayı hedefliyor.
(Fotoğraf Christian Lue)
Ek olarak bakınız: Alan Turing Enstitüsü: Beşeri Bilimler AI’nın geleceğinin anahtarıdır
Sanayi liderlerinden suni zeka ve büyük veriler hakkında daha çok data edinmek ister misiniz? Çıkış yapmak AI ve Big Data Fuarı Amsterdam, California ve Londra’da gerçekleşiyor. Kapsamlı etkinlik, öteki önde gelen etkinliklerle beraber toplanır. Akıllı Otomasyon Konferansı– Blockx– Dijital Dönüşüm HaftasıVe Siber Güvenlik ve Bulut Fuarı.
Techforge tarafınca desteklenen öteki yaklaşan kurumsal teknoloji etkinliklerini ve web seminerlerini keşfedin Burada.