Paris, Texas’tan geliyormuş gibi konuşan ajan mı? Paris, Fransa’yı deneyin – Teknolojik Haberler


Günlük yaşantılarımız küreselleşmiş bir şebekeye her zamankinden daha fazla bağlıdırlar. Ürünler uzaktan tedarik edilir ve gönderilir; 3.000 mil uzaktaki bir yere gitmek, trafikte büyük bir şehri geçmekten daha kolay olabilir; ve bilgi bir parmak dokunuşuyla herkese ve herkese yayılır.

adlı bir startup Sanalar aynı dili konuşan ancak farklı aksanlara sahip insanların, aksanlı sesleri filtreleyerek ve bu aksanları gerçek zamanlı olarak diğer aksanlara dönüştürerek birbirlerini nasıl daha iyi anlayabileceklerini, bu şebekenin kritik bir bileşeninin daha sorunsuz çalışmasını amaçlayan bazı AI ses teknolojisi geliştirdi. . Bugün, başlangıç, araçları için güçlü bir ivmenin ardından, görünmezlikten çıkıp daha geniş çapta piyasaya sürüldüğü için 32 milyon dolarlık bir finansman sağlayacağını duyuruyor.

Insight Partners, yeni destekçiler GV (eski adıyla Google Ventures), stratejik destekçi Assurant Ventures ve melek yatırımcı Gokul Rajaram’ın katılımıyla yatırıma liderlik ediyor. Önceki destekçiler Human Capital, General Catalyst, Quiet Capital ve DN Capital de bu Seri A turuna katılıyor. Yatırımın yanı sıra Sanas, dünyanın en büyük BPO’larından biri olan Alorica ile teknolojiyi dünya çapında 100.000 çalışana ve 250 kurumsal müşteriye sunan stratejik bir ortaklığı da duyuruyor.

Şirket değerlemeyi açıklamıyor, ancak bunun 150 milyon dolar sonrası para olduğunu anlıyoruz. Bu A Serisi, bir sesli AI girişimi için en büyüklerden biri ve anladığımız kadarıyla Sanas’ın Google’dan bir satın alma teklifini reddetmesinden sonra geliyor. (Onları satın alamıyorsanız, onlara yatırım yapın!)

Yatırımcı listesinden de tahmin edebileceğiniz gibi, Sanas’ın teknolojisi şimdiden çağrı merkezlerinde kullanılıyor. Spesifik olarak, bir müşteriyle aynı dili konuşabilen, ancak ağır aksanlı aracılara karşı bir suistimal yatağı haline gelen, çok uzaklara yayılmış müşteri hizmetleri sağlayıcıları ile çok fazla çekiş buldu.

Sigorta devi Assurant ve BPO leviathan Alorica’ya ek olarak, diğer müşteriler arasında büyük tahsilat acentesi şirketi ERC ve seyahat endüstrisi BPO IGT yer alıyor. Sanas’ın CEO’su ve kurucu ortağı Maxim Serebryakov, dünyamızın durumuyla ilgili üzücü bir yorumda, teknolojinin bu yerlerde kullanılmasının sonucunun ajan tacizindeki azalma açısından çarpıcı olduğunu söyledi.

Sanas’ın planı, finansmanı hem bu dikeydeki işini genişletmeye devam etmek hem de kuruluştaki diğer kullanım durumları için, örneğin görüntülü aramalar için bir eklenti veya ses tabanlı etkileşimli hizmetler için şekillendirmeye başlamak için kullanmaktır. makinelerin (ve ML tabanlı sistemlerin) daha geniş bir vurgu yelpazesini anlamasına yardımcı olmak için.

Serebryakov, dördüncü bir arkadaşlarının okuldan ayrılıp kendi ülkesi Nikaragua’ya dönmesi ve yardım etmek için bir iş bulması gerektiğinden, Stanford’un yapay zeka laboratuvarında iki öğrenci olan Shawn Zhang ve Andrés Pérez Soderi ile birlikte şirketi kurdu. bir aile acil durumu.

Arkadaş, ABD’deki müşterilere hizmet veren bir çağrı merkezinde eve döndü ve tamamen akıcı olmasına rağmen – ve Stanford’dan daha az ara vermeyen bir öğrenci – telefonda sevmeyen insanlardan sonsuz suistimalle karşı karşıya kaldı. onun aksanı.

Diğer üçü de birinci nesil göçmenler oldukları için yargılamanın, tepki vermenin ve suistimal etmenin hepsini çok iyi anladılar (ve şunu da ekleyeyim ki ben de hem şimdiki hayatımda, hem de ABD’de birinci nesil göçmen). Ve böylece, bunu düzeltip düzeltemeyeceklerini görmek için AI öğrenmelerini test etmeye karar verdiler. (Bu yılın başlarında Sanas, aynı zamanda şu anda COO olan dördüncü bir kurucu ortak olan Sharath Keshava’yı da aldı ve kurucu ortağı olduğu başka bir şirket olan Observe.ai’yi şirket hakkında bilgi edindikten ve onun inşasında yer almak istedikten sonra bıraktı. )

Bugün bir kişinin sesini gerçek zamanlı veya gecikmeli olarak “otomatik olarak ayarlamak” ve değiştirmek için tonlarca araç var – bu noktada bunlar fotoğraf filtreleri kadar yaygın. Ancak Serebryakov’un belirttiği gibi, doğal, gerçek sesi koruyabilmek ve söylediklerini nasıl söylediğini değiştirebilmek özellikle zor.

İlginç bir şekilde, sorun çok soyutlanmış bir sorundur – Sanas, binlerce saatlik farklı aksanlı konuşmayı bir sisteme sokarak ve diğer seslerle eşleşmesini düzenleyerek, şimdi de bir patentte de bulunan tüm teknoloji ve yöntem karışımıyla onu düzeltmeye yaklaştı. süreç — sonuç, Sanas’ın aksan “çeviri” motorunun, tahmin edebileceğiniz gibi sadece İngilizce ile değil, herhangi bir dilde kullanılabilmesidir. (Serebryakov bana örneğin Japonya, Çin ve Güney Kore’de aksanları “düzeltmek” için kullanıldığını söylüyor.

“Bunun gibi bir teknoloji, bir aksandan diğerine küresel olarak uygulanabilir” dedi. “Zaman alacak, ancak amacımız insanların herhangi bir aksanla iletişim kurmasını sağlamak.”

Sanas’ın burada uğraştığı ve yaptığı şey kavramının etrafında kesin bir rahatsızlık var. Bu, potansiyel suistimalle ilgili birçok soruyu gündeme getiriyor ve bunun dışında bazıları, teknolojinin bir kişinin gerçek kimliğini gizlemek için özel olarak geliştirilmesini tatsız ve modası geçmiş bulabilir: Yargılayan insanlar, öğrenmesi gerekenleri vurgulamamalı mı? Başkalarını yabancı veya farklı olarak gösteren herhangi bir şeyi saklayarak önyargıları sonsuza kadar barındıran insanlar yerine daha açık fikirli ve kabul edici olmak mı?

Ancak bunlara karşı çıkan noktalar da var. Sanas, özellikle tüketiciler için herhangi bir uygulama geliştirmiyor veya şu anda tam olarak bunun nasıl kötüye kullanılabileceğinden dolayı teknolojisini onlar için erişilebilir hale getirmiyor. Müşterileri bile teknolojinin bulut tabanlı bir sürümünü kullanmıyor: işleri ekstra güvenli tutmak için şirket içinde oturuyor ve böylece müşteriler Sanas aracılığıyla geçen ve oluşturulan kendi verilerini kontrol ediyor.

Gerçek kimliği gizleme adına, bu kesinlikle hepimizin günlük olarak ele alması gereken daha büyük bir sorun. Ve bu arada, bu, bu pürüzlerin en keskin ucunda olanlara daha iyi başa çıkmanın bir yolunu veriyor ve bazı çok pratik yollarla insanların (iyi niyetli olanlar bile) birbirlerini anlamalarını kolaylaştırıyor. vurgular araya giriyor.

Görüşmem sırasında, Sanas’ın Hindistan’daki müşterilerinin acentelerinden birini aradığı ve önce kendi aksanıyla ve ardından orta batı-nötr tonunu “açarak” benimle sohbet etmesini sağladığı bir hizmet demosu aldım. Arka planda neler olduğunu bilmek biraz ürkütücüydü, ama yüzeyde, her şeyin ne kadar doğal göründüğüne çok şaşırdım – en azından yeterince doğal. Sesi netti, ama belki biraz fazla net ve neredeyse biraz robotik ve duygudan uzaktı.

Görünüşe göre, bu da şimdilik biraz kasıtlı ve müşterilerin ve diğer kullanıcıların istediği buysa gelişebilir.

Serebryakov, “Çağrı merkezlerine odaklanmamızın nedeni, düşük asılı bir meyve olmasıdır,” dedi ve etkili bir şekilde çığır açan teknolojiyi inşa etmenin zorluklarının yeterince zor olduğunu, ancak kullanım durumuna da uyduğunu belirtti. “Bunu inşa ederken bizim için en az direniş yolundan gitmek önemliydi. Şarkı söylemek yok, kahkaha yok, aşırı duygusal konuşma yok. Üzerinde çalıştığımız şey, bu kullanıcıların iş yerinde nasıl etkileşime gireceği üzerinde kontrol sağlamaya çalışmak.” Beyzbolda ağlamak yok, çağrı merkezinde de eğlence ve oyun yok.

Insight’ta MD olan Ganesh Bell yaptığı açıklamada, “Insight Partners, Sanas ile bu kadar ileri ve dönüştürücü bir teknolojideki ilişkisini derinleştirmekten heyecan duyuyor” dedi. “Şirket gizlilik aşamasından çıkarken, birçok şeyin yanı sıra, ikinci derecede İngilizce konuşanların yaşadığı talihsiz önyargıları ve ayrımcılığı ortadan kaldırmaya yardımcı olacak bir ürün oluşturmak için bu son derece yetenekli ve tutkulu ekiple çalışmayı dört gözle bekliyorum. Sanas’ın birçok çalışanını içeren bir dil.”



Kaynak : https://techcrunch.com/2022/06/22/that-agent-who-sounds-like-theyre-from-paris-texas-try-paris-france/

Yorum yapın