Alexa konuşma tavşan deliğinden aşağı iniyor – Teknolojik Haberler


re:Mars’ta sahnede Bu hafta Amazon, doğal dilin akışını taklit etmeyi amaçlayan gelişen bir Alexa özelliğini sergiledi. İki insan arasındaki konuşma nadiren önceden tanımlanmış bir yapıyı takip eder. Garip ve beklenmedik yerlere gider. Katılımcılar yaşadıkları deneyimlerini enjekte ederken, bir konu diğerine geçiş yapar.

Bir demoda, ağaçlarla ilgili bir konuşma, yürüyüş ve parklarla ilgili bir konuşmaya dönüşüyor. Şirketin yapay zekası bağlamında, kıdemli başkan yardımcısı ve Alexa’nın baş bilimcisi Rohit Prasad, fenomeni “konuşma keşfi” olarak adlandırıyor. Tam olarak uygun bir özellik için uygun bir isim değil. Bir gecede konuşmaları aniden etkinleştirmek için çevrilen bir anahtar yok. Aksine, Alexa’nın kullanıcılarla daha insani veya belki de daha insancıl bir şekilde nasıl etkileşime girebileceğine dair gelişen bir fikrin parçası.

Alexa gibi akıllı asistanlar geleneksel olarak çok daha basit bir soru-cevap modeli sağladı. Alexa’ya hava durumunu sorun ve Alexa size önceden belirlenmiş bir alandaki hava durumunu söyler. Ona A’nın puanını sorun (veya dürüst olmak gerekirse, muhtemelen yapmayın) ve Alexa size A’nın puanını söyler. Bu, bir arama motoruna soru yazmaktan farklı olmayan basit bir etkileşimdir. Ancak, yine, gerçek dünyadaki konuşmalar nadiren bu şekilde oynanır.

“Alexa’nın aldığı ve çok fazla bilgi içeren bir dizi soru var. Bu sorular gerçekleştiğinde, bunların nokta soruları olmadığını hayal edebilirsiniz, ”diyor Prasad, Teknolojik Haberler’a etkinlikte yaptığı bir konuşmada. “Gerçekten müşterinin daha fazla öğrenmek istediği bir şey hakkındalar. Şu anda aklımızda olan, enflasyonla ilgili olanlardır. Alexa’dan bunun gibi tonlarca istek alıyoruz ve bu size bu tür bir keşif deneyimi yaşatıyor.”

Bununla birlikte, bu tür konuşma özellikleri, Alexa gibi bir ev asistanının rampa yaptığı şeylerin tarzıdır. Amazon tarafından piyasaya sürülmesinden sekiz yıl sonra, asistan hala öğreniyor – veri topluyor ve tüketicilerle etkileşim kurmanın en iyi yollarını belirliyor. Bir şey Amazon’un açılış sahnesinde göstermeye hazır olduğu noktaya gelse bile, ince ayarlara ihtiyaç duyulur.

Prasad, “Alexa’nın birçok konuda uzman olması gerekiyor” dedi. “Bu büyük paradigma değişikliği ve bu tür bir uzmanlığa ulaşmak biraz zaman alıyor. Bu bir yolculuk olacak ve müşterilerimizin etkileşimleri ile Alexa’nın her şeyi öğreneceği ilk günden itibaren olmayacak. Ancak bu sorular, sonunda olduğunu sanmadığın bir şeyi yaptığın daha fazla araştırmaya dönüşebilir.”

Prasad’ın arkasındaki sahnede büyük kalın harflerle “Empati” kelimesini görmek dikkatleri üzerine çekti – belki de bir sonraki kadar olmasa da.

Hem insanlarla hem de akıllı asistanlarla bir konuşma sırasında empati kavramının etkili olabileceği veya olması gerektiği bazı basit senaryolar var. Örneğin, sosyal ipuçlarını okuma yeteneğini ele alalım. Bu, deneyim yoluyla edindiğimiz bir beceridir – yüzlerin ve bedenlerin bazen incelikli dilini okuma yeteneği. Alexa için duygusal zeka, Prashad’ın yıllardır tartıştığı bir kavram. Bu, asistanın tonunu mutluluk veya hayal kırıklığı ifade edecek şekilde değiştirmekle başlar.

Kapak tarafı, şirketin birkaç yıldır mükemmelleştirmek için çalıştığı bir kavram olan bir insan konuşmacının duygusunu belirliyor. Bu, şirketin tartışmalı giyilebilir Halo’nun 2020’deki ilk çıkışı da dahil olmak üzere çeşitli şekillerde kendini gösteren bir çalışmadır; bu, Tone adlı bir özellik sunar; bu, “bir müşterinin sesindeki enerjiyi ve pozitifliği analiz ederek başkalarına nasıl ses çıkardıklarını anlayabilmeleri ve seslerini iyileştirebilmeleri” iddiasındadır. iletişim ve ilişkiler.”

Prasad, “Bence hem empati hem de etki, ilişkiler kurma açısından iyi bilinen etkileşim yollarıdır” dedi. “Alexa, duygusal durumunuza karşı sağır olamaz. İçeri girdiyseniz ve mutlu bir ruh halinde değilseniz, ne yapmanız gerektiğini söylemek zor. Sizi iyi tanıyan biri farklı bir şekilde tepki verecektir. Yapay zeka için çok yüksek bir çıta ama görmezden gelemeyeceğiniz bir şey.”

Yönetici, Alexa’nın bazı kullanıcılar için – özellikle de eski demografi arasında – zaten bir tür arkadaş haline geldiğini belirtiyor. Daha sohbete dayalı bir yaklaşım muhtemelen bu fenomeni daha da geliştirecektir. Astro’nun bu haftaki demolarında şirket, ev robotunun evde neredeyse evcil hayvan benzeri bir işlevi doldurduğunu sık sık dile getirdi. Bununla birlikte, bu tür kavramların sınırlamaları vardır.

Prasad, “Bunun bir AI olduğu gerçeğini gizlememesi gerekiyor” dedi. “Konuya gelince [where] Ayırt edilemez – ki bundan çok uzağız – yine de çok şeffaf olmalı.”

Bir sonraki video, konuşan bir kişinin inandırıcı bir tahminini oluşturmak için bir dakikalık sesten yararlanan etkileyici yeni bir ses sentezi teknolojisini gösterdi. İçinde bir büyükannenin sesi torununun “Oz Büyücüsü”nü okuyor. Sevdiklerinizi makine öğrenimi yoluyla anma fikri tamamen yeni değil. MyHeritage gibi şirketler, örneğin ölen akrabaların görüntülerini canlandırmak için teknolojiyi kullanıyor. Ancak bu senaryolar her zaman – ve anlaşılır bir şekilde – bazı pürüzleri artırıyor.

Prasad, demonun daha çok bir kavram kanıtı olduğunu ve altta yatan ses teknolojilerini vurguladığını belirtmekte gecikmedi.

“Bu daha çok teknolojiyle ilgiliydi” diye açıkladı. “Müşteri takıntılı bir bilim şirketiyiz. Bilimimizin müşteriler için bir anlam ifade etmesini istiyoruz. Üretim ve sentezlemenin doğru kapılar olmadan kullanıldığı birçok şeyin aksine, bu bir müşterinin seveceği gibi geliyor. Onlara kimin sesi olduğu da dahil olmak üzere doğru kontrolleri vermeliyiz.”

Bunu akılda tutarak, böyle bir özellik için bir zaman çizelgesi yoktur – eğer gerçekten, böyle bir özellik Alexa’da gerçekten var olacaksa. Ancak yönetici, ona güç sağlayacak teknolojinin Amazon Labs’ta çok fazla çalıştığını ve çalıştığını belirtiyor. Yine de, gelirse, yukarıda belirtilen şeffaflığın bir kısmını gerektirecektir.

Deepfake’lerin aksine, ne için kullanıldığı konusunda şeffafsanız, net bir karar verici varsa ve müşteri verilerini ve ne için kullanılmasını istediğini kontrol ediyorsa, bence bu doğru adımlar dizisidir. ” Prasad açıkladı. “Bu, ‘ölü büyükanne’ ile ilgili değildi. Bu konuda büyükanne hayatta, sadece bu konuda çok net olmak için. ”

Alexa’nın 10 ila 15 yıl sonra nasıl görüneceği sorulduğunda Prasad, her şeyin seçimle ilgili olduğunu açıklıyor – ancak Alexa’yı bireysel ve benzersiz kişiliklerle donatmak yerine, kullanıcılara esnek bir bilgi işlem platformu sunmaktan daha az.

“İstediğin her şeyi başarabilmeli,” dedi. “Sadece sesle değil; doğru anda zekadır, ortam zekasının devreye girdiği yer burasıdır. Bazı durumlarda size proaktif olarak yardımcı olmalı ve ihtiyacınızı tahmin etmelidir. Bu, konuşma keşfini daha da ileriye götürdüğümüz yerdir. Aradığınız her şey – bir tatil rezervasyonu yapmak için ne kadar zaman harcadığınızı hayal edin [when you don’t] seyahat acentesi var. İstediğiniz kamerayı veya televizyonu satın almak için ne kadar zaman harcadığınızı hayal edin. Aramak için zaman harcamanızı gerektiren her şey çok daha hızlı hale gelmelidir.”



Kaynak : https://techcrunch.com/2022/06/23/alexa-goes-down-the-conversational-rabbit-hole/

Yorum yapın