RCaaS ‘Bir Daha Asla Günlükleri İncele’ etkinliğinden kaçırmış olabileceğiniz 3 bilgi



Günlük analizi samanlıkta iğne aramayı gerektirdiğinden, asıl soru şudur: İğneyi bulmanın en hızlı yolu nedir?

Günlükler, küçük bir alanda çok fazla bilgi taşıdıkları için depolama ve performans amaçları için idealdir. Madalyonun diğer tarafında, bu, günlük dosyalarının okunmasını zorlaştırır ve bir yazılım olayının temel nedenine ulaşmak zahmetli hale geldiğinden, yazılımın kapalı kaldığı süre boyunca maliyetli bir mesele olabilir.

Bu çıkmaza değinen SiliconANGLE Media’nın canlı yayın stüdyosu theCUBE ve bir hizmet olarak temel neden sağlayıcısı Zebrium Inc. kısa süre önce yayınlandı özel bir etkinlik Temel nedeni bulmanın neden sancılı bir süreç olmaması gerektiğine odaklanmak, çünkü gereken tek şey gözlemciyi otomatikleştirmek.

Olay sırasında, Dave VellanteWikibon Inc.’in baş araştırma görevlisi ve theCUBE endüstri analisti, bir hizmet olarak temel nedeni veya RCaaS’yi ve Cisco Systems Inc.’in RCaaS’ı %95,8 doğrulukla nasıl doğruladığını vurgulayan birkaç oturum yönetti. Uzman konuklar arasında Zebrium’un da bulunduğu Larry Lancasterkurucu ve baş teknoloji sorumlusu ve Çubuk Torbasımühendislik kurucusu ve başkan yardımcısı ile Cisco’nun atri basu (resimde, solda), yerleşik filozof ve Necati Çehreli (resimde, sağda), müşteri deneyimi inovasyonu, otomasyonu ve kesinti ekibinin teknik lideri. (* Aşağıdaki açıklama.)

“Yığını uçtan uca gözlemlemek bir şeydir, ancak gözlemcileri kim otomatikleştiriyor?” Vellante etkinliğe girişinde sordu. “Zebrium, anormallikleri tespit etmek ve temel nedenleri saptamak için denetimsiz makine öğrenimini kullanıyor ve bunu otomatik bir hizmet olarak sunuyor.”

Kaçırmış olmanız durumunda, işte üç önemli içgörü: “Hizmet Olarak Kök Neden” Etkinlik:

1) Gözlemciyi otomatikleştirmemek başarısızlık için bir reçetedir.

Bir yazılım hatası veya olay meydana geldiğinde, temel nedeni bulmak için bir DevOps mühendisinin, site güvenilirlik mühendisinin veya geliştiricinin günlük dosyalarını manuel olarak gözden geçirmesi gerekir. Bu sadece kafa karıştırıcı değil, aynı zamanda maliyetlidir, çünkü ortalama çözüm süresi veya MTTR, saatlerden günlere kadar değişebilir. Bu nedenle, Bagg’e göre, başarısızlığı önlemek için gözlemciyi otomatikleştirmek gerekli hale geliyor.

“Bir şeylerin ters gittiğini bilmek harika, ancak bunun olmasının temel nedeni, günlük dosyalarına gömülecek… oraya hızlı ulaşmak için, otomatikleştirmeniz daha iyi veya başarısızlığa mahkumsunuz ve işte burada devreye giriyoruz. “dedi Bagg.

Gözlemciyi otomatikleştirmek, arıza süresinin hızla üstesinden gelmek için bir adımdır ve Zebrium, dakikalar içinde temel neden analizine olanak tanıyan RCaaS aracılığıyla bunu sağlar. Bagg, RCaaS’ın belirli bir AIOps şirketinin SRE’sini saatlerce kapalı kalma süresinden nasıl kurtarabileceğine dikkat çekti.

Bagg, “Bu entegrasyonu takmamıştı, bu yüzden bu olayı yaşadığında gösterge panelinde yoktu, ama kesinlikle bizimkindeydi,” dedi. “Kelimenin tam anlamıyla onu saatlerce kurtarırdı. Bu sorunu 24 saatten uzun süredir devam ettirdiler ve biz de tam orada beş dakika içinde yanıt aldık.”

İşte CUBE’nin Larry Lancaster ve Rod Bagg ile yaptığı tam video röportaj:

2) RCaaS, hem şirket içinde hem de bulutta günlükleri gözden geçirmenin acısını alır.

Günlüklerle uğraşmak kolay bir manuel iş değildir, çünkü keskin bir gözle ve önemli bir uzmanlıkla bile doğru bağlamı bulmak saatler alır. Sorunun ayrıntılarını ortaya çıkarmak için milyonlarca ve milyarlarca satır yazılım ve altyapı günlük verilerinin analiz edilmesi gerekiyor.

Bir kişi manuel olarak filtreleyebilecekleriyle sınırlı olduğundan, RCaaS denetimsiz makine öğrenimi yoluyla günlükleri kazmanın acısını ortadan kaldırır ve Lancaster’a göre hem şirket içinde hem de bulutta dağıtılabilir..

“Gözlemlenebilirlik bir sistemin özelliğidir, ancak sorun şu ki, çok karmaşıksa, darboğazı göz kürenize kadar itiyorsunuz” dedi. “Bizim bulutumuzda çalıştırdığımız gibi, şirket içinde çalıştırabilirsiniz. Bulutunuzda veya kendi altyapınızda çalıştırabilirsiniz.”

RCaaS yalnızca uçtan uca bir görünüm sunmakla kalmaz, aynı zamanda hızlı çözüm için ayrıntılı bir kök neden analizi de sağlar. Bu kulağa gerçek olamayacak kadar iyi gelse de Cisco faydaları doğruladı: Lancaster’a göre şirket, Zebrium’un RCaaS çözümünü test ettikten sonra %95 doğruluk derecesi verdi.

“İnsanlar uzun süredir temel neden göstergelerini bulmanın bu insani tarafını nasıl otomatikleştireceklerini bulmaya çalışıyorlardı ve Zebrium ortaya çıkana kadar kimsenin gerçekten doğru yapmadığını iddia ediyorum” dedi. “Yani [Cisco] bu verileri Zebrium yazılımı aracılığıyla çalıştırdı ve buldukları şey, bu olayların %95’inden fazlasında Zebrium’un doğru zamanda doğru temel neden göstergelerini yansıttığıydı.”

3) Günlük analizinin siyah beyaz bir süreç olması gerekmez.

Yazılım günlükleri ezoterik ve sıkıştırılmış olduğundan, görsel ipuçlarını almak zahmetli hale gelir. Sonuç olarak satır aralarını okumak zor olduğu için log analizi yapmak siyah beyaz bir süreç olarak karşımıza çıkmaktadır. Yine de, Cisco’dan Basu’ya göre Zebrium’un RCaaS’ı daha iyi ve daha hızlı içgörüler için bu sürece renk katıyor.

Log analizini düşünürseniz, gerçekten siyah beyazdır” dedi. “Arka planın siyah ve metnin beyaz olduğu bir terminal ekranında bakıyorsunuz. Ancak Zebrium’un yaptığı, etkileşimli histogramlarını ve her olayın özetlerini kullanarak tüm sürece çok fazla renk ve bağlam sağlamasıdır.”

Günlük analizi, yazılım kesinti süresinin ayrıntılarını ortaya çıkarırken araçsal bir rol oynasa da, emek yoğun ve zaman alıcı bir süreçtir.

Basu’ya göre, Cisco’nun destek kolu – Teknik Yardım Merkezi – altındaki yaklaşık 8.000 mühendis, günlük 24.000 saatini günlük analizi yaparak harcıyordu ve bu da Basu’ya göre verimliliklerini tehlikeye attı.

“Anekdot niteliğindeki kanıtlar, ortalama olarak bir mühendisin sekiz saatinin üçünü çevrimiçi veya çevrimdışı günlükleri gözden geçirmek için harcayacağıydı” dedi. “ … 8000’den fazla mühendis ve böylece günde üç saat; Bu, günlük analizine harcanan günde 24.000 adam-saattir.”

Dahili otomasyon sisteminin bakımıyla ilgili zorluklarla karşılaştıktan sonra Cisco, günlük analizinin %50’sini otomatikleştirmek istedi, ancak Cisoc’a göre RCaaS bunu %95’e çıkardı. Çehreli.

“200 SaaS’ye yakın bir örnek setle, çoğu zaman, neredeyse zamanın %95’inde mühendisin Zebrium’un analizinde aradıkları logu bulabildiğini öğrendik” dedi.

İşte theCUBE’nin Atri Basu ve Necati Çehreli ile yaptığı tam video röportaj:

CUBE’nin tüm kapsamını izlemek için en “Hizmet Olarak Kök Neden” Etkinlikaşağıdaki tam etkinlik videosunu izleyin:

Fotoğraf: Silikon AÇI

Uzmanlardan oluşan Cube Club ve Cube Event Topluluğumuza katılarak misyonumuza desteğinizi gösterin. Amazon Web Servisleri ve Amazon.com CEO’su Andy Jassy, ​​Dell Technologies’in kurucusu ve CEO’su Michael Dell, Intel CEO’su Pat Gelsinger ve daha birçok aydınlatıcı ve uzmanı içeren topluluğa katılın.



Kaynak : https://siliconangle.com/2022/06/23/3-insights-might-missed-rcaas-never-dig-logs-event-rcaas/

Yorum yapın