AI/ML yatırımlarınızdan en iyi şekilde nasıl yararlanabilirsiniz: Veri altyapınızla başlayın


Transform 2022’yi 19 Temmuz’da ve neredeyse 20 – 28 Temmuz’da geri getirmekten heyecan duyuyoruz. İçgörülü görüşmeler ve heyecan verici ağ oluşturma fırsatları için yapay zeka ve veri liderlerine katılın. Bugün kayıt Ol!


Büyük Veri çağı, bilginin demokratikleşmesine yardımcı oldu, teknoloji tabanlı şirketlerde zengin bir veri ve artan gelirler yarattı. Ancak tüm bu zeka için, birçok şirket makine öğrenimi (ML) projelerini eyleme geçirilebilir ve kullanışlı hale getirmek için mücadele ettiğinden, makine öğrenimi alanından beklenebilecek düzeyde bilgi alamıyoruz. Başarılı bir AI/ML programı, büyük bir veri bilimci ekibiyle başlamaz. Güçlü veri altyapısı ile başlar. Veri bilimcilerin hızlı bir şekilde karşılaştırmalar yapabilmeleri ve iş sonuçları sunabilmeleri için verilerin sistemler arasında erişilebilir ve analize hazır olması gerekir ve verilerin güvenilir olması gerekir; bu da birçok şirketin bir veri bilimi programı başlatırken karşılaştığı zorluğa işaret eder.

Sorun şu ki, birçok şirket önce veri bilimine atlıyor, pahalı veri bilimcileri işe alıyor ve ardından veri bilimcilerinin başarılı olmak için ihtiyaç duyduğu araçlara veya altyapıya sahip olmadıklarını keşfediyor. Yüksek ücretli araştırmacılar, içgörü aramak yerine verileri sınıflandırmak, doğrulamak ve hazırlamak için zaman harcarlar. Bu altyapı çalışması önemlidir, ancak aynı zamanda veri bilimcilerin en yararlı becerilerini en fazla değer katacak şekilde kullanma fırsatını da kaçırmaktadır.

Veri yönetimiyle ilgili zorluklar

Liderler, bir veri bilimi projesinin başarısının veya başarısızlığının nedenlerini değerlendirirken (ve projelerin %87’si asla üretime geçmez), genellikle şirketlerinin güvenilir bir veri temeli oluşturmadan sonuçlara atlamaya çalıştığını keşfederler. Eğer sağlam bir temelleri yoksa, veri mühendisleri zamanlarının %44’ü API’lerde veya veri yapılarında yapılan değişikliklerle veri ardışık düzenlerinin bakımı. Verileri entegre etmek için otomatik bir süreç oluşturmak, mühendislere zaman kazandırabilir ve şirketlerin doğru makine öğrenimi için ihtiyaç duydukları tüm verilere sahip olmasını sağlayabilir. Bu aynı zamanda şirketler veri bilimi yeteneklerini geliştirirken maliyetleri düşürmeye ve verimliliği en üst düzeye çıkarmaya yardımcı olur.

Dar veriler, dar içgörüler sağlar

Makine öğrenimi titizdir — verilerde boşluklar varsa veya veriler düzgün biçimlendirilmezse, makine öğrenimi ya çalışmaz ya da daha kötüsü yanlış sonuçlar verir.

Şirketler verileriyle ilgili bir belirsizlik durumuna girdiğinde, çoğu kuruluş veri bilimi ekibinden veri kümesini denetimli makine öğreniminin bir parçası olarak manuel olarak etiketlemesini ister, ancak bu, projeye ek riskler getiren zaman alıcı bir süreçtir. Daha da kötüsü, veri sorunları nedeniyle eğitim örnekleri çok fazla kırpıldığında, dar kapsamın ML modelinin bize yalnızca zaten bildiğimizi söyleyebileceği anlamına gelme olasılığı vardır.

Çözüm, ekibin çok çeşitli kaynakları kapsayan ve verilerin ortak bir şekilde anlaşılmasını sağlayan kapsamlı, merkezi bir veri deposundan yararlanabilmesini sağlamaktır. Bu, çalışmak için daha tutarlı veriler sağlayarak makine öğrenimi modellerinden elde edilen potansiyel yatırım getirisini iyileştirir. Bir veri bilimi programı, yalnızca güvenilir, tutarlı verilere ve sonuçlar için güven çubuğunun anlaşılmasına dayanıyorsa gelişebilir.

Büyük modeller ve değerli veriler

Başarılı bir veri bilimi programının önündeki en büyük zorluklardan biri, bir tahmin yaparken verilerin hacmini ve değerini dengelemektir. Her gün milyarlarca etkileşimi analiz eden bir sosyal medya şirketi, güvenilir tahminler yapmak için büyük hacimli nispeten düşük değerli eylemleri (örneğin birisinin yukarı kaydırması veya bir makaleyi paylaşması) kullanabilir. Bir kuruluş, yıl sonunda hangi müşterilerin bir sözleşmeyi yenileme olasılığının olduğunu belirlemeye çalışıyorsa, büyük sonuçları olan daha küçük veri kümeleriyle çalışıyor olabilir. Önerilen eylemlerin başarıyla sonuçlanıp sonuçlanmadığını öğrenmek bir yıl sürebileceğinden, bu, bir veri bilimi programı için büyük sınırlamalar yaratır.

Bu durumlarda, şirketlerin en iyi önerileri sağlamak için sahip oldukları tüm verileri birleştirmek için dahili veri silolarını parçalamaları gerekir. Bu, kapılı içerikle yakalanan sıfır taraf bilgilerini, birinci taraf web sitesi verilerini ve ürünle müşteri etkileşimlerinden elde edilen verileri, başarılı sonuçlar, destek biletleri, müşteri memnuniyeti anketleri ve hatta kullanıcı geri bildirimi gibi yapılandırılmamış verileri içerebilir. Tüm bu veri kaynakları, bir müşterinin sözleşmesini yenileyip yenilemeyeceğine dair ipuçları içerir. Veri silolarını iş grupları arasında birleştirerek metrikler standart hale getirilebilir ve kendinden emin tahminler oluşturmak için yeterli derinlik ve genişlik vardır.

Bir ML/AI programından azalan güven ve getiri tuzağından kaçınmak için şirketler aşağıdaki adımları atabilir.

  1. Nerede olduğunu fark et — İşletmeniz, makine öğreniminin işletmeye nasıl katkıda bulunduğu konusunda net bir anlayışa sahip mi? Şirketinizin altyapısı hazır mı? Bulanık verilerin üstüne süslü yaldız eklemeye çalışmayın – nereden başladığınız konusunda net olun, böylece çok ileri atlamayın.
  2. Tüm verilerinizi tek bir yerde toplayın — Tanımlanmış ve entegre edilmiş bir merkezi bulut hizmetiniz veya veri gölünüz olduğundan emin olun. Her şey merkezi hale getirildikten sonra, veriler üzerinde hareket etmeye başlayabilir ve güvenilirlikteki tüm tutarsızlıkları bulabilirsiniz.
  3. Emekleme-Yürüme-Koşma — Veri bilimi programınızı oluştururken doğru işlem sırası ile başlayın. Önce veri analitiğine ve İş Zekası’na odaklanın, ardından veri mühendisliği oluşturun ve son olarak bir veri bilimi ekibi oluşturun.
  4. Temel bilgileri unutma — Tüm verileri birleştirdikten, temizledikten ve doğruladıktan sonra veri bilimi yapmaya hazırsınız. Ancak önemli sonuçlar verecek bir temeli sürdürmek için gerekli olan “temizlik” işini unutmayın. Bu temel görevler arasında kataloglama ve veri hijyenine yatırım yapmak, müşteri deneyimini iyileştirecek doğru ölçümleri hedeflediğinizden emin olmak ve sistemler arasındaki veri bağlantılarını manuel olarak sürdürmek veya bir altyapı hizmeti kullanmak yer alıyor.

Şirketler, veri bilimi için doğru altyapıyı oluşturarak işletme için neyin önemli olduğunu ve kör noktaların nerede olduğunu görebilir. İlk önce temel çalışmaları yapmak sağlam bir yatırım getirisi sağlayabilir, ancak daha da önemlisi, önemli etki için veri bilimi ekibini kuracaktır. Gösterişli bir veri bilimi programı için bütçe almak nispeten kolaydır, ancak unutmayın, bu tür projelerin çoğu başarısız olur. “Sıkıcı” altyapı görevleri için bütçe bulmak o kadar kolay değil, ancak veri yönetimi, veri bilimcilerinin işletme üzerinde en anlamlı etkiyi sağlaması için temel oluşturur.

Alexander Lovell, şirketin ürün başkanıdır. Fivetran.

DataDecisionMakers

VentureBeat topluluğuna hoş geldiniz!

DataDecisionMakers, veri işi yapan teknik kişiler de dahil olmak üzere uzmanların verilerle ilgili içgörüleri ve yenilikleri paylaşabileceği yerdir.

En yeni fikirleri ve güncel bilgileri, en iyi uygulamaları ve veri ve veri teknolojisinin geleceğini okumak istiyorsanız DataDecisionMakers’da bize katılın.

Kendi makalenize katkıda bulunmayı bile düşünebilirsiniz!

DataDecisionMakers’dan Daha Fazlasını Okuyun



Kaynak : https://venturebeat.com/2022/07/17/how-to-make-the-most-of-your-ai-ml-investments-start-with-your-data-infrastructure/

Yorum yapın