Heartex, AI odaklı, açık kaynaklı veri etiketleme platformu için 25 milyon dolar artırdı – Teknolojik Haberler


Kendisini veri etiketleme için “açık kaynak” bir platform olarak faturalandıran bir girişim olan Heartex, bugün Redpoint Ventures liderliğindeki A Serisi finansman turunda 25 milyon dolar kazandığını duyurdu. Olağandışı Girişimler, Bow Capital ve Swift Ventures da katılarak Heartex’in toplam sermayesini 30 milyon dolara çıkardı.

Kurucu ortak ve CEO Michael Malyuk, yeni paranın Heartex’in ürününü geliştirmeye ve şirketin işgücünün büyüklüğünü yıl sonuna kadar 28 kişiden 68’e çıkarmaya ayrılacağını söyledi.

“Mühendislik ve makine öğrenimi geçmişlerinden gelen, [Heartex’s founding team] Malyuk, Teknolojik Haberler’a e-posta yoluyla verdiği demeçte, makine öğrenimi ve yapay zekanın kuruluşa ne kadar değer katabileceğini biliyordu. “O zamanlar hepimiz farklı şirketlerde ve farklı endüstrilerde çalışıyorduk, ancak düşük kaliteli eğitim verileri nedeniyle model doğruluğu konusunda aynı mücadeleyi paylaştık. Tek geçerli çözümün, eğitim verilerine açıklama eklemekten ve düzenlemekten alan uzmanlığına sahip dahili ekiplerin sorumlu olması olduğu konusunda anlaştık. Kendi uzmanlarınızdan başka kim en iyi sonuçları sağlayabilir?”

Yazılım geliştiricileri Malyuk, Maxim Tkachenko ve Nikolay Lyubimov, 2019’da Heartex’i kurdu. Liubimov, konuşma teknolojileri ve diyalog sistemleri üzerinde arka uç geliştirici olarak çalıştığı Yandex’e taşınmadan önce Huawei’de kıdemli bir mühendisti.

kalp

Heartex’in kontrol paneli.

Bazen “Rusya’nın Google’ı” olarak adlandırılan bir şirket olan Yandex ile olan bağlar, özellikle Avrupa Birliği’nin Yandex’in haber bölümünün Kremlin propagandasının yayılmasında büyük bir rol oynadığı yönündeki suçlamaları ışığında, bazılarını sinirlendirebilir. Heartex’in San Francisco, California’da bir ofisi var, ancak şirketin mühendislerinin birçoğu eski Gürcistan Sovyet Cumhuriyeti’nde bulunuyor.

Heartex, sorulduğunda, herhangi bir müşteri verisi toplamadığını ve etiketleme platformunun çekirdeğini denetim için açık kaynaklara açtığını söylüyor. Malyuk, “Müşterinin deposundaki verileri gizli tutan, veri düzlemi ile kontrol düzlemini birbirinden ayıran bir veri mimarisi oluşturduk” diye ekledi. “Ekip ve konumlarıyla ilgili olarak, Rusya’da şu anda üyesi olmayan çok uluslararası bir ekibiz.”

Heartex, jeopolitik bağlantılarını bir kenara bırakarak, Malyuk’un kuruluşta büyük bir engel olarak gördüğü şeyin üstesinden gelmeyi hedefliyor: AI’dan yararlanarak verilerden değer elde etmek. ‘Veri merkezli’ olmayı hedefleyen büyüyen bir işletme dalgası var – Gartner kısa süre önce rapor edildi AI’nın kurumsal kullanımı son birkaç yılda %270 oranında arttı. Ama birçok kuruluş mücadele etme AI’yı sonuna kadar kullanmak için.

Malyuk, “Algoritmaya özgü geliştirmede azalan getiri noktasına ulaşan işletmeler, stratejik, veri merkezli girişimlerinin bir parçası olarak veri etiketlemeyi mükemmelleştirmeye yatırım yapıyor” dedi. “Bu, neredeyse yalnızca algoritma geliştirme ve ayarlamaya odaklanan önceki geliştirme uygulamalarından bir ilerlemedir.”

Malyuk’un iddia ettiği gibi, veri etiketleme yapay zeka peşinde koşan şirketlerden artan bir ilgi görüyorsa, bunun nedeni etiketlemenin yapay zeka geliştirme sürecinin temel bir parçası olmasıdır. Birçok AI sistemi, insan yorumcu ekipleri tarafından etiketlenmiş örneklerden görüntüleri, videoları, metinleri ve sesleri anlamlandırmayı “öğrenir”. Etiketler, sistemlerin daha önce görmediği verilere (ör. modeli “öğretmek” için kullanılan verilere dahil edilmemiştir).

Sorun şu ki, tüm etiketler eşit yaratılmamış. Yasal sözleşmeler, tıbbi görüntüler ve bilimsel literatür gibi verileri etiketlemek, yalnızca herhangi bir yorumcunun sahip olmadığı alan uzmanlığı gerektirir. Ve – insan olmak – yorumcular hata yapar. bir MIT’de analiz Araştırmacılar, popüler AI veri kümelerinden biri ile karıştırılan bir köpek türü ve ıslık olarak sınıflandırılan bir Ariana Grande yüksek notası gibi yanlış etiketlenmiş veriler buldu.

Malyuk, Heartex’in bu sorunları tamamen çözdüğünü iddia etmez. Ancak bir röportajda, platformun veri kalitesi yönetimi, raporlama ve analitiklere değinen özelliklerle farklı AI kullanım durumları için etiketleme iş akışlarını desteklemek üzere tasarlandığını açıkladı. Örneğin, Heartex kullanan veri mühendisleri, katkıda bulundukları veya denetledikleri etiketlere bağlı olan yorumcuların ve veri gözden geçirenlerin adlarını ve e-posta adreslerini görebilir. Bu, etiket kalitesinin izlenmesine ve – ideal olarak – sorunları eğitim verilerini etkilemeden önce düzeltmeye yardımcı olur.

“C-suite’in açısı oldukça basit. Her şey, projenin iş hedefine ulaşma hizmetinde üretim AI modeli doğruluğunu geliştirmekle ilgili” dedi Malyuk. “Yapay zeka, makine öğrenimi ve/veya veri bilimi sorumluluklarına sahip üst düzey yöneticilerin çoğunun, insanlara, süreçlere, teknolojiye ve verilere daha stratejik yatırımlarla yapay zekanın şirkete olağanüstü değer sunabileceğini deneyimleriyle doğruladığını görüyoruz. çok çeşitli kullanım durumlarında iş. Başarının kartopu etkisi olduğunu da görüyoruz. Başarıyı erken bulan ekipler, yalnızca erken öğrendikleri üzerine değil, aynı zamanda üretim modellerini kullanarak elde ettikleri ek verilere dayanarak daha hızlı ek yüksek değerli modeller oluşturabilirler.”

Heartex, veri etiketleme araç seti alanında AIMMO, Labelbox, Scale AI ve Snorkel AI ile Google ve Amazon (sırasıyla Google Cloud ve SageMaker aracılığıyla veri etiketleme ürünleri sunan) dahil olmak üzere yeni başlayanlarla rekabet ediyor. Ancak Malyuk, Heartex’in hizmetler yerine yazılıma odaklanmasının onu diğerlerinden ayırdığına inanıyor. Rakiplerinin çoğundan farklı olarak, başlangıç, platformu aracılığıyla etiketleme hizmetleri satmıyor.

“Gerçekten yatay bir çözüm oluşturduğumuz için müşterilerimiz çeşitli sektörlerden geliyor. Müşterilerimiz olarak küçük girişimlerimiz ve birkaç Fortune 100 şirketimiz var. [Our platform] Malyuk, gelir rakamlarını açıklamayı reddederken, küresel olarak 100.000’den fazla veri bilimcisi tarafından benimsendi. “[Our customers] dahili veri açıklama ekipleri kuruyor ve satın alıyor [our product] çünkü üretim yapay zeka modelleri iyi performans göstermiyor ve bunun birincil nedeninin zayıf eğitim verisi kalitesi olduğunun farkındalar.”



Kaynak : https://techcrunch.com/2022/05/18/2314708/

Yorum yapın