Cerebras, tek bir çip üzerindeki en büyük yapay zeka modeli rekorunu kırdı • The Register


Kısaca ABD’li donanım girişimi Cerebras, dünyanın en büyük Wafer Scale Engine 2 yongası tarafından desteklenen tek bir cihaz üzerinde en büyük AI modelini bir plaka boyutunda eğittiğini iddia ediyor.

“Müşterilerimiz, Cerebras Yazılım Platformunu (CSoft) kullanarak, tek bir CS-2 sisteminde 20 milyara kadar parametre ile son teknoloji GPT dil modellerini (GPT-3 ve GPT-J gibi) kolayca eğitebilir, ” şirket iddia edilen bu hafta. “Tek bir CS-2 üzerinde çalışan bu modellerin kurulumu dakikalar alıyor ve kullanıcılar sadece birkaç tuşa basarak modeller arasında hızla geçiş yapabiliyor.”

CS-2, 850.000’den fazla çekirdeğe sahiptir ve 20 PB/sn bellek bant genişliğine ulaşabilen 40 GB yonga üstü belleğe sahiptir. Diğer yapay zeka hızlandırıcıları ve GPU’ların özellikleri kıyaslandığında sönük kalıyor, bu da makine öğrenimi mühendislerinin daha fazla sunucuda milyarlarca parametre içeren devasa yapay zeka modellerini eğitmesi gerektiği anlamına geliyor.

Cerebras, en büyük modeli tek bir cihazda eğitmeyi açıkça başarmış olsa da, yine de büyük AI müşterilerini kazanmak için mücadele edecek. En büyük sinir ağı sistemleri bugünlerde yüz milyarlarca ila trilyonlarca parametre içeriyor. Gerçekte, bu modelleri eğitmek için daha birçok CS-2 sistemine ihtiyaç duyulacaktır.

Makine öğrenimi mühendisleri, eğitimi GPU’lar veya TPU’lar içeren çok sayıda makineye dağıtırken karşılaştıkları zorluklarla muhtemelen benzer zorluklarla karşılaşacaklardır – öyleyse neden bu kadar fazla yazılım desteği olmayan daha az tanıdık bir donanım sistemine geçelim?

Sürpriz, sürpriz: İnternet verileriyle eğitilen robot ırkçı ve cinsiyetçiydi

İnternetten alınan kusurlu bir veri kümesi üzerinde eğitilen bir robot, bir deneyde ırkçı ve cinsiyetçi davranışlar sergiledi.

Johns Hopkins Üniversitesi, Georgia Teknoloji Enstitüsü ve Washington Üniversitesi’nden araştırmacılar, bir robota blokları bir kutuya koyması talimatını verdi. Bloklar, insan yüzlerinin görüntüleri ile yapıştırıldı. Robota doktor, ev hanımı veya suçlu olduğuna inandığı bloğu renkli bir kutuya koyması için talimatlar verildi.

Robot, genellikle metinden görüntüye sistemlerinde kullanılan CLIP tabanlı bir bilgisayarlı görme modeli tarafından destekleniyordu. Bu modeller, bir nesnenin kelime açıklamasına görsel olarak eşlenmesini öğrenmek için eğitilmiştir. Bir başlık verildiğinde, cümleyle eşleşen bir görüntü oluşturabilir. Ne yazık ki, bu modeller genellikle eğitim verilerinde bulunan aynı önyargıları sergiler.

Örneğin, robotun ev hanımı olarak kadınların yüzleriyle blokları tanımlaması veya Siyah yüzleri Beyaz erkeklerden daha fazla suçlu olarak ilişkilendirmesi daha olasıydı. Cihaz ayrıca kadınları ve beyaz ve Asyalı erkeklerden daha az koyu tenli olanları tercih ediyor gibiydi. Araştırma sadece bir deney olmasına rağmen, kusurlu veriler üzerinde eğitilmiş robotların kullanılması gerçek hayatta sonuçlar doğurabilir.

Johns Hopkins’te bilgisayar bilimi okuyan yüksek lisans öğrencisi Vicky Zeng, “Bir evde, bir çocuk güzel bebeği istediğinde, robot beyaz bebeği alıyor olabilir.” söz konusu. “Ya da belki kutu üzerinde modelleri olan birçok ürünün olduğu bir depoda, robotun üzerinde Beyaz yüzlü ürünlere daha sık ulaştığını düşünebilirsiniz.”

En büyük açık kaynak dil modeli yayınlandı

Rus internet biz Yandex, bu hafta 100 milyar parametreli bir dil modelinin kodunu yayınladı.

adı verilen sistem YLM, internetten alınan 1,7 TB metin verisi üzerinde eğitildi ve hesaplama için 800 Nvidia A100 GPU gerektirdi. İlginç bir şekilde, kod Modelin araştırma ve ticari amaçlar için kullanılabileceği anlamına gelen Apache 2.0 lisansı altında yayınlandı.

Akademisyenler ve geliştiriciler, büyük dil modellerini çoğaltma ve açma çabalarını memnuniyetle karşıladılar. Bu sistemlerin oluşturulması zordur ve genellikle yalnızca büyük teknoloji şirketleri bunları geliştirmek için gerekli kaynaklara ve uzmanlığa sahiptir. Genellikle tescillidirler ve erişimleri olmadan incelenmesi zordur.

Yandex’den bir sözcü, “Küresel teknolojik ilerlemenin yalnızca işbirliği yoluyla mümkün olduğuna gerçekten inanıyoruz” dedi. Kayıt. “Büyük teknoloji şirketleri, araştırmacıların açık sonuçlarına çok şey borçlu. Ancak, son yıllarda, büyük dil modelleri de dahil olmak üzere, son teknoloji NLP teknolojileri, eğitim kaynakları yalnızca mevcut olduğundan, bilim camiası tarafından erişilemez hale geldi. büyük teknolojiye.”

“Dünyanın her yerindeki araştırmacıların ve geliştiricilerin bu çözümlere erişmesi gerekiyor. Yeni araştırmalar olmadan büyüme yavaşlayacak. Bundan kaçınmanın tek yolu en iyi uygulamaları toplulukla paylaşmaktır. Dil modelimizi paylaşarak gelişme hızını destekliyoruz. küresel NLP.”

Instagram, kullanıcıların yaşını doğrulamak için AI kullanacak

Instagram’ın ana şirketi Meta, kullanıcılarının 18 yaş ve üzeri olduğunu doğrulamak için, fotoğrafları analiz etmek için AI kullanmak da dahil olmak üzere yeni yöntemleri test ediyor.

Araştırma ve anekdot niteliğindeki kanıtlar, sosyal medya kullanımının çocuklara ve genç gençlere zararlı olabileceğini göstermiştir. Instagram’daki kullanıcılar, uygulamayı kullanacak yaşta olduklarını doğrulamak için doğum tarihlerini sağlar. En az 13 yaşında olmalısınız ve 18 yaşın altındakiler için daha fazla kısıtlama var.

Şimdi, ana şirketi Meta, doğum tarihlerini değiştiren birinin 18 yaşından büyük olduğunu doğrulamak için üç farklı yol deniyor.

“Birisi 18 yaşından 18 yaşına kadar Instagram’da doğum tarihini düzenlemeye çalışırsa, üç seçenekten birini kullanarak yaşını doğrulamasını isteyeceğiz: kimliklerini yükleyin, bir video özçekimi kaydedin veya ortak arkadaşlarına sorun. yaşlarını doğrulamak için,” şirket ilan edildi bu hafta.

Meta, insanların yaşlarını analiz etmek için bir dijital kimlik platformu olan Yoti ile ortaklık kurduğunu söyledi. Video özçekiminden alınan görüntüler, birinin yaşını tahmin etmek için Yoti’nin yazılımı tarafından incelenecek. Meta, Yoti’nin “dünyanın dört bir yanından çeşitli insanların isimsiz görüntüleri üzerinde bir veri seti” kullandığını söyledi.

Araştırmacılar, GPT-4chan’in kötü bir fikir olduğunu söylüyor

Yüzlerce akademisyen kınama mektubuna imza attı GPT-4chanAI dil modeli, kötü şöhretli zehirli internet mesaj panosu 4chan’daki 130 milyondan fazla gönderide eğitildi.

“Geniş dil modelleri ve daha genel olarak temel modeller, potansiyel olarak önemli zarar riski taşıyan güçlü teknolojilerdir.” mektupStanford Üniversitesi’nde iki profesörün öncülüğünde başladı. “Ne yazık ki, biz AI topluluğu, sorumlu geliştirme ve dağıtım konusunda şu anda topluluk normlarına sahip değiliz. Bununla birlikte, AI topluluğunun üyelerinin açıkça sorumsuz uygulamaları kınaması çok önemlidir.”

Bu tür sistemler çok miktarda metin üzerinde eğitilir ve verileri taklit etmeyi öğrenir. Netizenler arasında bir sohbete benzeyen GPT-4chan’ı besleyin ve karışıma daha fazla sahte dedikodu eklemeye devam edecektir. 4chan, rahat içerik denetleme kurallarına sahip olmasıyla ünlüdür – kullanıcılar anonimdir ve yasa dışı olmadığı sürece her şeyi gönderebilir. GPT-4chan, şaşırtıcı olmayan bir şekilde, benzer seviyelerde toksisite ve içerik içeren metinler yaymaya başladı. 4chan’da serbest bırakıldığında, bazı kullanıcılar bot olup olmadığından emin değildi.

Şimdi uzmanlar, yaratıcısı YouTuber Yannic Kilcher’ı modeli sorumsuzca kullandığı için eleştirdi. “Toksik konuşma üzerine bir dil modelini eğitmek için makul bir durum hayal etmek mümkündür – örneğin, internette toksisiteyi tespit etmek ve anlamak veya genel analiz için. Ancak Kilcher’in bu botu dağıtma kararı herhangi bir makullük testini karşılamıyor. . Eylemleri kınamayı hak ediyor. Yapay zeka biliminin sorumlu uygulamasını baltalıyor.” ®



Kaynak : https://go.theregister.com/feed/www.theregister.com/2022/06/27/in_brief_ai/

Yorum yapın