TensorFlow'a Üç Yeni KULLANIM Çok Dilli Modül Geliyor

Google, AI araştırmalarının öncülerinden biridir ve projelerinin birçoğu dikkatleri üzerinize topladı. AlphaZero Google'ın Derin Düşünce ekibi, programın karmaşık oyunları kendi başına (İnsan Eğitimi ve Müdahalesi Olmadan) öğrenebilmesi nedeniyle yapay zeka araştırmalarında bir dönüm noktası oldu. Google ayrıca şu alanlarda da mükemmel bir iş çıkardı: Doğal Dil İşleme Programları (NLP'ler), Google Asistan’ın insan konuşmasını anlama ve işleme konusundaki verimliliğinin arkasındaki nedenlerden biridir.

Google kısa süre önce üç yeni ürünün piyasaya sürüldüğünü duyurdu Çok dilli modülleri KULLANIN ve anlamsal olarak benzer metinleri elde etmek için daha çok dilli modeller sağlar.

Sistemlerdeki dil işleme, temel sözdizimi ağacının ayrıştırılmasından büyük vektör ilişkilendirme modellerine kadar uzun bir yol kat etti. Metindeki bağlamı anlamak, NLP alanındaki en büyük sorunlardan biridir ve Evrensel Cümle Kodlayıcısı bunu, metni yüksek boyutlu vektörlere dönüştürerek çözer, bu da metin sıralamasını ve gösterimini kolaylaştırır.

Google'a göre, "Üç yeni modülün tümü, tipik olarak soruların ve cevapların kodlamasını ayrı sinir ağlarına bölen ve milisaniyeler içinde milyarlarca potansiyel cevap arasında arama yapmayı mümkün kılan semantik geri alma mimarisi üzerine inşa edilmiştir.Başka bir deyişle, bu, verilerin daha iyi endekslenmesine yardımcı olur.

Üç çok dilli modülün tümü, bir Çift kodlayıcıyı ilave marj softmax yaklaşımı ile geliştirmek için geliştirdiğimiz teknikleri kullanırken, İngilizce için orijinal USE modeline benzer çok görevli çift kodlayıcı çerçevesi. Sadece iyi bir aktarım öğrenme performansını sürdürmek için değil, aynı zamanda anlamsal geri getirme görevlerini iyi gerçekleştirmek için tasarlanmıştır. " Softmax işlevi genellikle vektörleri üsleyerek ve ardından her öğeyi üssel toplamına bölerek hesaplama gücünden tasarruf etmek için kullanılır.

Anlamsal erişim mimarisi

“Üç yeni modülün tümü, tipik olarak soruların ve cevapların kodlamasını ayrı sinir ağlarına bölen ve milisaniyeler içinde milyarlarca potansiyel cevap arasında arama yapmayı mümkün kılan anlamsal geri getirme mimarileri üzerine inşa edildi. Etkili anlamsal erişim için ikili kodlayıcı kullanmanın anahtarı, beklenen giriş sorgularına yönelik tüm aday cevapları önceden kodlamak ve bunları en yakın komşu problemini çözmek için optimize edilmiş bir vektör veritabanında saklamaktır, bu da çok sayıda adayın hızlı bir şekilde aranmasını sağlar. iyi bir hassasiyet ve geri çağırma ile. "

Bu modülleri TensorFlow Hub'dan indirebilirsiniz. Daha fazla okumak için GoogleAI’nin tam blog yayınına bakın.

Facebook Twitter Google Plus Pinterest