Microsoft Word, Outlook ve PowerPoint, Azure Hizmetlerinin Ardından Büyük Veri Kümelerinde Eğitim Almak İçin Yapay Zeka Destekli Otomatik Resim Yazısı Alma Aracı Almak İçin
Microsoft, güçlü ve akıllı bir resim yazısı sistemi geliştirdiğini onayladı. Yapay zeka destekli sistem, ilgili görüntü katyonlarını hızlı ve özerk bir şekilde üretebilir. Sistem, görüntüler için altyazı oluşturan insanlar kadar akıcı veya yaratıcı olmayabilir, ancak alaka düzeyini ve doğruluğu artırmak için büyük veri kümeleri üzerinde eğitildiği bildiriliyor. Microsoft, sistemin, şirketin hizmetlerinde kullanılan yaygın sistemden iki kat daha güçlü olduğunu garanti eder.
Microsoft, görüntüler için yeni bir otomatik altyazı sistemine sahiptir. Sistem ilk olarak Azure Bilişsel Hizmetler'de başlatılacaktır. Ancak Microsoft, aynı şeyin Microsoft Word, Outlook ve PowerPoint'e damlayacağını belirtti.
Yeni AI-Drive Görüntü Altyazı Sistemi Nasıl Çalışır?
AI güdümlü herhangi bir sistem, öncelikle ilgili veri kümeleri üzerinde eğitilmelidir. Bu algoritmalar veri noktalarından öğrenir ve ardından beklenen davranış kalıplarını taklit etme yeteneği kazanır. Microsoft'un yeni otomatik resim yazısı sisteminin de, kelime etiketleriyle eşleştirilmiş çok büyük bir resim veri kümesiyle eğitildiği bildiriliyor. Bu kelime etiketleri, bir görüntüdeki farklı bir nesneye eşleştirildi.
İlk eğitimden sonra, araştırmacılar, hali hazırda altyazılı görüntü veri kümesine altyazı eklemek için önceden eğitilmiş modelde ince ayar yaptı. Eğitim ve ince ayar süreci, AI modelinin anlaşılır bir cümle oluşturmayı öğrenmesini sağladı. Yeni AI modeli, daha sonra, yeni veya farklı nesneler içeren görüntüler için kendi kendine altyazı oluşturmak için görsel kelime dağarcığından yararlanır. Vurgu, görüntüde belirli veya benzersiz olan nesne üzerindedir.
Tüm AI Modellerinde olduğu gibi, Microsoft'un resim yazısı sistemi bile yüzde 100 doğru veya mükemmel değil. Ancak Microsoft, yeni AI Modelinin, şirketin ürün ve hizmetlerinde şu anda kullanılan resim yazısı modelinden iki kat daha iyi olduğunu garanti ediyor. Redmond, Washington'daki Azure AI Cognitive Services'in baş teknoloji sorumlusu ve Microsoft teknik görevlisi Xuedong Huang, dahili testler, yeni modelin insanlar tarafından manuel olarak yazılan altyazılardan daha açıklayıcı ve doğru altyazılar oluşturabileceğini gösteriyor.
"Bu yapay zeka buluşunu, daha geniş bir müşteri kitlesine hizmet vermek için bir platform olarak Azure'a taşıyoruz. Bu sadece araştırmada bir atılım değil; Bu buluşu Azure'da üretime dönüştürmek için geçen süre de bir dönüm noktası."
Huang'ın belirttiği şey, Microsoft'un insan tarafından oluşturulan içerikle rekabet edebilecek AI Modellerinin geliştirilmesini, iyileştirilmesini ve dağıtımını önemli ölçüde hızlandırabildiğiydi. Ancak, bu modellerin genellikle belirli bir dizi yönergeyi izlediğini ve büyük ölçüde veri kümelerine dayandığını belirtmek önemlidir.
Microsoft, AI'nın gücünü çeşitli ürün ve hizmetlerinde kullanmak için son birkaç yıldır çok çalışıyor. AI, insanları daha yaratıcı görevler yapmak için özgür bırakırken üretkenliği artırma gücüne sahiptir. İlginç bir şekilde, Microsoft, yeni otomatik resim yazısı sistemi aracılığıyla görme bozukluğu olan kişiler için tüm kullanıcıların herhangi bir resimdeki hayati içeriğe erişmesine yardımcı olmayı hedefliyor.