Makine öğrenimi adı verilen bir yapay zeka dalı etrafımızda. Facebook tarafından içerik küratörlüğü yapmak (ve bizi reklamlarla hedeflemek) için kullanılıyor, Google bunu her gün milyonlarca spam mesajını filtrelemek için kullanıyor ve OpenAI botunu mümkün kılan şeyin bir parçası, geçen yıl hüküm süren Dota 2 şampiyonu üç kez ikisi üç oyun yenmek. Görünüşte sonsuz kullanımlar var. Microsoft ve Intel, gri tonlamalı bir görüntü dönüştürme işlemi aracılığıyla kötü amaçlı yazılımları şaşırtıcı bir doğrulukla algılayan akıllı bir makine öğrenimi çerçevesi geliştirdi.
Microsoft, Statik Kötü Amaçlı Görüntü Olarak Kötü Amaçlı Yazılım Ağı Analizi veya STAMINA adlı bir blog gönderisinde (ZDNet aracılığıyla) bu teknolojiyi ayrıntılı olarak anlattı. Üç aşamalı bir süreçten oluşur. Basitçe söylemek gerekirse, makine öğrenimi projesi, ikili dosyaları alarak ve bunları iki boyutlu görüntülere dönüştürerek başlar.
Görüntüler daha sonra çerçeveye beslenir. Bu ikinci adım, görüntüleri mevcut eğitimiyle karşılaştırırken algoritmanın mevcut bilgisini geliştirmesine yardımcı olan transfer öğrenme adı verilen bir süreçtir.
Son olarak, sürecin kötü amaçlı yazılım örneklerini tespit etmede ne kadar etkili olduğunu, kaç tanesini kaçırdığını ve kaç tanesinin hatalı olarak kötü amaçlı yazılım olarak sınıflandırıldığını (yanlış pozitifler olarak adlandırılır) görmek için sonuçlar analiz edilir.
Çalışmanın bir parçası olarak Microsoft ve Intel, 2,2 milyon dosyadan oluşan bir veri setini inceledi. Bunların yüzde 60’ı, algoritmayı eğitmek için kullanılan bilinen kötü amaçlı yazılım dosyalarıydı ve yüzde 20’si onu doğrulamak için kullanıldı. Kalan yüzde 20, programın gerçek etkinliğini test etmek için kullanıldı.
Microsoft, dosyalara STAMINA uygulayarak, yöntemin kötü amaçlı yazılım dosyalarının yüzde 99,07’sini doğru bir şekilde tespit ettiğini ve sınıflandırdığını ve yanlış pozitif oranı yüzde 2,58 olduğunu söylüyor. Bunlar olağanüstü sonuçlardır.
“Sonuçlar kesinlikle kötü amaçlı yazılım sınıflandırma amaçları için derin aktarım öğreniminin kullanımını teşvik ediyor. Zamandan ve bilgi işlem kaynaklarından tasarruf sağlarken optimal hiperparametreler ve mimari aramalarını atlayarak eğitimi hızlandırmaya yardımcı olur ”diyor Microsoft.
STAMINA sınırsız değildir. Sürecin bir kısmı, bunun gibi bir uygulama için piksel sayısını yönetilebilir hale getirmek için görüntüleri yeniden boyutlandırmaktır. Ancak, daha derin analizler ve daha büyük uygulamalar için Microsoft, yöntemin “milyarlarca pikseli JPEG görüntülerine dönüştürme ve ardından yeniden boyutlandırma sınırlamaları nedeniyle daha az etkili hale geldiğini” söylüyor.
Başka bir deyişle, STAMINA dosyaları laboratuvarda test etmek için harikadır, ancak daha büyük ölçekte kullanılmadan önce biraz ince ayar yapılması gerekir. Bu, muhtemelen Windows Defender’ın STAMINA’dan hemen faydalanmayacağı, ancak bir noktada faydalanabileceği anlamına gelir.