Компании Microsoft и Intel взялись за разработку инновационного метода, который позволит более точно определять и классифицировать вредоносное ПО. В рамках проекта STAMINA (STAtic Malware-as-Image Network Analysis) партнеры создают систему, которая преобразует вирусы в черно-белые картинки, а потом изучает их.
Суть нового подхода состоит в том, чтобы сначала сконвертировать подозрительный бинарный файл в монохромное 2D-изображение (примерно как QR-код, в котором зашифрована информация). Для этого STAMINA последовательно присваивает каждому байту зловреда значение от 0 до 255, после чего трансформирует их в пиксели с различными оттенками серого, шириной и высотой.
Затем в дело вступают алгоритмы машинного обучения и искусственного интеллекта, которые сканируют получившуюся графическую сигнатуру и сравнивают её с предшествующими образцами. Как поясняют исследователи, на этапе сканирования глубокая нейросеть (DNN) пытается выявить структурные сходства с другими вредоносами, относящимися к одному семейству, и определить, является ли изучаемый файл вирусом или нет.
Для нового проекта специалисты Microsoft предоставили 2,2 миллиона зараженных исполняемых файлов. Для обучения алгоритма DNN использовались 60% известных образцов вредоносных программ.
По итогам тестирования STAMINA было установлено, что система точно идентифицирует вредоносный код в 99,07% случаев. Частота ложных срабатываний составила 2,58%. Реже всего антивирус ошибается при анализе файлов небольшого размера, добавили в Microsoft.
Впоследствии STAMINA может стать модулем для ИИ-платформы Windows ML, который разработчики смогут встраивать в свои приложения.