Выбор лучших функций для алгоритмов обнаружения фишинг-атак

Вселенная дискурсивных регионов разделена ФРС. Предоставлено: Забихимайван и Доран.

В последние десятилетия фишинговые атаки становятся все более распространенным явлением. Эти атаки позволяют злоумышленникам получать конфиденциальные пользовательские данные, такие как пароли, имена пользователей, данные кредитной карты и т. Д., Обманывая людей в раскрытии личной информации. Наиболее распространенный тип фишинг-атак — это мошенничество с электронной почтой, при котором пользователи считают, что им необходимо сообщить свои данные установленному или доверенному объекту, в то время как на самом деле они делятся этими данными с кем-то еще.

ИТ-специалисты разработали огромное количество инструментов и стратегий для обнаружения и предотвращения фишинговых атак, многие из которых основаны на машинном обучении. Производительность таких алгоритмов машинного обучения часто зависит от функций, которые они извлекают из веб-сайтов.

Исследователи из Университета штата Райт недавно разработали новый метод определения лучших наборов функций для алгоритмов обнаружения фишинг-атак. Их подход, изложенный в статье, предварительно опубликованной на arXiv , может помочь повысить производительность отдельных алгоритмов машинного обучения для выявления фишинговых атак.

«Эффективность алгоритмов обнаружения фишинга, использующих машинное обучение, сильно зависит от функций веб-сайта, который рассматривает алгоритм, включая длину URL-адреса веб-страницы или наличие в URL специальных символов, таких как @ и тире», — Махди Забихимайван и Дерек Доран, два исследователя, которые проводили исследование, сообщили TechXplore по электронной почте. «В этой работе мы хотели упростить создание алгоритмов машинного обучения для обнаружения фишинга, автоматически восстанавливая« лучший »набор функций для любого алгоритма обнаружения фишинга, независимо от рассматриваемого веб-сайта».

Несмотря на то, что в настоящее время существует несколько алгоритмов для выявления фишинговых атак, пока что очень мало исследований было сосредоточено на определении наиболее эффективных функций для обнаружения этого конкретного типа атаки. В своем исследовании Забихимайван и Доран воспользовались этим пробелом в литературе, пытаясь раскрыть наиболее эффективные функции для этой конкретной задачи.

«Мы применили теорию Fuzzy Rough Set (FRS) как инструмент для выбора наиболее эффективных функций из трех эталонных наборов данных фишинговых веб-сайтов», — сказали Забихимайван и Доран. «Выбранные функции затем используются для трех часто используемых алгоритмов машинного обучения для обнаружения фишинга».

Чтобы проверить эффективность и обобщенность их подхода к выбору функций FRS, исследователи использовали его для обучения трех часто используемых классификаторов обнаружения фишинга на наборе данных из 14 000 образцов веб-сайтов, а затем оценили их эффективность. Их оценки дали многообещающие результаты, достигнув максимальной F-меры в 95 процентов, когда их метод выбора признаков был применен к классификатору случайного леса (RM).

«FRS обнаруживает зависимости характеристик на основе данных», — объяснили Забихимайван и Доран. «Другими словами, FRS решает, как разделить набор данных на основе значений их признаков и меток, используя границу решения и отношение сходства, объявленное в виде нечетких функций принадлежности. Функции, выбранные FRS, могут более различать образцы данных, которые принадлежат к разным классам. «

Подход FRS, используемый Забихимайваном и Дораном, выбрал девять универсальных признаков во всех наборах данных, использованных в их исследовании. Используя этот универсальный набор функций, они достигли F-меры приблизительно 93 процентов, что аналогично тому, что было достигнуто классификаторами, использующими их подход FRS. Универсальный набор функций не содержит функций сторонних сервисов, поэтому этот вывод свидетельствует о том, что потенциально можно быстрее обнаружить фишинговые атаки без запроса внешних источников.

«Функции, автоматически выбранные FRS, дают лучшую производительность обнаружения по ряду классификаторов», — сказали Забихимайван и Доран. «Мы также находим набор« универсальных функций »- тех аспектов веб-страницы, которые, по мнению FRS, лучше всего предсказывают, пытается ли страница найти информацию, независимо от типа веб-сайта, который пытается воспроизвести страница».

Исследование, проведенное Забихимайваном и Дораном, является одним из первых, которые дают ценную информацию о наиболее эффективных функциях обнаружения фишинговых атак. В будущем их работа может проложить путь к разработке более эффективных и надежных методов обнаружения фишинга, которые позволят раскрыть эти атаки быстрее, чем современные методы.

«Теперь мы надеемся расширить наше исследование, изучив выбор функций для более сложных алгоритмов машинного обучения, включая архитектуры глубокого обучения, которые автоматически обнаруживают« мета-функции »для дальнейшего повышения эффективности обнаружения», — сказали Забихимайван и Доран. «Мы также планируем расширить нашу систему выбора функций для обнаружения фишинговых писем».

Источник информации: https://techxplore.com/news/2019-03-features-phishing-algorithms.html

Тимеркаев Борис — 68-летний доктор физико-математических наук, профессор из России. Он является заведующим кафедрой общей физики в Казанском национальном исследовательском техническом университете имени А. Н. ТУПОЛЕВА — КАИ

comments powered by HyperComments
Оценки статьи:
1 Звезда2 Звезды3 Звезды4 Звезды5 Звезд (Пока оценок нет)
Загрузка...