AP06851248 Разработка моделей, алгоритмов семантического анализа веб-контента для определения экстремистской направленности и создание инструментария кибер-криминалистики.
- Руководитель проекта: Мусиралиева Шынар Женисбековна
- Основные члены исследовательской группы:
- Омаров Б.С.
- Болатбек М.А.
- Нарбаева С.М.
- Байспай Г.Б.
- Оспанов Р.К.
- Медетбек Ж.Б.
- Турарбек А.Т.
- Объект исследования – тексты и метаданные пользователей социальных сетей «Вконтакте», «YouTube», биткоин транзакции.
- Цель научно-исследовательской работы –
является проведение комплексного исследования и разработка моделей, алгоритмов семантического анализа данных для выявления экстремистского содержания в веб ресурсах, методов идентификации вовлеченных пользователей и алгоритмов графической визуализации связей, создание и исследование модели анализа транзакции криптовалюты для определения подозрительных, разработка программного обеспечения ExWeb и инструментария кибер-криминалистики для противодействия экстремизму.
- Методы проведения работы –
в ходе исследования использовались методы машинного обучения, методы графической визуализации связей, анализ демографических атрибутов и анализ социальных сетей.
- Полученные результаты и новизна:
впервые создан корпус экстремистских текстов на казахском языке для обучения и тестирования методов машинного обучения для выявления экстремистских текстов на казахском языке; впервые с учетом особенностей казахского языка построена модель семантического анализа, отличающаяся применением метода TF-IDF к биграммам, предварительно примененным алгоритмом стемминга в слой внедрения слов сети LSTM и повышающая точность определения экстремистских текстов, программный модуль сбора и анализа веб контента для определения ЭН (экстремистской направленности). Метод может быть использован в качестве одного из элементов для системы мониторинга и сбора данных из социальных сетей. Были построены графы пользователей на основе метаданных. Была разработана модель анализа биткоин транзакций для выявления подозрительных транзакций. Разработано программное приложение.
- Область применения:
Целевые потребители полученных результатов – фундаментальные результаты могут быть использованы мировым научным сообществом; прикладные результаты в виде методики, алгоритмов могут быть использованы уполномоченными органами по обеспечению информационной безопасности, критической инфраструктуры, по противодействию интернет-экстремизму.
- Список публикаций исполнителей темы за 2020-2022 год: