AP06851248 Разработка моделей, алгоритмов семантического анализа веб-контента для определения экстремистской направленности и создание инструментария кибер-криминалистики.

 

  • Руководитель проекта: Мусиралиева Шынар Женисбековна

 

  • Основные члены исследовательской группы:
  • Омаров Б.С.
  • Болатбек М.А.
  • Нарбаева С.М.
  • Байспай Г.Б.
  • Оспанов Р.К.
  • Медетбек Ж.Б.
  • Турарбек А.Т.

 

  • Объект исследования – тексты и метаданные пользователей социальных сетей «Вконтакте», «YouTube», биткоин транзакции.

 

  • Цель научно-исследовательской работы

является проведение комплексного исследования и разработка моделей, алгоритмов семантического анализа данных для выявления экстремистского содержания в веб ресурсах, методов идентификации вовлеченных пользователей и алгоритмов графической визуализации связей, создание и исследование модели анализа транзакции криптовалюты для определения подозрительных, разработка программного обеспечения ExWeb и инструментария кибер-криминалистики для противодействия экстремизму.

  • Методы проведения работы

в ходе исследования использовались методы машинного обучения, методы графической визуализации связей, анализ демографических атрибутов и анализ социальных сетей.

  • Полученные результаты и новизна:

впервые создан корпус экстремистских текстов на казахском языке для обучения и тестирования методов машинного обучения для выявления экстремистских текстов на казахском языке; впервые с учетом особенностей казахского языка построена модель семантического анализа, отличающаяся применением метода TF-IDF к биграммам, предварительно примененным алгоритмом стемминга в слой внедрения слов сети LSTM и повышающая точность определения экстремистских текстов, программный модуль сбора и анализа веб контента для определения ЭН (экстремистской направленности). Метод может быть использован в качестве одного из элементов для системы мониторинга и сбора данных из социальных сетей. Были построены графы пользователей на основе метаданных. Была разработана модель анализа биткоин транзакций для выявления подозрительных транзакций. Разработано программное приложение.

  • Область применения:

Целевые потребители полученных результатов – фундаментальные результаты могут быть использованы мировым научным сообществом; прикладные результаты в виде методики, алгоритмов могут быть использованы уполномоченными органами по обеспечению информационной безопасности, критической инфраструктуры, по противодействию интернет-экстремизму.

 

  • Список публикаций исполнителей темы за 2020-2022 год:

Публикации проекта 2020-22.docx