AP06851248 Мәтіндегі экстремистік бағытты анықтау үшін веб-ресурстардағы семантикалық талдау модельдерін, алгоритмдерін құрастыру және кибер-криминалистика құрал-жабдықтарын әзірлеу

  • Жоба жетекшісі: Мусиралиева Шынар Жеңісбекқызы

 

  • Зерттеу тобының негізгі мүшелері:
  • Омаров Б.С.
  • Болатбек М.А.
  • Нарбаева С.М.
  • Байспай Г.Б.
  • Оспанов Р.К.
  • Медетбек Ж.Б.
  • Турарбек А.Т.

 

  • Зерттеу нысаны – «Вконтакте», «YouTube» әлеуметтік желілерін пайдаланушылардың мәтіндері мен метадеректері, биткоин транзакциялары.

 

  •  Зерттеу жұмысының мақсаты

веб-ресурстардағы экстремистік мазмұнды анықтау үшін мағыналық деректерді талдау алгоритмдерін, негізгі пайдаланушыларды анықтау әдістерін және сілтемелерді графикалық визуализациялау алгоритмдерін жасау және жан-жақты зерттеу жүргізу, күдіктілерді анықтау үшін криптовалюта транзакцияларын талдау моделін құру және зерттеу, ExWeb бағдарламалық құралы және экстремизмге қарсы тұру үшін киберкриминалистикалық құралын әзірлеу.

  •  Жұмыс әдістері -

зерттеуде машиналық оқыту әдістері, байланыстарды графикалық визуализациялау, демографиялық атрибуттарды талдау және әлеуметтік желілерді талдау қолданылды.

 

  • Алынған нәтижелер мен жұмыстың жаңалығы:

қазақ тіліндегі экстремистік мәтіндерді анықтау үшін машиналық оқыту әдістерін оқыту және сынақтан өткізу үшін алғаш рет қазақ тіліндегі экстремистік мәтіндер корпусы құрылды; алғаш рет қазақ тілінің ерекшеліктерін ескере отырып, бұрын сөздердің кірістіру қабатына діңдік алгоритм арқылы қолданылған TF-IDF әдісінің биграммаларға қолданылуымен ерекшеленетін семантикалық талдау моделі жасалды. LSTM желісін құру және экстремистік мәтіндерді анықтау дәлдігін арттыру, экстремистік бағытты анықтау үшін веб-контентті жинауға және талдауға арналған бағдарламалық модуль жасалды. Әдіс әлеуметтік желілерден деректерді бақылау және жинау жүйесінің элементтерінің бірі ретінде пайдаланылуы мүмкін. Қолданушы графтары метадеректерге негізделген. Күдікті транзакцияларды анықтау үшін Bitcoin транзакцияларын талдау үлгісі жасалды. Бағдарламалық құрал әзірленді.

  •   Қолдану саласы:

Алынған нәтижелердің мақсатты тұтынушылары – іргелі нәтижелерді әлемдік ғылыми қауымдастық пайдалана алады; Әдістеме түріндегі қолданбалы нәтижелерді, алгоритмдерді уәкілетті органдар ақпараттық қауіпсіздікті, маңызды инфрақұрылымды қамтамасыз ету және интернет-экстремизмге қарсы тұру үшін пайдалана алады.