BR21882268 «Автоматическое построение мультиязычной онтологии для расширения применимости казахского языка на основе передовых интеллектуальных технологий»
Актуальность
Разработанные методы и алгоритмы обладают достаточной степенью эффективности и проверены на уровне проведённых экспериментов.
Цель
Целью данной работы является разработка средств автоматизированного наполнения контента интеллектуального информационного ресурса NLP, что подразумевает создание и внедрение эффективных алгоритмов и технологий, способных обрабатывать и анализировать большие объемы текстовых данных на разных языках для извлечения полезной информации и знаний для заданной предметной области.
Ожидаемые и достигнутые результаты
В рамках проекта за отчётный период достигнуты значительные результаты. Были разработаны методы автоматического извлечения названий сущностей для онтологии из текстов на естественном языке, а также проведено их экспериментальное исследование на научных публикациях по NLP. Обновлено терминологическое ядро онтологии NLP, которое теперь включает описания методов, их реализации, предобученные модели и другие информационные ресурсы. Создано специализированное хранилище данных для интеллектуального информационного ресурса NLP и разработаны инструменты для автоматизированного наполнения его контента. Кроме того, был создан пользовательский web-интерфейс, а качество ресурса оценено экспертной группой. Важным итогом стало также опубликование статей в высокорейтинговых научных журналах, включённых в базы данных Web of Science и Scopus, а также в изданиях, рекомендованных КОКНВО. Все задачи проекта соответствуют современным научным стандартам и обладают высокой степенью новизны.
Имена и фамилии членов исследовательской группы с их идентификаторами (Scopus Author ID, Researcher ID, ORCID, при наличии) и ссылками на соответствующие профили
1 Научный руководитель Мусабаев Рустам Рафикович (rmusab@gmail.com)
2 Ответственный исполнитель Төлеу Алымжан alymzhan.toleu@gmail.com
3 Исполнитель Барахнин Владимир Борисович barakhninvb@yandex.ru
4 Исполнитель Красовицкий Александр Михайлович akrassovitskiy@gmail.com
5 Исполнитель Төлеген Гүлмира gulmira.tolegen.cs@gmail.com
6 Исполнитель Мусабаев Равиль Рафикович ravmus@gmail.com
7 Исполнитель Козбагаров Олжас Барлыкович kozbagarov@yahoo.com
Список публикаций с ссылками на них
- Mussabayev R., Mussabayev R. High-Performance Hybrid Algorithm for Minimum Sum-of-Squares Clustering of Infinitely Tall Data //Mathematics. – 2024. – Т. 12. – №. 13. – С. 1930.
- Kozbagarov O., Mussabayev R. Distributed random swap: An efficient algorithm for minimum sum-of-squares clustering //Information Sciences. – 2024. – Т. 681. – С. 121204.
- Baktibayev D. et al. Literature review on aftershock and earthquake prediction models aided by NLP summarization and ontology extraction techniques //Procedia Computer Science. – 2024. – Т. 238. – С. 579-586.
- Toleu A., Tolegen G., Mussabayev R. Topic Modeling with Variable Neighborhood Search //International Conference on Computational Collective Intelligence. – Cham : Springer Nature Switzerland, 2024. – С. 234-246.
- Kozbagarov O. et al. Interpretable Dense Embedding for Large-Scale Textual Data via Fast Fuzzy Clustering //International Conference on Computational Collective Intelligence. – Cham : Springer Nature Switzerland, 2024. – С. 206-218.
- Tolegen G., Toleu A., Mussabayev R. Enhancing Low-Resource NER via Knowledge Transfer from LLM //International Conference on Computational Collective Intelligence. – Cham : Springer Nature Switzerland, 2024. – С. 238-248.
- Mussabayev R., Mussabayev R. Superior parallel big data clustering through competitive stochastic sample size optimization in big-means //Asian Conference on Intelligent Information and Database Systems. – Singapore : Springer Nature Singapore, 2024. – С. 224-236.