O‘zbek tilidagi hujjatlarning tematik klassifikatorlarini yaratish

Ushbu avtoreferat oʻzbek tilidagi hujjatlarni mavzu boʻyicha tasniflash va ularning semantik bogʻlanishini aniqlashga qaratilgan ilmiy tadqiqot natijalarini oʻz ichiga oladi. Tadqiqotda matnli hujjatlarni boshqarish, ularning mazmunini avtomatik tahlil qilish va tasniflash uchun yangi usullar va texnologiyalar taklif etiladi. Xususan, semantik bogʻlanishni hisoblash formulasi, latent fazoni shakllantirish texnologiyasi va kontentning autentikligini baholash metodikasi ishlab chiqilgan. Tadqiqot natijalari Oʻzbekiston Respublikasining fanni rivojlantirish yoʻnalishlariga mos keladi va amaliy ahamiyatga ega.

Asosiy mavzular

  • Kirish: Dissertatsiya mavzusining dolzarbligi, Oʻzbekiston Respublikasi fan va texnologiyalari rivojlanishining ustuvor yoʻnalishlariga mosligi, muammoning oʻrganilganlik darajasi, tadqiqot maqsadi va vazifalari, obyekti va predmeti, tadqiqot usullari, ilmiy yangiligi, amaliy ahamiyati, natijalarining ishonchliligi va aprobatsiyasi hamda nashr etilgan ilmiy ishlari haqida maʼlumot beriladi.
  • Tabiiy tilning berilganlar modellari: Ushbu bobda tabiiy til terminlaridan foydalanib, matnlarning semantik tahlilini oʻziga xosliklari, ontologiyaning turlari va maqsadlari, shuningdek, sinflash algoritmlari yordamida hujjatlarning klaster tahlili koʻrib chiqiladi. Maʼlumotlar bazasini shakllantirishdan maqsad tabiiy til qonuniyatlari va xususiyatlarini tahlil qilishdir.
  • Ilmiy uslubda yozilgan hujjatlarning toʻplamlari boʻyicha tematik modellashtirish: Bu bobda ilmiy uslubda yozilgan hujjatlar tahlilining oʻziga xosliklari, mashinada ishlov berish uchun matnli hujjatlar toʻplamini shakllantirish, Oʻzbekiston Respublikasi OAK bazasidagi ilmiy dissertatsiyalar avtoreferatlarini tahlil qilish orqali taqdim etiladi. Shuningdek, avtoreferatlar mazmunini qiyosiy tahlil qilish va mavzular soni va ularning oʻzgarish sabablarini hisoblash kabi masalalar koʻrib chiqiladi.
  • Kontentning autentikligini baholash: Uchinchi bobda kontentning autentikligini baholash, jumladan, konentning autentikligini hisoblash metodikasi, klaster tahlili uchun optimal mavzu sonini aniqlash, umumiy lugʻatni shakllantirish va hujjatlar oʻrtasidagi semantik bogʻlanish darajasini hisoblash usullari koʻrib chiqiladi. Tadqiqotda turli fanlararo munosabatlar va ularning taʼsirini hisoblashga alohida eʼtibor qaratiladi.
  • Xulosa: Dissertatsiya natijalari umumlashtiriladi. Jumladan, semantik bogʻlanishni hisoblash formulasi, latent fazoni shakllantirish texnologiyasi, kontentning autentikligini baholash metodikasi, umumiy lugʻatni shakllantirish va semantik bogʻlanganlikni baholash texnologiyalarini yaratish kabi ishlar taʼkidlanadi. Kelajakdagi tadqiqotlar uchun yoʻnalishlar koʻrsatilgan.