O‘zbek tilida gaplarning iyerarxik tahlili korpusini yaratish

Ushbu avtoreferat O'zbekiston Milliy universiteti huzuridagi ilmiy darajalar beruvchi ilmiy kengashda himoya qilingan dissertatsiya haqida. Dissertatsiya O'zbek tilida gaplarning iyerarxik tahlili korpusini yaratish mavzusiga bag'ishlangan. Unda O'zbek tilida iyerarxik tahlil korpusini yaratish metodologiyasi, uni yaratish jarayoni, qo'llanilgan texnologiyalar va ilmiy-amaliy natijalari, shuningdek, tadqiqotning ilmiy yangiligi, dolzarbligi va kelgusidagi ahamiyati keng yoritilgan. Tadqiqotda tabiiy tilni qayta ishlash (NLP) va sun'iy intellekt sohasida O'zbek tilida avtomatik tarjima, matnni tahlil qilish, savol-javob tizimlari va ovozli yordamchilarni yaratish uchun asosiy til resursi sifatida foydalanish mumkin bo'lgan iyerarxik bog'liqlik korpusi yaratilgan. Shuningdek, korpusning sifatini baholash uchun UAS va LAS mezonlaridan foydalanilgan.

Asosiy mavzular

  • Kirish: Dissertatsiya mavzusining dolzarbligi, xorijiy ilmiy-tadqiqotlar sharhi, muammoning o'rganilganlik darajasi, maqsad va vazifalari, obyekt va predmeti, ilmiy yangiligi, nazariy va amaliy ahamiyati, natijalarning amaliyotga joriy etilishi, e'lon qilinganligi hamda ishning tuzilishi haqida ma'lumot berilgan.
  • Iyerarxik tahlil korpusining asosiy tushunchalari: Ushbu bobda iyerarxik korpusi va uning sintaktik tahlili, o'zbek tili texnologiyasi hamda iyerarxik korpus yaratish metodlari, izohlash (annotatsiyalash) sxemalari va foydalaniladigan elektron vositalar alohida tushuntirilib, misollar keltirilgan. O'zbek tilining iyerarxik bog'liqliklarini aniqlashning ahamiyati, metodologiyasi, muammolari va qo'llanilish sohalari o'rganilgan.
  • O'zbek tilidagi gaplarning iyerarxik tahlili korpusini yaratish metodlari va uning amaliy-texnologik jihatlari: Korpusni yaratish jarayoni bosqichlari, jumladan, meta ma'lumotlarga qo'shish, xatolarni o'chirish, imloviy standartlashtirish, tokenlash, negizlash (lemmalash), so'z turkumlarini aniqlash/teglash (POS) kabi jarayonlar batafsil yoritilgan. Shuningdek, annotatorlarning ish samaradorligi baholangan.
  • O'zbek tilidagi gaplarning iyerarxik tahlili korpusining samaradorligi: Ushbu bo'limda yaratilgan iyerarxik korpusning yakuniy koʻrsatkichlari, ishlashi, sifati va qamrovi baholangan. Korpusda 1200 ta sintaktik jihatdan belgilangan sodda-murakkab aralash gaplar mavjud bo'lib, ularning tahlili natijalari keltirilgan. Tadqiqot natijalarini baholashda UAS va LAS mezonlaridan foydalanilgan va Arc-Standard hamda Arc-Eager algoritmlarining samaradorligi solishtirilgan.
  • Xulosa: Dissertatsiya natijalari bo'yicha xulosa chiqarilgan. Unda morfo-sintaktik xususiyatlarning aniqlanishi, universal so'z turkumlari teglarining tanlovi, o'zbek tilining erkin so'z tartibini aks ettirishdagi ahamiyati, annotatsiya jarayonidagi qiyinchiliklar, leksik xususiyatlarni aniqlashning muhimligi, iyerarxik tahlil korpusining ahamiyati va kelgusida takomillashtirish imkoniyatlari haqida fikr yuritilgan.