Nutqni tanishda sphinx tizimini qo’llashning ahamiyati | Статья в журнале «Техника. Технологии. Инженерия»

Отправьте статью сегодня! Журнал выйдет 30 ноября, печатный экземпляр отправим 4 декабря.

Опубликовать статью в журнале

Библиографическое описание:

Юсупов, О. К. Nutqni tanishda sphinx tizimini qo’llashning ahamiyati / О. К. Юсупов, К. К. Ибадуллаев, Ш. Ш. Аминов. — Текст : непосредственный // Техника. Технологии. Инженерия. — 2017. — № 2.1 (4.1). — С. 58-59. — URL: https://moluch.ru/th/8/archive/57/2335/ (дата обращения: 16.11.2024).



Ushbu maqolada nuqtni tanishning online API lari, ularning imkoniyatlari va kamchilik tamonlari, nuqtni tanish tizimlarida offline ishlovchi Sphinx tizimidan foydalanishning afzallik tamonlari to’g’risida so’z yuritilgan.

Kalit so’zlar: nuqtni tanish, Sphinx, PocketSphinx, mobil qurilmalar, nuqt ovozlari grammatikasi,

В данной статье речь идёт об использование API распознающий речей, система Sphinx работающий не используя интернет, их возможности, преимущества и недостатки использования таких систем на проект.

Ключевые слова: распознавания речей, PocketSphinx, мобильные устройства, грамматика речевых сигналы.

In this article is talking about the use of the API recognizing speeches, the Sphinx system working without using the Internet, their capabilities, advantages and disadvantages of using such systems for the project.

Key words: Speech recognition, PocketSphinx, mobile devices, grammar of speech signals.

Zamonaviy axborot texnologiyalari bugungi kunda jamiyatda alohida ahamiyatga ega. Boshqa ilmiy-texnik yutuqlardan informatika va hisoblash texnikasining farqi shundaki, ular inson aqliy faoliyatining barcha sohasida foydalanilib, ilmiy-texnik jarayonlar taraqqiyotiga targ’ib etiladi. Keyingi vaqtlarda asosiy e’tibor inson va mashinaning nuqt orqali interfeysini avtomatlashtirishga alohida e’tibor qaratilmoqda. Bu jarayon ham izlanuvchilarni, ham foydalanuvchilarni birdek qiziqtiradi. Odamlar uchun muloqatning tabiiy va eng oddiy usuli bu og’zaki nutq orqali muloqat qilish usuli hisoblanadi. Shuning uchun muloqat texnologiyalari robototexnikada, kompyuter qurilmalarini boshqarishda, telekommunikatsiya tizimlarida keng foydalaniladi.

Nutq orqali muloqat vositalari quyidagi asosiy ikki yo’nalishda qo’llaniladi.

1) Mobil qurilmalar uchun mo’ljallangan dasturlarni ovoz orqali boshqarishda.

2) Imkoniyati cheklangan odamlar uchun shaxsiy kompyuter va inson o’rtasida muloqat tashkil qilishda.

3) Aqilli uylarni tashkil qilishda.

Mobil qurilmalarda qo’llanilishiga ehtiyojning sabababi unda kiritish qurilmalari (klaviatura, sichqoncha, ekran) orqali ishlashning qiyinchiligidadir. Shu bilan birga ovoz orqali kiritish uchun eng qulay vosita ham mobil qurilmalari hisoblanadi. Chunki mobil qurilmalari eng asosiy qurilmalar(asosan mikrofon) bilan ta’minlangan va internetga ulanish oson.

Nutqni tanish tizimining nutqni avtomatik nanishdan iborat. Foydalanuvchi biror so’zni aytganda tizim uni textga aylantirish lozim. Agar tizim buyruq bajaradigan bo’lsa, u holda shu textga mos buyruqni bajarishi kerak. Undan tashqari nutqni tanish tizimi nutqni biror aniqlangan tilda amalga oshiradi. Shuning uchun oldindan qaysi tilda aytmoqchiligini foydalanuvchi o’zi ko’rsatishi, yoki tizim qaysidir bir tilda ishlashi lozim.

Internet orqali ishlovchi Google Voice API va Yandex SpeechKit tizimlari bo’lib, ular hozirda ko’plab dasturlarda qo’llanilib kelinmoqda. Ularning afzallik tamonlari istalgan sohaga oid nutq tovushlarini yuqori aniqlikda matnga aylantiradi. Undan tashqari yaratilgan tayyor API lar orqali internet orqali foydalanish mumkin.

Qandaydir sohani oladigan bo’lsak, bu sohadagi so’zlar soni ko’pincha chekli bo’ladi yoki juda oz bo’lishi mumkin. Google Voice API, Yandex SpeechKit va boshqa shunga o’xshash tizimlarning barcha so’zlar bazasidan aytilgan so’zga eng yaqinini izlab topadi. Bazadagi so’zlar ko’p bo’lganligi sababli aytilgan so’zni o’rniga unga yaqin boshqa so’zni topish holatlari bo’lishi mumkin. Ko’pchilik dasturlarda ishlatiladigan buyruqlar chekli bo’ladi va internet tarmog’isiz ishlashni talab qiladi. Masalan kalkulyator dasturni oladigan bo’lsak unda faqat sonlar va amallar ishlatiladi. Unda aytilgan so’zlarni faqat oz so’zlar to’plamidan izlash yetarli. Bunday tizimlar uchun Sphinx tizimi eng yaxshi hisoblanadi.

Sphink (SQL Phrase Index) — Carnegie Mellon Universitetida ishlab chiqilgan bo’lib nuqtni tanish tizimlarini bir guhuhini o’z ichiga oladi. Bular o’z ichiga birnecha nuqtni tanuvchilar(Sphinx 2–4) va akustik modelni o’z ichiga oladi. 2000 yilda Carnegie Mellon da Sphink guruhi birnetcha nutqni tanish ochiq kodli tizimlari ishlab chiqdi. Sphinx 4 nutqni tanish sohasida mukammallikni ta’minlash maqsadida ishlan chiqilgan framework bo’lib, Java dasturlash tilida yaratilgan [2].

CMUSphinx har xil akustik tizimlarini qo’llab quvvatlaydi: davomiy, yarim-davomiy va bog’langan fonetik. Akustik model models modulida yaratilgan. Har bir til uchun alohida akustik model yaratilishi lozim. digits.gram faylida barcha izlatiladigan so’zlar va ularning grammatikasi beriladi. Masalan tizim faqat raqamlar bilan ishlaydigan bo’lsa u holda quyidagicha grammatika yoziladi:

= ноль | один | два | три | четыре | пять | шесть | семь | восемь | девять;

public = +

Yuqoridagi grammatika faqat raqamlar ketma-ketligidan iborat so’zlarni taniydi. Masalan 1, 123 yoki 456784. So’zlarning qanday tovushlardan iborat bo’lishi cmudist.dict faylida tovushlarga ajratilib ko’rsatiladi.

1-rasm. cmudist.dict faylida so’zlarning tovushlarga ajratilishi

Bu faylgaistalgan so’zlarni qo’shish yoki o’chirish mumkin. Grammatikadagi barcha so’zlar bu ro’yxatda ham bo’lishi shart. Grammatikada ishlatilmagan so’zlarni esa o’chirib tashlash mumkin.

Pocketsphinx mobil platformalar uchun ko’plab loixalarda nutqni qo’llash imkoniyatini yaratadi, nuqtni tanish sifatini ta’minlaydi. Undan tashqari loixaga uni kiritish oson amalga oshiriladi. Lekin albatta, ba’zi muommolar yechimsiz qolmoqda. Xususan, harflarni tanish masalasi eng murakkab masala hisoblanadi. Chunki harflar bir-biriga o’xshash hisoblanib, bitta guruhga tegishli harflarni aniqlash murakkablik tug’diradi. Masalan b, d, e yoki l, n, m harflari bir-biriga o’xshash bo’lib, yanglishgan holda aniqlanishi mumkin. Avtomobillar vin nomerlarini nuqt yordamida kiritishda harflar yetarlicha ko’p bo’ladi. Agar har bir harfni tog’ri aniqlash extimolligi 95 % bo’lgan taqdirda ham barcha harflarni to’gri topish ehtimolligi (0.9510 = 0.59) 59 % ga teng bo’ladi. Bu esa yetarlicha aniqlik emas. Shunday bo’lsa ham nutq tovushlarini tanishda Pocketsphinx yuqori aniqlikda ma’noga ega so’zlarni topadi va mobil dasturlarda har xil loixalarda qo’llanilishi mumkin.

Аidabiyotlar:

  1. Ронжин А. Л., Карпов А. А., Ли И. В. Система автоматического распознавания русской речи SIRIUS. — Спб.: СПИИРАН, 2006. — 12 с.
  2. Wikipapedia.org [https://en.wikipedia.org/wiki/CMU_Sphinx]
  3. Dong Yu Li Deng. Automatic Speech Recognition. 2016 year.
Основные термины (генерируются автоматически): API, SIRIUS, SQL.

Ключевые слова

nuqtni tanish, сфинкс, PocketSphinx, mobil qurilmalar, nuqt ovozlari grammatikasi, Sphinx

Похожие статьи

Quyosh elementlarining optik xususiyatlarini yaxshilash usullari

Ushbu maqolada, quyosh elementlarini optik xususiyatlarini optimallashtirish uchun qo’llaniladigan texnik yechimlarning nazariy asoslari berilgan.

Tarbiyasi og‘ir o‘quvchilar bilan fizika fanida ishlash

Ushbu ishda biz o'qituvchilik faoliyatining boshida yosh o'qituvchida yuzaga keladigan muammolarni ko'rib chiqamiz.

Umumta`lim fanlarining o’qitilishida interfaol usullarning qo’llanilish samaradorligi

Maqolada mamlakatimiz yoshlarida umumta`lim fanlarni yuqori darajada shakllantirish, bu jarayonda umumta`lim fanlarini o’qitish sifatini ta`minlashda turli innovatsion metodlardan foydalanish orqali belgilangan natijalarga erishish.

So‘z birikmasining valentlik vazifasi

Ushbu maqolada so‘z birikmalarining boshqa birliklar bilan birikishi hamda imkoniyati va xususiyatlari, valentlik hodisasini o‘rganish va uning turlarini farqlash ko’rib chiqilgan.

Gazetasi sarlovhasining o'rganilish tarixi va undagi murojaat so'zlarining ishlatishi (misrning «al-Ahram» gazetasi asosida)

Ushbu maqolada gazeta va unda yoritilayotgan axborotlar sarlavxasi tarixi ko’rib chiqilgan hamda sarlavxa tanlashda nimalarga e’tiborish kerakligi ochib berilgan

Ingliz tilini o'qitishdagi zamonaviy ta'lim texnologiyalari

Ushbu maqolada til va uni o’rganishda foydalaniladigan zamonaviy ta’lim texnologiyalaridan bir nechtasi yoritib berilgan.

Yadroviy tibbiyot tarixiga doir metodik materiallar

Maqolada yadroviy tibbiyotga fani tarixiga doir ayrim metodik ma’lumotlar keltirilgan. Rentgen nurlari va radioaktivlik hodisasining kashf etilishi. Frederik Soddi tomonidan fanga radioaktiv izotoplartushunchasining kiritilishi. Yadroviy tibbiyot fan...

Ingliz tilini o’qitishda zamonaviy innоvatsion texnologiyalaridan foydalanish

Ushbu maqolada O’zbekiston Respublikasida chet tillariga berilgan katta ahamiyat hamda ularni o’rganish uchun zarur bo’lgan innovatsion texnologiyalar yoritilgan

German tillari grammatikasini o‘qitishning umumnazariy masalalari

Maqolada german, bu o‘rinda ingliz tili misolida so‘z grammatik ma’nosining shakllanish imkoniyatlari lingvo-kognitiv tahlildan o‘tkaziladi.

Kamqon ayollarda homiladorlik va tug`ruqning kechishi

Tadqiqot davomida 20 dan 38 haftagacha bo'lgan anemiya bilan kasallangan ayollarda homiladorlik va tug'ish tekshirildi. Tug`ruq jarayonida yuzaga keladigan potologik asoratlar homilador ayollarda chuqur o`zgarishlarni ta`minlab, organizmda moslashuv ...

Похожие статьи

Quyosh elementlarining optik xususiyatlarini yaxshilash usullari

Ushbu maqolada, quyosh elementlarini optik xususiyatlarini optimallashtirish uchun qo’llaniladigan texnik yechimlarning nazariy asoslari berilgan.

Tarbiyasi og‘ir o‘quvchilar bilan fizika fanida ishlash

Ushbu ishda biz o'qituvchilik faoliyatining boshida yosh o'qituvchida yuzaga keladigan muammolarni ko'rib chiqamiz.

Umumta`lim fanlarining o’qitilishida interfaol usullarning qo’llanilish samaradorligi

Maqolada mamlakatimiz yoshlarida umumta`lim fanlarni yuqori darajada shakllantirish, bu jarayonda umumta`lim fanlarini o’qitish sifatini ta`minlashda turli innovatsion metodlardan foydalanish orqali belgilangan natijalarga erishish.

So‘z birikmasining valentlik vazifasi

Ushbu maqolada so‘z birikmalarining boshqa birliklar bilan birikishi hamda imkoniyati va xususiyatlari, valentlik hodisasini o‘rganish va uning turlarini farqlash ko’rib chiqilgan.

Gazetasi sarlovhasining o'rganilish tarixi va undagi murojaat so'zlarining ishlatishi (misrning «al-Ahram» gazetasi asosida)

Ushbu maqolada gazeta va unda yoritilayotgan axborotlar sarlavxasi tarixi ko’rib chiqilgan hamda sarlavxa tanlashda nimalarga e’tiborish kerakligi ochib berilgan

Ingliz tilini o'qitishdagi zamonaviy ta'lim texnologiyalari

Ushbu maqolada til va uni o’rganishda foydalaniladigan zamonaviy ta’lim texnologiyalaridan bir nechtasi yoritib berilgan.

Yadroviy tibbiyot tarixiga doir metodik materiallar

Maqolada yadroviy tibbiyotga fani tarixiga doir ayrim metodik ma’lumotlar keltirilgan. Rentgen nurlari va radioaktivlik hodisasining kashf etilishi. Frederik Soddi tomonidan fanga radioaktiv izotoplartushunchasining kiritilishi. Yadroviy tibbiyot fan...

Ingliz tilini o’qitishda zamonaviy innоvatsion texnologiyalaridan foydalanish

Ushbu maqolada O’zbekiston Respublikasida chet tillariga berilgan katta ahamiyat hamda ularni o’rganish uchun zarur bo’lgan innovatsion texnologiyalar yoritilgan

German tillari grammatikasini o‘qitishning umumnazariy masalalari

Maqolada german, bu o‘rinda ingliz tili misolida so‘z grammatik ma’nosining shakllanish imkoniyatlari lingvo-kognitiv tahlildan o‘tkaziladi.

Kamqon ayollarda homiladorlik va tug`ruqning kechishi

Tadqiqot davomida 20 dan 38 haftagacha bo'lgan anemiya bilan kasallangan ayollarda homiladorlik va tug'ish tekshirildi. Tug`ruq jarayonida yuzaga keladigan potologik asoratlar homilador ayollarda chuqur o`zgarishlarni ta`minlab, organizmda moslashuv ...

Задать вопрос