MACHINE LEARNING - болашақ технологиясы | Статья в журнале «Молодой ученый»

Отправьте статью сегодня! Журнал выйдет 28 декабря, печатный экземпляр отправим 1 января.

Опубликовать статью в журнале

Библиографическое описание:

Кулмырзаев, Нурлан Серикулы. MACHINE LEARNING - болашақ технологиясы / Нурлан Серикулы Кулмырзаев, Н. Ш. Манатова. — Текст : непосредственный // Молодой ученый. — 2020. — № 9.1 (299.1). — С. 18-20. — URL: https://moluch.ru/archive/299/67923/ (дата обращения: 19.12.2024).



ХХI ғасыр заман талабына сай үш тілді жетік меңгеруіміз керек. Соған сай барлық жерде үш тілді бағдарламалармен оқытылып жатыр. Барлық мағұлматтар интернет желілерінде және олардың көбісі орыс ағылшын тілінде. Өкінішке орай, қазақ тілінде мәліметтер жеткіліксіз. Егер сізге толық мәлімет керек болса ағылшын тілінде қарауға тура келеді. Жинаған ақпаратқа аударма жасау керек. Бірақ, аудармада мәліметтердің мағыналары өзгеріп кететіндіктен көп қиындықтар туғызады. Ағылшын тіліне сұраныс көп болғандықтан, аудармашылардың жұмыстары қарқынды дамуда. Сондықтан қазақ тіліннен ағылшын тіліне жоғары деңгейдегі аударманы жасау ең өзекті мәселелердің бірі. Машиналық аударма кең мағынада ғылыми бағыт болып табылады және көптеген кәсіби-өндірісттік салаларда қолданыс тауып жатыр. Олардың ең бірінші талабы аударылған мәтін сапасының жоғары болуы және мағыналық сәйкестігі дұрыс келуі.Сол үшін заманауи техникалар мен технологиялардың сан түрлері мен әдістері қолданылып отыр. Бұл мәселелердің дұрыс шешімін табу - машиналық аударма саласындағы басты мақсат болып табылады.

Машиналық аударма (машиналық аударма) - бір тілдегі сөзді немесе мәтінді басқа компьютерге, электронды компьютерлердің (компьютерлердің) көмегімен жасалған аударма. Инженерлік және қолданбалы ғылымдардың машиналық аудармасы лингвистика саласына жатады. Тілдердің табиғи коды (шартты белгі) статистикалық және ақпараттық-теориялық әдістер ретінде қарастырылады. Көбінесе мәтінді талдау арқылы лексикадан синтаксис зерттеу саласына енеді, семантикалық жағына ерекше көңіл бөлінеді. Қазақстанда профессор Бектаевтың жетекшілік ететін топ әр түрлі мәтіндердің қазақ тілінен орыс тіліне аудармасымен айналысып, практикалық және теориялық зерттеулер жүргізуде. Тұтынушының қажетіне жарамды болмаған кезде, машиналық аудармашы мамандарының өңдеуінен өтеді. Қазіргі кезде ағылшын, неміс, француз тілдерінде жұмыс істейтін орысшаға аударатын жүйелер бар [1].

Машиналық оқыту - деректерді талдау әдісі, ол аналитикалық модельді құруды автоматтандырады. Бұл машиналар тәжірибе арқылы үйреніп, бейімделуі тиіс идеясына негізделген жасанды интеллект саласы. Ол компьютермен жиналған статистикалық деректер негізінде болжамдар жасайтын есептеуіш статистикамен тығыз байланысты. Ол кейде деректерді интеллектуалды талдаумен шатастырады, бірақ бұл барлау деректерін талдауға көбірек бағытталған, ал машиналық оқыту негізінен болжау үшін пайдаланылатын күрделі алгоритмдерді қамтиды, Машиналық оқыту оқу деректері арқылы алынған белгілі атрибуттардың негізінде болжауға шоғырланады, содан кейін деректерді іздеу кез келген деректерде белгісіз атрибуттарды іздеуге көбірек назар аударады. Машиналық оқыту осындай компьютерлік бағдарламалар мен алгоритмдерді әзірлеуге шоғырланады,олар жаңа деректерді беру кезінде өсіп, бейімделуді үйренеді.Бұл процесс ұқсас емес деректерді интеллектуалды талдау процесі. Екі жүйе оларға берілген деректер арқылы өтеді немесе шаблондарды іздеуде жиналады. Дегенмен, деректерді зияткерлік талдау үшін қосымшаларда, деректер адамның түсінуі үшін алынады, ал машиналық оқыту алгоритмдері бұл деректерді деректер үлгілерін іздеу және тиісінше әрекеттерді өзгерту үшін пайдаланады. Бірақ қазіргі заманғы зерттеулердің статистикалық саласы уақыттың аймағынан тыс, бейнелерді тану және деректерді іздеу желісінде болады.

Машиналық аударманың тарихына тоқталар болсақ ғылыми сала ретінде 1946 жылы Принстонның ғылыми-зерттеу институтында машиналық аударма жасау идеясы арнайы мәселе ретінде талқыланды. Норберт Винер алдымен машина туралы түсінік қалыптастырды және меморандумда бұл идеяны дешифровка ісінің американдық маманы Уавердин Уорренге бірізді шешімге келтірілді. Сәл кейінірек атақты ғалым 1949 жылдың 15 шілдесінде компьютерлік технологиялар саласындағы екі жүзден астам мамандарға меморандумда көтерілген мәселелер туралы хабарлады. Тілдердің және машиналық аударманың фундаменталды мүмкіндіктері табиғатта толықтай формальды, әр тілге тән ерекшеліктер ұқсас қасиеттердің болуымен байланыстырды [2].

Осылайша, бастама Уивердің жеке даму сатысында ғылыми бағыт ретінде машиналық аударма туралы меморандумынан бастама алды. Бұл бағытты шартты түрде үш негізгі кезеңге бөлуге болады. Олар, 1949 жылдан бастап, 60-шы жылдардың ортасына дейін, 60-шы жылдардың ортасынан 70-ші жылдардың аяғына дейін, 80-ші жылдардан қазіргі уақытқа дейін. Бұған негіз болған ғылым мен техниканың дамуында қол жеткен нәтижелер үш кезеңге бөлінетіні белгілі. Олардың ішінде лингвистикалық, математикалық және техникалық жабдықтау мәселелері машиналық аударма жүйелерінде ерекше орын алады.

Қaзір Қазақстaнның жағдайында қазақ тілінің лексикасы жаңартылуда, сөздіктер мен оқулықтар арнаның, тіл білімінің кеңеюіне байланысты уақыт талабына сай өзгертілуде. Соңғы жылдары қазақ және орыс тілдерінде түбір сөздердің, түсініктемелер мен қосымшалардың жаңа сөздерін мен байырғы сөздерді енгізген сөздіктердің пайда болуы. Күнделікті қарым-қатынаста әдеби қазақ тілінің нормаларына сәйкес сөздіктерде сияқты, жаттығулар жүйесінде жиі қолданылатын сөздер де орын алуда. Шетел тіліндегі фразалар мен сөздердің транскрипциясы мен айтылуы ескеріліп, тіркеудің көмегімен сөздердің басым стилистикалық ерекшеліктерін шартты белгілер арқылы көрсетип беру жұмыстары да атқарылуда. Ағылшын грамматикасын зерттеуде ана тілінің тиімді ықпалын анықтау үшін екі тілдің грамматикалық жүйелерінің әсерін салыстыра отырып, олардың ұқсастықтары мен ерекшеліктерін айқындау керек. Соның ішінде, қазақ тілінде де ағылшын тіліндегі етістіктің шақтары мен олардың аналогтарының формаларына мен баламаларына көңіл аудару керек. Аударма бойынша сөйлем арнайы ережелер бойынша жазылады және аударылады, яғни тағы бір туындайтын мәселе бар: бұл осы ережелердің барлығын бағдарламалау тілінде жазу. Ең маңызды проблемалар мен оларды шешудің әдістері - машиналық аударма болып табылады және оларды шeшу тәсілдер белгісіз және оңай да емес [3].

Машиналық аударма ісі ғылыми зерттеулерде және кәсіби салаларда қолданыс табуда. Жоғары сапалы және заманауи технологиялардың семантикалық аудармасы дұрыс болу үшін технологиялардың көптеген әдістер мен түрлері қолданылуда. Машиналық аударма жүйесі өте ауқымды және күрделі болып табылады: екі немесе одан да көп тілдерді қарастырады, қажетті ақпаратпен жабдықталған сөздіктерді қамтиды, ол аударма параметрлерінің өзгеруіне және сәйкестілігіне, сонымен қатар грамматикалық ақпаратпен жабдықталған (морфологиялық, синтаксистік және семантикалық) талдаудың алгоритмдік құралдарын жіберуді қамтамасыз ету үшін қажет.

Қазіргі әлемдегі машиналық аударма ісі бойынша жұмысты дамытуға екі негізгі ынталандыру себеп бар.

Біріншісі: іс жүзінде, өзіндік ғылыми;

Ол компьютердің күрделілігімен анықталады. Тілдік аударма қызметінің бір түрі ретіндетілдің барлық деңгейіне әсер етеді - графиктерді танудан бастап (ауызша сөйлеуді аудару) сөз бен мәтіннің мағынасын береді.

Сонымен қатар, кері байланыс аудармаға тән және белгілі бір тіл деңгейлерінің құрылымы туралы теориялық гипотезаны бірден тексеру мүмкіндігі мен алгоритмдердің тиімділігі жоғары. Жалпы машиналық аудармада назар аударатын жағдай жаңа теориялар пайда бола бастады және тілдік деректер мен процестер автоматтандырылды.

Екінші - ынталандыру әлеуметтік сипатқа ие және бұл рөлдің артуына байланыстықазіргі әлемде машиналық аударма тәжірибесікөлемін құрайтын тіларалық байланысты қамтамасыз ету шарттарыжыл сайын артып келеді. Тілдік кедергілерді жеңудің басқа жолдары, қатынас жолында - бірыңғай тілді дамыту немесе қабылдау, сонымен қатаршет тілдерін үйрену - аудармамен салыстыру тиімділігі. Осы тұрғыдан алғанда, аудармаға балама жоқ деп айтуға болады, сондықтан жоғары сапалы және өнімділігі жоғары машиналық аударма жүйесінің дамуы маңызды әлеуметтік және коммуникативтік мәселелерді шешуге көмектеседі [4].

Машиналық аударманың артықшылықтары.

  1. Аударманың жоғары жылдамдығы. Машина жүйесін қолдану арқылы аудармаға қажет уақытты едәуір қысқарта алады
  2. Аударманың төмен құны. Біз аударманың әр беті үшін ақша төлеуге мәжбүрміз. Интернеттегі аударылған мәтіннің мазмұнын тез түсінуіңіз керек. Аудармаларда толық мәтінді аударатын болсаңыз, сөздің мағынасын жоғалтып аласыз. Бұл жағдайда машиналық аударма жүйесі сенімді әрі тиімді көмекші болатыны сөзсіз. Онлайн аударма әрқашан қолыңызда және сізге қажет уақытта тез көмектесе алады.

Машиналық оқыту негізінен көптеген параметрлерді оңтайландыру әдісіне негізделген диапазонды немесе спектрді қолданады. Мұндай оңтайлы параметрді қолмен табу адамдар үшін қиын. Мысалы, динамика пен амплитуда арасындағы байланысты қарапайым халық түсіне алмайды. Машиналық оқытудың кез-келген жағдайда жұмыс жасап кетуіне ешқандай кепілдік жоқ. Кейде машинамен оқыту сәтсіз болады, дұрыс алгоритмді қолдану үшін шешілуі керек мәселені түсінуді талап етеді. Бұл оқытуда алгоритмдері көптеген мәліметтерді қажет етеді. Мұндай үлкен көлемдегі деректермен жұмыс істеу немесе оларды жинау өте қиын. Бірақ қол жетімді деректердің мөлшерін арттыру арқылы біз модельдер мен алгоритмдерді жылдам және автоматты түрде жасай аламыз. Сондықтан машиналық оқыту аз уақыттың ішінде кең таралуда және біздің күнделікті өміріміздің ажырамас бөлігіне айналды.

Әдебиет:

  1. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: основы моделирования и первичная обработка данных. - М.: Финансы и статистика, 1983. - 471 c.
  2. Флах П. Машинное обучение. - М.: ДМК Пресс, 2015. - 400 с.
  3. Гудфеллоу Я., Бенджио И., Курвилль А. Глубокое обучение. – М.: ДМК Пресс, 2018. – 652 с.
  4. Бринк Х., Ричардс Дж., Феверолф М. Машинное обучение. – СПб.: Питер, 2017. – 335 с.
Основные термины (генерируются автоматически): мена, Машинное обучение, немес.


Задать вопрос