Технология • 03 Наурыз, 2023

Дауысты мәтінге айналдыратын технология

6 мин

оқу үшін

Қазір сан түрлі ақпараттан көз сүрінеді. Оның қайсысы шын, қайсысы өтірік екенін ажырату да қиын. Әйтеуір солардың арасынан құмнан алтын сүзгендей жылт ете қалған жағымды жаңалыққа елең ете қаласың. Бір ай бұрын Nazarbayev University-індегі Ақылды жүйелер мен жасанды интеллект институтының ғалымдары (NU ISSAI) түркі тілдеріндегі сөйлемдерді танитын технология әзірлегенін жазып, оқырман қауымнан сүйінші сұраған едік. Бұл жолы ғылым ордасына арнайы барып, технологияны жасаған мамандармен тілдесуді жөн көрдік.

Азамат ЕСЕНЖОЛ

Технология танитын он тілдің қатарында қазақ, әзербайжан, өзбек, қырғыз, түрік, ұйғыр, башқұрт, татар, чуваш және саха тілдері бар. Жаңа технология Siri және Alexa дауыстық көмекшілердің, виртуалды ассистенттің және дауыс жүйесінің үлгісімен аталған түркі тілдеріндегі сөйлемді мәтінге айналдырады. Мысалы, көлемді жазбаңызды пернетақтамен тықылдатып термей-ақ оқи салсаңыз, сол мезетте мәтінге айналып шыға келеді. Қысқасы, адам мен компьютер арасындағы әрекеттестікті біршама жеңілдетеді.

Мұндай технологияны әзірлеуге жан-жақты дайындық керек екені айтпаса да түсінікті. Алдымен мәтіндерді қамтитын дерек қоры болуы маңызды. Мәселен, интернеттегі тілдік және сөйлеу қоры бай тілдерге ағылшын, жапон, қытай тілі жатады. Өйткені олардың сөйлемді тану технологиясының ұзақтығы 1000-2000 сағатты қамтыса, керісінше, түркі тілдерінің ғаламторда ашық түрде таралған сөйлеу деректері аз. Қолжетімділік жоқ десек болады. «Сондықтан біз түркі тілдеріндегі сөйлемді танитын технологияны әзірлеуді қолға алдық», деді ISSAI деректер талдаушысы Рүстем Еспанов.

– Айталық, зерттеумізде қарастырған чуваш және саха тілінің сөйлемді танудағы жалпы ұзақтығы 20 сағаттан аспайды. Осыдан-ақ оның көрсеткіші төмен екенін білесіз. Бұл жоба түркі тілдерінің жалпы ерекшеліктерін лексика, фонология және морфология тұрғысынан пайдалана отырып жасалды. Сондай-ақ сөйлеген сөзді тану үдерісінде технология сирек қате жібереді. Башқұрт, қазақ, татар, түрік, ұйғыр және өзбек тілдері үшін символдардағы қателік бес пайыздан аз, – деді ол.

Жалпы, бұл технологияны жасауға мамандар алты ай уақыт жұмсап, оған керекті түркі тілдеріндегі сөйлемдерді тануға арналған мол дерек қорын жинаған.

– Біз алдымен мәтін деректерін жинауды бастадық. Мәселен, қазақ тіліндегі мәтінді жинау үшін арнайы сайт ашып, оған барлық өңірдің тұрғындарын тартып, әртүрлі тақырыпта сөйлеген сөзін жазып алдық. Сонымен бірге телеарналардағы бейнежазбалардан айтулы тұлғалардың сөйлеген сөздерін түсірдік. Соның нәтижесінде, қазақ тілінің мол қоры жиналып, оның саны 300 сағаттан, 1000 сағатқа дейін жетті, – деді NU ISSAI деректер талдаушысы Саида Мұсаходжаева.

Қазір елімізде цифрлық жүйеге барынша назар аударылып жатқаны рас. Біз әңгімелеп отырған технология да соның бір жемісі дер едік. Жаңа модельді ISSAI сайтынан кез келген тұтынушы тегін пайдалана алады. Жалпыға қолжетімді. Қолданушы бағдарламалық кодты алып, жұмыс істей береді. Тіпті кемшіліктерін байқаса, оны жетілдіруге де құқы бар.

Тіл – тірі организм. Әр тілдің сан ғасырдан сақталған табиғаты, танымы, бояуы бар. Әсіресе түркі тілдерінде көркемдіктің, әуезділіктің үлесі басым. Ғалымдар сөйлемді тану технологиясын әзірлегенде осы ерекшелікке баса мән беріпті.

– Түркі халықтарының тілдері тамырлас, бір-біріне жақын дегенімізбен, кейбір сөйлемдердің мағынасын түсіну қиын болды. Саха тілінің де өзгешеліктері көп. Сонымен бірге қазір түрік, әзербайжан, өзбек халықтары латынша қаріпті пайдаланады. Ал біз кириллицаны қолданамыз. Осы жағынан да шамалы кедергілер кездесті. Бірақ оны бір қалыпқа түсірдік, – деді Р.Еспанов.

Бізбен әңгімелескен Рүстем Еспанов пен Саида Мұсаходжаева – Ақылды жүйелер мен жасанды интеллект институтының жас ғалымдары. Рүстем – Алматыдағы Абылайхан атындағы Қазақ халықаралық қатынастар және әлем тілдері университетінде білім алған. Ағылшын тілі мұғалімі. Осында 2020 жылдан бері жұмыс істейді. Жас ғалым бұған дейін мәтінге қатысты «Атаулы мәтіндерді анықтау» атты жоба жасап шығарған. Ал Саида елордадағы №56 мектеп-лицейін бітірген соң Nazarbayev University-іне түскен. Одан кейін Кореяда екі жыл магистратурада оқыпты.

ISSAI мамандары енді сөйлемді тану технологиясын одан әрі жетілдіріп, он түркі тілінің қатарына қарақалпақ, ноғай, түркімен тілдерін қосуды жоспарлап отыр. Осы бағытта жұмыс жүргізіліп жатыр. Сонымен қатар аталған институт ғалымдары сөйлемді тану ғана емес, оны синтездеуге арналған жобаны да бастапты. Оны дауысты түрлендіру деп айтса да болады. Бұл дегеніміз кез келген адамның 10-15 секундтағы дауысын алып, оны мәтінге айналдырады. Бір жағынан бұл аудиокітаптардағы мәтінді аудиофайлға жылдам аударады.

ISSAI институтының негізін қалаушы, университет профессоры Хусейн Атакан Варол бұл жобалардың ең маңыздысы жоғары білікті техникалық сарапшыларды даярлау екенін жеткізді. «Олар Қазақстанның технологиялық дамуына ықпал етіп қана қоймай, болашақ ұрпақ үшін жаңа мүмкіндіктер туғызады. Технологияларды басқа елдерде дамыту үшін өздерінің кәсіби білімдерімен, тәжірибелерімен бөлісуге және қолдануға дайын», дейді білікті ғалым.