Технология • 03 Наурыз, 2023

Дауысты мәтінге айналдыратын технология

479 рет
көрсетілді
6 мин
оқу үшін

Қазір сан түрлі ақпараттан көз сүрінеді. Оның қайсысы шын, қайсысы өтірік екенін ажырату да қиын. Әйтеуір солардың арасынан құмнан алтын сүзгендей жылт ете қалған жағымды жаңалыққа елең ете қаласың. Бір ай бұрын Nazarbayev University-індегі Ақылды жүйелер мен жасанды интеллект институтының ғалымдары (NU ISSAI) түркі тілдеріндегі сөйлемдерді танитын технология әзірлегенін жазып, оқырман қауымнан сүйінші сұраған едік. Бұл жолы ғылым ордасына арнайы барып, технологияны жасаған мамандармен тілдесуді жөн көрдік.

Дауысты мәтінге айналдыратын технология

Технология танитын он тілдің қата­рында қазақ, әзербайжан, өзбек, қырғыз, түрік, ұйғыр, башқұрт, татар, чуваш және саха тілдері бар. Жаңа технология Siri және Alexa дауыстық көмекшілердің, виртуалды ассистенттің және дауыс жүйе­сінің үлгісімен аталған түркі тілде­ріндегі сөйлемді мәтінге айналдыра­ды. Мысалы, көлемді жазбаңызды перне­т­ақтамен тықылдатып термей-ақ оқи сал­саңыз, сол мезетте мәтінге айналып шыға келеді. Қысқасы, адам мен ком­пьютер арасындағы әрекеттестікті бір­шама жеңілдетеді.

Мұндай технологияны әзірлеуге жан-жақты дайындық керек екені айтпаса да түсінікті. Алдымен мәтіндерді қамтитын дерек қоры болуы маңызды. Мәселен, интернеттегі тілдік және сөй­леу қоры бай тілдерге ағылшын, жапон, қытай тілі жатады. Өйткені олардың сөйлемді тану технологиясының ұзақ­тығы 1000-2000 сағатты қамтыса, кері­сінше, түркі тілдерінің ғаламторда ашық түрде таралған сөйлеу деректері аз. Қолжетімділік жоқ десек болады. «Сондықтан біз түркі тілдеріндегі сөйлемді танитын технологияны әзірлеуді қолға алдық», деді ISSAI деректер талдаушысы Рүстем Еспанов.

– Айталық, зерттеумізде қарастырған чуваш және саха тілінің сөйлемді танудағы жалпы ұзақтығы 20 сағаттан аспайды. Осыдан-ақ оның көрсеткіші төмен екенін білесіз. Бұл жоба түркі тіл­дерінің жалпы ерекшеліктерін лек­си­ка, фонология және морфология тұрғысынан пайдалана отырып жасал­ды. Сондай-ақ сөйлеген сөзді тану үдерісінде технология сирек қате жібереді. Башқұрт, қазақ, татар, түрік, ұйғыр және өзбек тілдері үшін символ­дардағы қателік бес пайыздан аз, – деді ол.

Жалпы, бұл технологияны жасауға мамандар алты ай уақыт жұмсап, оған керек­ті түркі тілдеріндегі сөйлемдерді та­нуға арналған мол дерек қорын жи­наған.

– Біз алдымен мәтін деректерін жи­нау­ды бастадық. Мәселен, қазақ тіліндегі мәтінді жинау үшін арнайы сайт ашып, оған барлық өңірдің тұрғындарын тартып, әртүрлі тақырыпта сөйлеген сөзін жазып алдық. Сонымен бірге теле­арналардағы бейнежазбалардан айтулы тұлғалардың сөйлеген сөздерін түсірдік. Соның нәтижесінде, қазақ тілінің мол қоры жиналып, оның саны 300 сағаттан, 1000 сағатқа дейін жетті, – деді NU ISSAI деректер талдаушысы Саида Мұсаходжаева.

Қазір елімізде цифрлық жүйеге барынша назар аударылып жатқаны рас. Біз әңгімелеп отырған технология да соның бір жемісі дер едік. Жаңа модельді ISSAI сайтынан кез келген тұтынушы тегін пайдалана алады. Жалпыға қолжетімді. Қолданушы бағдарламалық кодты алып, жұмыс істей береді. Тіпті кемшіліктерін байқаса, оны жетілдіруге де құқы бар.

Тіл – тірі организм. Әр тілдің сан ғасырдан сақталған табиғаты, танымы, бояуы бар. Әсіресе түркі тілдерінде көркемдіктің, әуезділіктің үлесі басым. Ғалымдар сөйлемді тану технологиясын әзірлегенде осы ерекшелікке баса мән беріпті.

– Түркі халықтарының тілдері тамырлас, бір-біріне жақын дегенімізбен, кейбір сөйлемдердің мағынасын түсіну қиын болды. Саха тілінің де өзгешеліктері көп. Сонымен бірге қазір түрік, әзербайжан, өзбек халықтары латынша қаріпті пайдаланады. Ал біз кириллицаны қолданамыз. Осы жағынан да шамалы кедергілер кездесті. Бірақ оны бір қалыпқа түсірдік, – деді Р.Еспанов.

Бізбен әңгімелескен Рүстем Еспанов пен Саида Мұсаходжаева – Ақылды жүйелер мен жасанды интеллект институтының жас ғалымдары. Рүстем – Алматыдағы Абылайхан атындағы Қазақ халықаралық қатынастар және әлем тілдері университетінде білім алған. Ағылшын тілі мұғалімі. Осында 2020 жылдан бері жұмыс істейді. Жас ғалым бұған дейін мәтінге қатысты «Атаулы мәтіндерді анықтау» атты жоба жасап шығарған. Ал Саида елордадағы №56 мектеп-лицейін бітірген соң Nazarbayev University-іне түскен. Одан кейін Кореяда екі жыл магистратурада оқыпты.

ISSAI мамандары енді сөйлемді тану технологиясын одан әрі жетілдіріп, он түркі тілінің қатарына қарақалпақ, ноғай, түркімен тілдерін қосуды жоспарлап отыр. Осы бағытта жұмыс жүргізіліп жатыр. Сонымен қатар аталған институт ғалымдары сөйлемді тану ғана емес, оны синтездеуге арналған жобаны да бастапты. Оны дауысты түрлендіру деп айтса да болады. Бұл дегеніміз кез келген адамның 10-15 секундтағы дауысын алып, оны мәтінге айналдырады. Бір жағынан бұл аудиокітаптардағы мәтінді аудиофайлға жылдам аударады.

ISSAI институтының негізін қалау­шы, университет профессоры Хусейн Атакан Варол бұл жобалардың ең маңыздысы жоғары білікті техникалық сарапшыларды даярлау екенін жеткізді. «Олар Қазақстанның технологиялық дамуына ықпал етіп қана қоймай, бо­лашақ ұрпақ үшін жаңа мүмкіндіктер туғызады. Технологияларды басқа елдерде дамыту үшін өздерінің кәсіби білімдерімен, тәжірибелерімен бөлісуге және қолдануға дайын», дейді білікті ғалым.