Бір өкініштісі, жасанды интеллект қазақ тіліне әлі де шорқақтау. Дегенмен ізденіс бар. Жақында Назарбаев университетінің «Ақылды жүйелер және жасанды интеллект» институты қазақшаға жетік «Ұмай» көмекшісін жасап шығарды.
«Ұмай» – шынайы әйел бейнесі ретінде цифрлық жүйеде жасалған, қазақ тілінде сөйлейтін виртуалды көмекші. Оның мүмкіндігі бірнеше саланы қамтиды. Атап айтсақ, ғылым, тарих, технология, денсаулық сақтау салаларындағы сұрақтарға еркін жауап береді. ISSAI жетекшісі, Назарбаев университетінің Инженерлік және цифрлық ғылымдар мектебінің профессоры Атакан Варолдың айтуынша, бұрын үлкен деректер жиынтығының жеткіліксіз болуы қазақ тілін цифрлы әлемде шектейтін еді. Енді екі мыңнан астам адамның үш жүз сағаттық жазбасын жинау нәтижесінде қазақ сөзін автоматты түрде тану жобасы іске қосылды.
«Біздің басты мақсатымыз – отандық зияткерлік күштің, атап айтқанда шағын «ISSAI» командасының озық мүмкіндіктерін көрсету. Ғалымдарымыз цифрландыру жүйесінде әлемдік бәсекеге ілесе алатынын іс жүзінде көрсете білуі керек. «Ұмай» жұмысында біздің институт әзірлеген бірқатар негізгі технологияларды қолданады. Атап айтсақ, мәтін сөзін түрлендіріп, даусын құбылта алады. Сондай-ақ шынайы бейнедегі жасанды интеллектінің негізінде нейромашиналық аударма жасайды», деді профессор.
Жоба жетекшілерінің айтуынша, бұл жүйеге түркі мифологиясына қатысты атау берілуінде де үлкен мән-мағына бар. Біріншіден, атау төл мәдениетімізбен тікелей байланысты. Екіншіден, қазақша цифрлық тұлғаның алғашқы бейнесі болғандықтан, ол болашақ цифрлы көмекшілердің «Анасы» ретінде қабылдануы бек мүмкін.
Жақында Назарбаев университетінде Премьер-министр Олжас Бектеновтің төрағалығымен Назарбаев қоры Жоғары қамқоршылық кеңесінің отырысы өтті. Кеңес мүшелері университеттің жоғары функционалды зертханаларымен, ғалымдардың жаңа әзірлемелерімен, атап айтқанда ақылды жүйелер және жасанды интеллект институтымен, импульстік үдеткіш зертханасымен танысты. Сонымен қатар таныстырылым барысында жасанды зерденің қазақ тілінде қызмет етуі туралы, оның болашағы жайында сөз қозғалды. Университеттегі «Ақылды жүйелер мен жасанды интеллект институты» директорының орынбасары Ербол Абсалямов жасанды интеллектіні қазақша сөйлетуге үлес қосып жатқанын атап өтті. «Қазіргі таңда ChatGPT ағылшын тілінде қызмет етеді. Келешекте өзіміздің қазақ ChatGPT кең қолданыста болуына әлде де қызу жұмыс атқарып жатырмыз. Сонда «Ұмай» жүйесі төл құндылықтарымызға сай бізбен еркін сөйлесе алады», деді ол.
ISSAI жетекшісі доктор Варолдың айтуынша, жобаның негізгі техникалық қиындығы жүйені біріктіру болған. Яғни «Ұмай» OpenAI платформасының ChatGPT чат-боты арқылы сұрақтарға жауап табады. Бірақ бұл боттың қазақ тіліндегі жұмысы әлі сапасыз екені бәріне мәлім. Бұл шектеуді жеңу үшін «Ұмай» Назарбаев университетінде ISSAI әзірлеген «Tilmash» нейромашиналық аудармасының жетілдірілген үлгісін пайдаланады. Сонда бұл жүйе пайдаланушылардың сұрақтарын алдымен ағылшын тіліне аударып, кейін ChatGPT берген жауаптарды қайтадан қазақ тіліне аударады.
«Біздің институт «Tilmash» деп аталатын төрт тілге аударма жасайтын жүйе жасап шығарды. Әртүрлі стильдегі үлкен мәтіндік қордан құрастырылған бұл жүйе «Google» және «Yandex» аудармашыларымен бәсекелесе алады. Яғни ол қазақ тілінде қойылған сұрақтарды алдымен ағылшын тіліне аударады, содан кейін сұраныс ChatGPT-ге барады. Кейін ағылшын тілінде берілген жауаптарды «Tilmash» қайтадан қазақ тіліне аударады. Сосын арнайы технология арқылы біз мәтінді дауысқа айналдырамыз», деді «Ұмай» әзірлеушілерінің бірі, ISSAI-дің аға деректер талдаушысы Асхат Күздеуов.
«Ақылды жүйелер және жасанды интеллект институты» (ISSAI) еліміздің цифрлық саласындағы зерттеулер мен инновациялардың орталығы ретінде 2019 жылдың қыркүйегінде құрылған болатын. Назарбаев университетінің C4 зерттеу ғимаратында орналасқан институт өнеркәсіп пен қоғамның нақты мәселелерін шешу үшін машиналық интеллект бойынша пәнаралық зерттеулер жүргізеді. ISSAI – Азия, Еуропа және Америка Құрама Штаттарының үлгілерін ескере отырып, жасанды интеллект саласындағы ұлттық әлеуетті дамытуға бағытталған.
«Unreal Engine 5» бағдарламалық жасақтамасымен жұмыс істейтін «Ұмай» ISSAI-да әзірленген бірнеше құрылғыны біріктіреді. Мысалы, ол қазақ тілінде табиғи және еркін қызмет ету үшін автоматты түрде сөйлеуді тану (ASR) және мәтіннен сөйлеуге айналдыратын (TTS) технологиялар арқылы жұмыс істейді. Жосықсыз жаңалықтар жан-жақтан тасқын болып төгілген бүгінгі ақпарат заманында «Ұмай» секілді қазақша жүйелер біздің қоғамға қажет-ақ.