Қазақ тіліндегі алғашқы «Kaz-LLM» моделі биыл 16 желтоқсанда көпшілікке таныстырылады. Аталған жүйе сұрақ қоюшы тараптың сауалдарына қазақша сауатты һәм сапалы жауап береді. Одан бөлек, бұл бағдарлама орыс, ағылшын және түрік тілінде еркін сұхбаттаса алады.
«Кейінгі 5 жылда ISSAI қазақ тіліне қатысты көптеген дерек жинағын әзірледі. Бұл жобаны биыл сәуірде қолға алдық. Енді осы жылдың қыркүйек айында деректерді жинау жұмысын аяқтаймыз. Бізге берілген тапсырма – жобаны модель ретінде жасау еді. Одан әрі қазақ тілінің ауқымды моделін Цифрлық даму, инновациялар және аэроғарыш өнеркәсібі министрлігі жүзеге асырады. «Kaz-LLM» моделін Тәуелсіздік күніне орай желтоқсанда қалың жұртқа жариялаймыз», деді Назарбаев университеті Ақылды жүйелер және жасанды интеллект институты (ISSAI) директорының операциялық қызметтер жөніндегі орынбасары Ербол Абсалямов.
Бұдан бөлек, ISSAI институты мемлекеттік тілге қатысты тағы бірнеше жобаны ұсынып отыр. Соның бірі – «Umay». Бұл – қазақ тілінде еркін сөйлейтін виртуалды көмекші. Оның мүмкіндігі бірнеше саланы қамтиды. Атап айтсақ, ғылым, тарих, технология, денсаулық сақтау салаларындағы сұрақтарға еркін жауап береді.
«Қазақ тіліндегі үлкен тілдік модель «KazLLM» 100 млрд токенге негізделетін болады. Токен – деректерді бағалау бірлігі, ол сөз немесе сөздің бөлігі болуы мүмкін. Әлемдік трендтер көрсетіп отырғандай, әртүрлі чат-боттарға немесе «Алиса» мен «Alexa» сияқты ассистенттерге үйренген болсақ та, болашақта компьютерлермен қарым-қатынасымыз дәл осындай форматқа өтеді. Яғни бара-бара виртуалды аватарлармен сөйлесеміз. Біз оларды тек бизнесте, банктерде ғана емес, халыққа қызмет көрсету орталықтарында кездестіретін боламыз», деді ISSAI деректер талдаушысы Мәдина Әбдірахманова.
ISSAI жетекшісі, Назарбаев университетінің Инженерлік және цифрлық ғылымдар мектебінің профессоры Атакан Варолдың айтуынша, бұрын үлкен деректер жиынтығының жеткіліксіз болуы қазақ тілін цифрлы әлемде шектейтін еді. Енді екі мыңнан астам адамның үш жүз сағаттық жазбасын жинау нәтижесінде қазақша сөзді автоматты түрде тану жобасы іске қосылды.
«Жобаның нәтижесі «KazLLM» моделін құру болғанымен, ең басты мақсатымыз – еліміздегі жасанды интеллект саласындағы озық өнімдерді жасауға қабілетті мамандардың ғылыми тобын қалыптастыру. Яғни біз отандық зияткерлік күштің, атап айтқанда шағын «ISSAI» командасының озық мүмкіндіктерін көрсете алуымыз керек. Ғалымдарымыз цифрландыру жүйесінде әлемдік бәсекеге ілесе алатынын іс жүзінде көрсете білуге тиіс. «Umay» жұмысында біздің институт әзірлеген бірқатар негізгі технологияларды қолданады. Атап айтсақ, мәтін сөзін түрлендіріп, даусын құбылта алады. Сондай-ақ шынайы бейнедегі жасанды интеллектінің негізінде нейромашиналық аударма жасайды», деді профессор.
«Umay» жүйесін ашып айтсақ, ол OpenAI платформасының ChatGPT чат-боты арқылы сұрақтарға жауап табады. Содан соң, Назарбаев университетінде ISSAI әзірлеген «Tilmash» нейромашиналық аудармасының жетілдірілген үлгісін пайдаланады. Сонда бұл жүйе пайдаланушылардың сұрақтарын алдымен ағылшын тіліне аударып, кейін ChatGPT берген жауаптарды қайтадан қазақ тіліне аударады. Нақтырақ айтсақ, «Tilmash» – қазақ, орыс, ағылшын, түрік, татар және өзбек тілдеріне екі жақты аударма жасауға мүмкіндік беретін жоба. Әртүрлі стильдегі үлкен мәтіндік қордан құрастырылған бұл жүйе «Google» және «Yandex» аудармашыларымен бәсекелесе алады.
Бүгінгі ақпарат заманында қазақшаға жетік «Kaz-LLM», «Tilmash», «Umay» секілді бағдарламалар қоғамға қажет-ақ. Осындай жасанды интеллект арқылы озық зерттеулер жүргізіп жүрген «Ақылды жүйелер және жасанды интеллект институты» (ISSAI) еліміздің цифрлық саласындағы зерттеулер мен инновациялардың орталығы ретінде 2019 жылдың қыркүйегінде құрылған еді. Айта кетейік, ISSAI – Азия, Еуропа және Америка Құрама Штаттарының үлгілерін ескере отырып, жасанды интеллект саласындағы ұлттық әлеуетті дамытуға бағытталған.