Коллажды жасаған – Зәуреш Смағұл, «ЕQ»
Осы орайда ұлт ұстазы Ахмет Байтұрсынұлының «Озғандарға жету керек. Жеткендерден озу керек» деген сөзі санамызға сәуле түсіреді. Қазір еліміз бұл салада қарқынды жұмыс атқарып, бірқатар жақсы нәтижеге қол жеткізіп жатыр. Ендігі мәселе – жасанды интеллектінің қазақша сөйлеу сапасын жақсарту.
Ең әуелі қойылған сауалға жасанды интеллектінің қалай және қайдан жауап беретінін білгеніміз дұрыс. Жасанды интеллект ғаламтор жадындағы барлық ақпараттарды сүзіп алып, тиісті мәлімет ұсынады. Демек, ағылшын мен орыс тіліндегі ақпараттардың толымды болу себебі – сол тілдегі материалдардың молдығынан.
Сарапшылардың деректеуінше, ең үлкен энциклопедиялық жоба саналатын уикипедияның ішінде 220 мың ғана қазақша жазылған мақала бар. Бұл ақпараттарды жасанды интеллект базасына енгізген кезде мұхитқа құйған тамшыдай ғана болады. IT маман Тимур Бектұр жасанды интеллект қазақша сапалы әрі толық жауап беруі үшін оған кемінде 10 млн ақпарат керек. «Жасанды интеллектінің негізгі қорегі – мәліметтер қоры. Онсыз жүйе жұмыс жасамайды. Енді қазақша мәліметтер қорын қалай ұлғайтамыз? Жауап біреу. Қазақ қоғамы қазақша контентті көбейтпей, орыс тіліндегі контентті тұтынуды жалғастыра берсе, ChatGPT қазақшаға шорқақ болып қала береді», дейді Т.Бектұр.
Ал халықаралық «Қазақ тілі» қоғамының президенті Рауан Кенжеханұлы бұл мәселені шешудің тиімді жолын ұсынады. Ол ғаламдық платформаларды жүйелі локализациялау керектігін айтады. Мәселен, бір ғана «Google» корпорациясы қорындағы ең маңызды он мың мақаланы қазақша аудару – жасанды интеллектінің тілдік қорын байытып, мазмұнын тереңдете түседі.
Мұны іс жүзінде қолдануды Назарбаев университетінің «Ақылды жүйелер және жасанды интеллект» институты бастап кетті. Олар нейрожеліге қазақша ақпараттарды көптеп жүктей отырып, қазақшаға жетік «Ұмай» көмекшісін жасап шығарды.
«Ұмай» – шынайы әйел бейнесі ретінде цифрлық жүйеде жасалған, қазақ тілінде сөйлейтін виртуалды көмекші. Оның мүмкіндігі бірнеше саланы қамтиды. Атап айтсақ, ғылым, тарих, технология, денсаулық сақтау сала-ларындағы сұрақтарға еркін жауап береді. ISSAI жетекшісі, Назарбаев университетінің Инженерлік және цифрлық ғылымдар мектебінің профессоры Атакан Варолдың айтуынша, бұрын үлкен деректер жиынтығының жеткіліксіз болуы қазақ тілін цифрлы әлемде шектейтін еді. Енді екі мыңнан астам адамның үш жүз сағаттық жазбасын жинау нәтижесінде қазақ сөзін автоматты түрде тану жобасы іске қосылды.
Бірақ бұл әлі де жеткіліксіз. Барлық саланың мамандары шағын ақпарттан бастап, реферат, монография, көркем шығармаларын ғаламтор жүйесіне қарқынды түрде «уики мақала» түрінде енгізуі керек. Сонда мәліметтер қоры ұлғайып, қазақ тілінің жаңа технологиядағы қолданыс аясы кеңи түспек.