Digital • 05 Қыркүйек, 2024

Қазақша жасанды интеллект қалыптастыру бастамасы

104 рет
көрсетілді
3 мин
оқу үшін

Кернеуі күннен-күнге күшейіп, өмірімізде өріс алып келе жат­қан ғылымның күрделі саласы­ның бірі – жасанды интеллект. Бұл – адамның ойлау үдері­сін компьютерлік жүйеде модель­дей­тін бағдарлама желісі. Елімізде енді ғана қолға алы­нып жатқан мәселе болғаны­мен, «жасанды интеллект» термині бағдарламашы Джон Маккартидің аузынан 1956 жылы АҚШ-тың Дартмут колледжінде өткен ғылыми кон­фе­ренциясында шығып үлгер­ген. Нәтижесінде, жасанды интел­лектіні игерген жасампаз мемле­кеттер даму реттілігінде алғаш­қы орындарға орнығып алды.

Қазақша жасанды интеллект қалыптастыру бастамасы

Коллажды жасаған – Зәуреш Смағұл, «ЕQ»

Осы орайда ұлт ұстазы Ахмет Байтұрсынұлының «Озғандарға жету керек. Жеткендерден озу керек» деген сөзі санамызға сәуле түсіреді. Қазір еліміз бұл салада қарқынды жұмыс атқарып, бірқатар жақсы нәтижеге қол жеткізіп жатыр. Ендігі мәселе – жасанды интеллектінің қазақша сөйлеу сапасын жақсарту.

Ең әуелі қойылған сауалға жасанды интеллектінің қалай және қайдан жауап беретінін білгеніміз дұрыс. Жасанды интеллект ғаламтор жадындағы барлық ақпараттарды сүзіп алып, тиісті мәлімет ұсынады. Демек, ағылшын мен орыс тіліндегі ақпараттардың толымды болу себебі – сол тілдегі материалдардың молдығынан.

Сарапшылардың дерек­теуінше, ең үлкен энцикло­педиялық жоба саналатын уики­педияның ішінде 220 мың ғана қазақша жазылған мақала бар. Бұл ақпараттарды жасанды интеллект базасына енгізген кезде мұхитқа құйған тамшыдай ғана болады. IT маман Тимур Бектұр жасанды интеллект қазақша сапалы әрі толық жауап беруі үшін оған кемінде 10 млн ақпарат керек. «Жасанды интеллектінің негізгі қорегі – мәліметтер қоры. Онсыз жүйе жұмыс жасамайды. Енді қазақша мәліметтер қорын қалай ұлғайтамыз? Жауап біреу. Қазақ қоғамы қазақша кон­тентті көбейтпей, орыс тіліндегі контентті тұтынуды жалғастыра берсе, ChatGPT қазақшаға шор­қақ болып қала береді», дейді Т.Бектұр.

Ал халықаралық «Қазақ тілі» қоға­мы­ның президенті Рауан Кен­жехан­ұлы бұл мәселені шешудің тиімді жолын ұсынады. Ол ғалам­дық плат­формаларды жүйелі лока­ли­­за­циялау керек­тігін айтады. Мәсе­лен, бір ғана «Google» корпорация­сы қорындағы ең маңыз­ды он мың мақаланы қазақша аудару – жасанды интел­лектінің тілдік қорын байытып, мазмұнын тереңдете түседі.

Мұны іс жүзінде қолдануды Назарбаев университетінің «Ақылды жүйелер және жасанды интеллект» институты бастап кетті. Олар нейрожеліге қазақша ақпараттарды көптеп жүктей отырып, қазақшаға жетік «Ұмай» көмекшісін жасап шығарды.

«Ұмай» – шынайы әйел бейнесі ретінде цифрлық жүйеде жасалған, қазақ тілінде сөйлейтін виртуалды көмекші. Оның мүмкіндігі бірнеше саланы қамтиды. Атап айтсақ, ғылым, тарих, технология, денсаулық сақтау сала-ларындағы сұрақтарға еркін жауап береді. ISSAI жетекшісі, Назарбаев универ­ситетінің Инженерлік және цифр­лық ғылымдар мектебінің профессоры Атакан Варолдың айтуынша, бұрын үлкен деректер жиын­тығының жеткіліксіз болуы қазақ тілін цифрлы әлемде шектейтін еді. Енді екі мыңнан астам адамның үш жүз сағаттық жазбасын жинау нәтижесінде қазақ сөзін автоматты түрде тану жобасы іске қосылды.

Бірақ бұл әлі де жеткіліксіз. Бар­­­лық саланың мамандары шағын ақпарт­тан бастап, реферат, мо­но­гра­фия, көркем шығар­маларын ғалам­тор жүйесіне қар­қынды түр­де «уики мақала» түрін­де енгізуі керек. Сонда мәліметтер қоры ұл­ғайып, қазақ тілінің жаңа техноло­гиядағы қолданыс аясы кеңи түспек.