Біздің тәжірибе неге қызық болуы мүмкін? Себебі технологиялық жарағымыз шамалас. Яғни қазақстандық шешімдер Батыстағы секілді қымбат жабдықтар, білік талап етпейді. Бұл өнімдерге қоса, әлемдегі компанияларға қашықтан қызмет көрсетіп жүрген отандық софт-девелоперлер, ақпарат өңдеушілер баршылық. Осылардың бәріне қолдау көрсетілсе, ең болмаса кедергі келтірмесе, экспорт көлемі 1 млрд долларға екі жылда оңай жетеді.
Жасанды интеллект – күрделі тақырып. Жалпы алғанда, әлемдік, айталық, ағылшын тілді сервистерді дамытуға кірісіп, қандай да бір өнім шығара аламыз. Солай болып жатыр да. Еліміздегі мамандардың интеллекуталды әлеуеті оған әбден жетеді. Ал енді жасанды интеллект пен қазақ тілі мәселесі – бас ауыртатын тақырып. Себеп мынада. Талай жыл бойы софтты қазақшаға немесе Қазақстандағы тілдік ортаға оңай көшіріп алып жүрдік. Мысалы, сайт генераторындағы «home» деген элементті файлда «басты бет» деп өзгертеміз.
Ал жасанды интеллект олай экстраполиция жасай салатын нәрсе емес. Әр тілге – өзінің парадигмалық кестелері, сөздік қорлары керек. Ағылшын тіліндегі дайын модельдің ішіндегі сөздерді аударып құтыла алмайсың. Осы орайда қазақ тілінің таксономиясы, сөздердің мәндік жіктелуі секілді компьютер лингвистикасына қажет еңбектердің мардымсыз немесе мүлдем жоғын байқаймыз. Оның үстіне, өзім «рузақ тілі» деп атап кеткен, «звондау», «выяснять ету» деген секілді сөздерді араластырып айтатын шалақазақ тілімен өнім дайындап жатқандар баршылық. Бұл жерде кінә ме, жоқ па, әйтеуір жауапкершілік – қоғамда. Ал Үкімет дәл осы тұрғанда ғылыми негіздемені қолға алып, ол еңбектерді IT қауымдастыққа тегін таратып беруі керек. Әйтпесе, баланың тілі шығуына IoT жабдықтар, мысалы, сөйлейтін шәйнектер немесе сырлас болатын ойыншықтар әсер етіп, қазақ тілі пиджинизацияға ұшырайды. Ендеше, қазақ тілінің компьютер лингвистикасына қажет қорларын түзіп, тегін таратып беру – кезек күттірмейтін іс.
Ерлан ОСПАН,
IT маманы