Назарбаев Университетінің ғалымдары қазақ тілін автоматты түрде тану технологиясын әзірледі.
Назарбаев Университетінің Ақылды жүйелер мен жасанды интеллект институты (ISSAI) қазақ сөзін автоматты түрде тану жобасын іске қосты. Оның көмегімен қазақ тілін жаһандық цифрлы әлемге белсенді енгізуге болады.
Жобаны жүзеге асыру үшін ғалымдар қазақ тіліндегі ең үлкен дауыстық деректер жиынтығын – 2 мыңнан астам адамның 300 сағаттық жазбасын жинады. Бұл зерттемені қолдану қазақ тілін виртуалды көмекшілер арқылы тану, түрлі бағдарламаларда және «ақылды үй» технологияларында қолдану секілді жаңа мүмкіндіктер туғызады.
Сонымен қатар бұл жоба Қазақстанда инклюзияның дамуына үлкен серпін береді. Жаңа технологияны ерекше қажеттіліктері бар адамдар кеңінен қолданатын дауыстық және мәтіндік бағдарламаларда пайдалануға болады.
«Бұрын үлкен деректер жиынтығының жеткілікті болмауы қазақ тілін цифрлы әлемде шектейтін. Сондықтан біз осы жобаны жүзеге асырдық. Енді экономика мен қоғамның дамуына пайдалы болсын деген ниетпен қазақ тіліндегі дауыстық деректер жиынтығын ашық бастапқы кодымен бірге барлық зерттеушілер және кәсіпкерлермен бөлісуге дайынбыз», деді ISSAI NU директоры, профессор Атакан Варол.
Жобаның іске қосылуы Назарбаев Университетінің Ақылды жүйелер мен жасанды интеллект институтының құрылғанына бір жыл толуына орайластырылды. Биыл 14 қыркүйекте ISSAI өзінің алғашқы туған күнін атап өтті.
Осы сілтеме арқылы issai.nu.edu.kz/kz-speech-corpus/ қазақ тіліндегі дауыстық деректер жиынтығына қол жеткізуге, сондай-ақ қазақ тілін автоматты түрде тану жүйесін тексеруге болады.