Қазақстан • 23 Қазан, 2020

Назарбаев университетінің ғалымдары ана тілімізді цифрландырды

290 рет
көрсетілді
2 мин
оқу үшін

Назарбаев Университетінің ғалымдары 2000 адамның даусын жазып, оларды өңдеп, ана тілін автомат түрде тануға мүмкіндік алу үшін қазақ тіліндегі аудио деректердің ірі базасын жинады, - деп хабарлайды Egemen.kz 

Назарбаев университетінің ғалымдары ана тілімізді цифрландырды

Бұл дауыс көмекшілеріне мемлекеттік тілімізді түсінуді үйретіп қана қоймай, қазақ тіліне басқа да жаңа технологияларды енгізуге мүмкіндік береді.

Қазақ тілін дамыту үшін өз даусын жазуға келгендер бүкіл Қазақстан бойынша әлеуметтік желілер, блогерлер және медиа арқылы жиналды. Осының арқасында НУ Ақылды жүйелер және жасанды интеллект институтының (ISSAI) ғалымдары екі мың адамды жаза алды. Олар бірге қазақ тілінде 300 сағат 154 мың сөйлем айтқан.

Назарбаев Университетінің ғалымдары алынған ауқымды дауыс деректерінің базасында алғаш рет қазақ тілінің корпусын құрды, яғни жасанды интеллектіні тілді тануға, мағыналық байланыстарын, сөздердің айтылу ерекшеліктерін және әртүрлі мағынасын түсінуге үйретті. Технологияны мына жерден тексеруге болады. Сілтеме арқылы да дерекқорға кіре аласыз.

Қазақ тілін тану жүйесі Siri, Alexa, Алиса және Cortana сияқты виртуал көмекшілерді жасайтын адамдарға қызық болуы мүмкін, бұл әртүрлі ақылды үй технологиялары мен автомобильдерде қазақ тіліндегі командаларды түсінуге мүмкіндік береді.

Бұл технологияны қолдану аясы шексіз, себебі ғалымдар өз қосымшаларында қазақ тілін енгізгісі келетіндердің барлығына жаңалығын тегін бөліседі. Айтпақшы, әдетте мұндай жобаларды ірі компаниялар жүзеге асырады, ал кейін өз қызметін коммерцияландырады.

Алайда Назарбаев Университеті ғалымдарының арқасында бұл базаны KaspiBank, Beeline, BTS Digital, Yandex және Silero Speech сөзді тану жүйесі, сондай-ақ бірнеше университет, соның ішінде АҚШ-тағы Суортмор жеке гуманитарлық колледжі, Қазақстан-Британ техникалық университеті, Алматы энергетика және байланыс университеті, Алматыдағы Сәтпаев атындағы техникалық университет тегін алды. 

Айта кетейік, 2018 жылы Yandex "Алисаны" қазақ тіліне үйретуді жоспарлап отырғанын хабарлаған болатын, бірақ компания әзірге өзінің дауыстық көмекшісінің жаңарған нұсқасын ұсынған жоқ. Мүмкін ғалымдардың жұмысы бұл процесті жылдамдататын шығар.