Мамандардың айтуынша, бұрын зерттеу жұмысын жасау үшін ғалымдарға 20-30 жыл уақыт кеткен болса, бүгінде түрлі IT технологиялар арқылы қажет деректерді 3-4 айда жинауға болады. Кез келген саланың жұмысын жеңілдету үшін бүгінде үлкен деректерді өңдеу технологиясының мүмкіндігі мол. Big Data туралы жұрт жиі естіп, интернеттен оқып жүрсе де, өз маманы болмаған соң, оның қаншалықты қауқарлы екенін түсіну қиын. Аталған технологияның маңызы мен мүмкіндіктері жайында білу үшін Big Data and Analytics қауымдастығының президенті, Marketo компаниясының бас директоры Сергей АХМЕТОВПЕН әңгімелескен едік.
– Big Data не үшін қажет? Оның мүмкіндіктерін қарапайым тілмен түсіндіріп берсеңіз.
– Қазір Big Data термині көп айтылып жүр. Ғаламторда да бұл жайында ақпарат көп. Алайда мамандар болмаса, өзге адам үшін оны түсіну қиын. Көп жағдайда адамдар Big Data-ны деректер базасымен шатастырады. Асылында, бұл кез келген ауқымды мәліметті жылдам өңдеу технологиясы. Қазір оның енгізілмеген саласы жоқтың қасы. Мәселен компаниялар бүгінде Big Data қызметін тұтынушылармен өзара қарым-қатынасты нығайту, түрлі операцияларды жеңілдету және алаяқтықтың алдын алу үшін пайдаланады. Сондай-ақ оны қарапайым күнделікті өмірден де кездестіруге болады. Мысалы, Нұр-Сұлтан қаласында әртүрлі нысанда орнатылған 48 мың бейнекамера бар. Ол жеке үйлердің алдында, сауда орталықтарында және тағы да басқа жерлерде болуы мүмкін. Сол бейнекамералар күніне көлемі 400-500 гигабайт болатын видео түсіреді. Осынша көп ақпарат пайдаға жарамаса, деректер базасына айналады. Енді осы ақпаратты Big Data деп атау үшін сол камераға адамды идентификациялау керек. Егер де бейнекамера үйге кірген әр адамды танып тұрса, мұны Big Data деп атауға болады. Демек, қарапайым тілмен түсіндіргенде Big Data дегеніміз, қолымызда бар ақпараттан жаңа бір мәлімет алу. Сондай-ақ сол мәлімет арқылы белгілі бір қорытынды шығара отырып, болашаққа болжам жасау.
– Естуімізше, Big Data-мен көбінесе жекелеген компаниялар жұмыс істейді. Оған не себеп?
– Қазақстанда халық саны аса көп болмағандықтан, бізге Үкіметпен жұмыс істеу тиімді болар еді. Алайда әзірге оған толық қол жеткізе алмай отырмыз. Мемлекетпен толыққанды жұмыс істеу үшін бірнеше кедергі бар. Түсінікті болуы үшін Big Data-ның екі бағыты барын айта кетейін. Оның біріншісі – data engineering, ал екіншісі – data science деп аталады. Data engineering көп ақпаратпен жұмыс істеу үшін белгілі бір архитектура құрады. Дәл осы сәтте бізге жұмыс істеу қиын. Себебі Қазақстандағы біраз жүйе біздікі емес, көбін шетелдік компаниялар құрастырған. Egov-ты өзіміздікілер жасап шықты деп айтады, бірақ оның өзі күмәнді. Үлкен нәтижеге жету үшін бәрінің біріккені дұрыс. Ал бізде әртүрлі жүйе болған соң бәрі интеграцияланбай тұр. Нақты нәтиже көрінбей тұрғаны да осыдан. Бізде, құқық қорғау органдары бір жүйеде істесе, Денсаулық сақтау министрлігі өзге жүйеде жұмыс істейді. Сондықтан мұның бәрінен көп ақпаратты алу мүмкін болмай тұр. Ал деректерді ала алмау – Big Data-ға үлкен кедергі. Ең әуелі бұл мәселені шешу үшін бүкіл министрліктің дерегі бір жүйеге жинақталуы керек. Әлемдік стандартта бәрібір жүйенің айналасына құрылады. Бізде керісінше, әр министрлік өзінше жүйе құрып, әрқайсысының жұмысы бөлек жүріп жатыр. Егер де мемлекет Big Data-мен жұмыс істейміз деп шешсе, біз сияқты IT компанияларға мәліметті ешқандай шектеусіз беруі керек. Өкінішке қарай, бізде әр мәлімет әртүрлі сақталады. Кей дерек енбей қалып жатады. Негізі мұның бәрі автоматты түрде орындалуы керек. Жүйе дұрыс болмағандықтан, бізге жұмыс істеу қиын. Сол себепті де аталған қызмет түрі қымбатқа шығады. Қымбат болуы себепті де бұл технологиямен жұмыс істеуге көбі келісе бермейді.
Десе де қазір елімізде Big Data бизнес саласында, жекелеген компанияларда, банктерде, сондай-ақ прокуратурада, «Қазпоштада» және тағы да басқа орындарда қолданылып жатыр. Бұл арқылы аталған салаларда тұтынушылармен өзара қарым-қатынас нығайып, түрлі операциялар мен қызметкерлердің жұмысы жеңілдеуде. Қазір көп қызметті тұтынушылар өз ЖСН-і арқылы онлайн режімде жылдам ала алады. Бұрын кезекке тұрып алатын несиені де қазір адамдар өзінің ұялы телефонындағы мобильді қосымша арқылы ала береді. Мәселен, Kaspi bank-тің мобильді қосымшасында өтінім берушіге 5 минуттай күте тұруын өтініп, деректер базасында ол туралы мәліметтер қарастырылып жатқанын айтады. Яғни, нейронды жүйе деректер базасынан мәліметтерді қарастырып, белгілі бір шешім қабылдайды. Осылайша тұтынушының да, қызметкердің де уақыты үнемделіп, жұмыс жеңілдей түседі.
– Бізде Big Data-мен жұмыс істейтін білікті мамандар жеткілікті ме?
– Бізде сауатты IT мамандар көп. Бірақ көбі шетелге кетіп жатыр. Себебі біздің нарық олармен жұмыс істеуге әлі толық дайын емес. Кейбір көршілес елдермен салыстырғанда біздің ел едәуір алда келе жатқанын ескерсек те, әлі де дамуды қажет етеді. Шетелге кеткен қыз-жігіттер біраз тәжірибе жинақтап, елге келгенде мемлекеттік нарық оған дайын болады деп ойлаймын.
– Үлкен деректермен жұмыс істейтін мамандарды даярлауда неге мән берген жөн?
– Big Data – IT саласындағы ең қиын, ең қымбат нәрсе – технология. Онымен жұмыс істеу үшін міндетті түрде ағылшын тілін жетік меңгеруі тиіс. Сондай-ақ жоғары математиканы жақсы білуі керек. Қалған дүниені жоғары оқу орнынан немесе түрлі курстардан үйренуге болады.
– Әлемдік тәжірибеде Big Data-ның көрінісі қандай? Үлкен деректермен жұмыс істеуде үздік елдерді атасаңыз.
– Үлкен деректермен жұмыс істеп, мол табысқа кенеліп жатқан ел ретінде бірінші кезекте АҚШ-ты айтуға болады. Олар сан түрлі салада деректер базасын өңдеуде шебер. Мәселен, елдің бәріне таңсық емес Google іздеу жүйесін алайық. Оны қолданбайтын ел жоқтың қасы. Кез келген жағдайда адамдар қандай да бір сұрақтың жауабын немесе іздеген мәліметін осы жерден табады. Google – үлкен деректер базасы. АҚШ бұл іздеу жүйесі арқылы көптеген елдер туралы мәлімет алады. Барлық жағдайларды өз назарында ұстайды. Өзге елдер жайында мәлімет ала отырып, болашаққа бағдар жасай алады. Халықтардың тұрмыс-салтын, алаңдатар мәселесін, психологиясын, ойлау қабілетін оңай бақылап отыр.
Ал Қытай – жабық мемлекет. Олар ақпараттық қауіпсіздікті маңызды санайды. Сол себепті де олардың жеке іздеу жүйелері мен мессенджерлері бар. Сол сияқты Ресей де бұл ретте қалыс қалмайды. Олар өздерінің Яндекс деп аталатын іздеу жүйелерін, Rutube атты видеолар желісін, «Одноклассники» сынды әлеуметтік желісін қолданады. «Ауқымды деректер – жаңа байлық» деген сөз тегін айтылмаса керек. Бұрын адамдар алтын мен мұнайды қазына-байлық деп тапса, қазіргі заманда ауқымды ақпараттың маңызы басым. Сол себепті мамандар жаңа мәлімет алудың түрлі әдісін қарастырады. Немістер, мәселен, қарапайым smart шәйнек арқылы да ақпарат алады. Wi-Fi-мен жұмыс істейтін шәйнектер судың құрамын анықтай алады. Сондай-ақ үйдегі адамдар ұйқыдан тұрғанда немесе жұмысқа кетіп бара жатқанда өздігінен қосылып жұмыс істей береді. Немістер бұл шәйнектер арқылы көп мәлімет алып, ол деректерді сату арқылы шәйнек сатқан бағадан да көп ақша өндірген. Сол себепті қазір әлемдік нарықта Big Data-мен жұмыс істейтін мамандарға сұраныс көп. IT саласындағы ең көп табыс табатындар да осы саланың мамандары.
– Қазір кімдермен жұмыс істеп жатырсыздар?
– Осы салада қызмет етіп келе жатқанымызға 10 жылдан асып қалды. Біз Big Data-ны Қазақстанда ғана емес, жалпы ТМД бойынша бастаған бірнеше компанияның біріміз. Қазір көбіне шетелдік компаниялармен жұмыс істейміз. Олардың ішінде АҚШ, Швейцария, Қытай сынды алып мемлекеттер бар. Мысалы, қазір Американың 3 мектебімен жұмыс жүргізіліп жатыр. Бұл жоба бойынша мектептің кіреберісіне 3D бейнекамералары қойылады. Олар кірген балаларды түсіру арқылы балалардың көңіл күйін, эмоциясы мен психологиялық жай-күйі туралы мәліметтер береді. Бұл – мектептегі балалардың тыныштығын сақтап, олардың мінез-құлықтарын бақылауға көмектесетін бірден-бір жоба.
Marketo компаниясында көптеген талантты маман бар. Мәселен, «Вконтакте» желісінің техникалық директоры бізде жұмыс істейтінін мақтанышпен айтуға болады. Жалпы, компанияда 60 шақты қызметкер үлкен деректермен жұмыс істеуде. Big Data-да штаттың көптігі емес, санаулы сауатты маманның болғаны маңызды.
Әңгімелескен
Маржан ТІЛЕУБЕК,
«Egemen Qazaqstan»