Әліпби ауыстыруда маңызды мәселелердің бірі – әріптерді пернетақтада орналастыру. Адамның әріптерді пернетақтаның қай бұрышына орналастырса да, жаттанды түрде үйреніп алуы заңды. Алайда пернетақтада мәтін теруде әріптерді оңтайлы орналастыру адамның күш-қуатын және теруге кететін уақытты үнемдейді.
Сондықтан ұлттық әліпбидегі әріптерді пернетақтада тиімді орналастыруда лингвистикалық, әлеуметтік зерттеулер жүргізу қажет. Лингвистикалық зерттеулер жүргізу негізінен тіл білімінің қолданбалы бағытының зерттеу нысаны. Бұл ретте әріптерді пернетақтада орналастыруда қандай ұстанымдарға сүйенеміз деген мәселенің басын ашып алу қажет.
Әріптерді пернетақтада тиімді орналастыру мәселесіне қатысты А.Байтұрсынұлы атындағы Тіл білімі институты Қолданбалы лингвистика бөлімі қолданыстағы әріптердің кездесу жиілігін анықтады. Бұл жиілік талдау Білім және ғылым министрлігі тапсырысымен жарық көрген «Жалпы білім берудегі қазақ тілінің жиілік сөздігіне» негіз болған «Қазақ тілінің сөзформалар сөздігінің» мәтіні бойынша жасалды. Бұл сөздікте қазақ тілінің 5 стилінен 7 миллионнан астам сөзқолданыстан тұратын мәтіндер қамтылды. Төменде осы 7 миллионнан астам сөзқолданыстан алынған қазақ әріптерінің жиілік сөздігі берілді.
1-кесте. Қазақ тіліндегі әріптердің жиілікті-әліпбилік жиілік сөздігі
№
Әріп
Абсолюттіжиілігі
Бір топ әріптің мәтінді қамту пайызы
№
Әріп
Абсолютті жиілігі
Бір топ әріптің мәтінді қамту пайызы
1
2
3
4
1
2
3
4
1
А
8630862
12,796
22
г
903479
91,763
2
Е
5660025
21,187
23
ң
872812
93,057
3
Ы
5378832
29,161
24
и
866761
94,342
4
Н
4192570
35,377
25
ж
738252
95,437
5
І
4154893
41,537
26
ұ
673484
96,435
6
Т
4066134
47,565
27
ө
655787
97,408
7
Р
4028709
53,537
28
ү
598755
98,295
8
Л
3824239
59,207
29
ә
524073
99,072
9
Д
3413312
64,267
30
я
231433
99,415
10
С
2708334
68,283
31
х
105688
99,572
11
М
2040371
71,308
32
ц
81165
99,692
12
Қ
1876617
74,090
33
ф
58378
99,779
13
О
1639224
76,520
34
в
55978
99,862
14
К
1633360
78,941
35
э
30250
99,907
15
Ғ
1256146
80,804
36
ь
25076
99,944
16
Б
1229938
82,627
37
ю
20877
99,975
17
Й
1175543
84,370
38
һ
5406
99,983
18
У
1103283
86,006
39
ъ
5148
99,991
19
З
1095869
87,630
40
ч
3702
99,996
20
П
978676
89,081
41
щ
1679
99,998
21
Ш
905698
90,424
42
ё
1018
100
Ұлттық пернетақта жасауда жеке әріп жиілігі ғана емес, саусақпен оңай әрі тез басу үшін әріптердің тіркесімінің де жиілік сөздіктерін ескеру қажет. Яғни қай әріп қай әріппен жиі тіркесіп қолданылады деген мәселе маңызды. Осы проблеманы шешу үшін қазақ тілінің жоғарыда аталған 7 миллионнан астам сөзқолданыстан тұратын қазақ тілінің мәтіндерінен құрастырылған «Қазақ тілінің сөзформалар жиілік сөздігінен», осы сөздіктің статистикалық деректерін пайдалана отырып, қазақ әріптерінің екіәріптік тіркестерінің жиілік сөздігін құрастырдық.
2-кесте. Қазақ тілінің екіәріптік тіркестерінің жиілік сөздігінен үзінді:
Рет
саны
№
Әріп тіркесі
Абсолютті жиілік
Бір топ әріп тіркестерінің мәтінді қамту пайызы
Рет
саны
№
Әріп тіркесі
Абсолютті жиілік
Бір топ әріп тіркестерінің мәтінді қамту пайызы
1
2
3
4
1
2
3
4
1
ар
688045
2,035495
44
ма
229464
46,495744
2
ан
582201
3,757865
45
са
226934
47,167100
3
ал
565089
5,429610
46
ге
226772
47,837976
4
ын
562671
7,094202
47
ел
209952
48,459093
5
да
560939
8,753670
48
ек
208945
49,077231
6
та
511161
10,265877
49
ғы
207327
49,690582
7
ен
501533
11,749600
50
лд
198170
50,276843
8
ер
481450
13,173909
51
ыр
197109
50,859966
9
қа
460416
14,535993
52
ағ
196589
51,441550
10
де
458037
15,891038
53
рд
195039
52,018548
11
ін
451434
17,226550
54
ес
189725
52,579826
12
ла
422562
18,476647
55
іл
189148
53,139397
13
ды
417831
19,712748
56
тт
184683
53,685759
14
ты
404750
20,910150
57
бі
184178
54,230626
15
нд
399330
22,091518
58
ің
181594
54,767850
16
ға
396123
23,263399
59
лі
181226
55,303984
17
ке
371958
24,363790
60
гі
178293
55,831442
18
ай
369359
25,456493
61
ау
177800
56,357441
19
лы
342672
26,470245
62
қы
172081
56,866521
20
ті
333046
27,455520
63
ре
169334
57,367475
21
ді
331481
28,436166
64
ыс
168863
57,867035
22
ас
330440
29,413731
65
сі
168801
58,366412
23
сы
327308
30,382031
66
ып
166290
58,858360
24
ме
323281
31,338418
67
ні
163289
59,341430
25
ат
284740
32,180786
68
ам
161755
59,819962
26
ба
281240
33,012799
69
ік
154050
60,275700
27
ны
276945
33,832107
70
ым
147729
60,712738
28
ың
275833
34,648124
71
ім
147386
61,148761
29
ол
273816
35,458175
72
бо
146149
61,581124
30
те
273269
36,266607
73
қт
144973
62,010009
31
ет
272744
37,073486
74
ад
144878
62,438613
32
ры
263800
37,853906
75
бе
143874
62,864246
33
ық
261904
38,628716
76
шы
140779
63,280723
34
ра
257203
39,389619
77
се
137879
63,688621
35
на
250705
40,131299
78
ем
133338
64,083085
36
жа
248531
40,866547
79
із
131926
64,473371
37
ақ
243641
41,587328
80
кі
130520
64,859499
38
ыл
241848
42,302805
81
ег
128229
65,238848
39
ле
241186
43,016324
82
кө
127963
65,617411
40
не
239816
43,725790
83
ор
126556
65,991811
41
ст
239516
44,434368
84
ап
120653
66,348748
42
ір
237178
45,136030
85
мы
120124
66,704120
43
рі
230151
45,816903
86
ыз
119848
67,058675
Әріптерді пернетақтада орналастыруда әріп жиілігінен басқа, олардың қасындағы келесі әріппен тіркесуін де негізге алу пернетақта батырмасын басудың тиімділігі үшін қажет болғандықтан, олардың оң жақтарында жоғарыда үзінді келтірілген екіәріптік тіркестер жиілік сөздіктерінен алынған деректер мәліметіне сүйенген жөн болады.
Қазақ тілінің ұлттық компьютерлік пернетақтасында жиі кездесетін 19 әріп екі бөлікке бөлініп, пернетақтаның ортаңғы бөлігіне орналасады. Сол сияқты 2-кестедегі екіәріптік тіркестердің ең жиі қолданылатын тіркестердің екінші әріптерін жиі кездесетін әріптерге тіркесуге пернетақтаның жақын аралығына, яғни сол қол мен оң қол саусақтарына сәйкестендіріп орналастыру қажет.
Осы жиілік талдау (әріп және әріп тіркесінің жиілік сөздіктері) нәтижесі бойынша қазақ әріптері мен әріп тіркестерінің жиі кездесуі ескеріліп орналастырылған пернетақтаның пилоттық жобасы ұсынылды.
Пернетақтада әрбір әріптің кирилдегі және латындағы баламалары келтірілді. Пернетақтаның ортаңғы бөлігінде жиілік сөздіктегі ең жиі қолданған әріптер орын алды, ал олардың оң жақтарында екіәріптік тіркестер жиілік сөздігінен алынған әріптер орналастырылды.
Пернетақтаның шеткі жақтарына сирек кездескен әріптер орналастырылды. Пернетақтада көрініс таппаған дыбыстар: ш, ч мынадай әріп тіркестерінің sh/ш, ch/ч әрбіреуінің пернетақтада бар болуынан, олар орын алмады.
1-сурет. Статистикалық негіздегі пернетақта
Әріптерді пернетақтада орналастыруда оның бетіндегі батырмалар орналастырылған қатардың басуға, яғни мәтін теруге ыңғайлылығына қарай актив және пассив аймақтарға бөлінеді. Пернетақтаның әріп теруге ыңғайлы жері ортаңғы аймақ, әсіресе кертік тұрған жердің айналасы, асты мен үсті болып табылады. Ал шеткі батырмалар пассив аймаққа жатады. Актив және пассив аймақтарды пернетақтаның горизанталь (көлденең) және вертикаль (тіке) бөліктері бойынша да көрсетуге болады. Көлденең меже бойынша актив аймақ – ол екі кертік тұрған ортаңғы қатар, яғни қазіргі кирилдегі Ф әрпінен басталып, Э әрпіне аяталатын қатар. Одан кейінгі актив аймақ осы қатардың үстінде орналасқан үстіңгі қатар. Ал астыңғы қатар көбінесе сиректеу кездесетін әріптер орналасатын аймақ.
Батырмалардың тік бағыттағы (вертикалды) межесі кертік тұрған батырмалардың жаны, яғни ортаңғы, екінші қатардың жаны, ортаңғы тұсы. Сонымен қатар үстіңгі қатардағы кертпенің үстіңгі ортаңғы бөліктері. Одан кейінгісі кертпенің астыңғы ортаңғы бөліктері.
Ал осы үш қатардың шеткі бөліктері пассив аймақ болып есептеліп, сирек кездесетін әріптер не тыныс белгілер орналастырылады.
Осы әріптер орналастырылған пернетақта пилоттық жоба ретінде ұсынылып, пернетақтада теруге арналған арнайы компьютерлік бағдарлама жасалды. Жиілік талдау бойынша орналастырылған латын әріптері бірнеше пернетақта батырмасына жапсырылып, бұл пернетақта нұсқасының мәтін теруге ыңғайлы, тиімділігі уақыт сыйымдылығы мен қуат сыйымдылығына қарай сынақтан өткізілуде.
Сонымен егер жиілік ұстанымын негізге алатын болсақ, ең жиі қолданатын қазақ әріптері пернетақтаның ортаңғы жағында орналасуы қажет. Олар екі топқа бөлініп, бірінші, сол жақ қол саусақтарына және екінші, оң жақ қол саусақтарына деп ажыратылуы қажет. Сонымен бірге, екіәріптік тіркестердің статистикасы бойынша тіркестің екінші әрпі, тіркестің бірінші әрпінің оң жағына жақын орналасуы қажет деп білеміз.
Асқар ЖҰБАНОВ,
А.Байтұрсынұлы атындағы Тіл білімі институтының бас ғылыми
қызметкері, филология ғылымдарының докторы, профессор
Айман ЖАҢАБЕКОВА,
А.Байтұрсынұлы атындағы Тіл білімі институтының бас ғылыми
қызметкері, филология ғылымдарының докторы
Алматы қаласы