Қазақстан • 17 Наурыз, 2020

Қазақ әліпбиі: Пернетақтада орналастырудың статистикалық негіздері

840 рет
көрсетілді
6 мин
оқу үшін

Әліпби ауыстыруда маңызды мәселелердің бірі – әріптерді пернетақтада орналастыру. Адамның әріптерді пернетақтаның қай бұрышына орналастырса да, жаттанды түрде үйреніп алуы заңды. Алайда пернетақтада мәтін теруде әріптерді оңтайлы орналастыру адамның күш-қуатын және теруге кететін уақытты үнемдейді. 

Қазақ әліпбиі: Пернетақтада орналастырудың статистикалық негіздері

Сондықтан ұлттық әліпбидегі әріптерді пернетақтада тиімді орналастыруда лингвистикалық, әлеуметтік зерттеулер жүргізу қажет. Лингвистикалық зерттеулер жүргізу негізінен тіл білімінің қолданбалы бағытының зерттеу нысаны. Бұл ретте әріптерді пернетақтада орналастыруда қандай ұстанымдарға сүйенеміз деген мәселенің басын ашып алу қажет.

Әріптерді пернетақтада тиімді орналастыру мәселесіне қатысты А.Байтұрсынұлы атындағы Тіл білімі институты Қолданбалы лингвистика бөлімі қолданыстағы әріптердің кездесу жиілігін анықтады. Бұл жиілік талдау Білім және ғылым министрлігі тапсырысымен жарық көрген «Жалпы білім берудегі қазақ тілінің жиілік сөздігіне» негіз болған «Қазақ тілінің сөзформалар сөздігінің» мәтіні бойынша жасалды. Бұл сөздікте қазақ тілінің 5 стилінен 7 миллионнан астам сөзқолданыстан тұратын мәтіндер қамтылды. Төменде осы 7 миллионнан астам сөзқолданыстан алынған қазақ әріптерінің жиілік сөздігі берілді.

1-кесте. Қазақ тіліндегі әріптердің жиілікті-әліпбилік жиілік сөздігі

 

Әріп

Абсолюттіжиілігі

Бір топ әріптің мәтінді қамту пайызы

Әріп

Абсолютті жиілігі

Бір топ әріптің мәтінді қамту пайызы

1

2

3

4

1

2

3

4

1

А

8630862

12,796

22

г

903479

91,763

2

Е

5660025

21,187

23

ң

872812

93,057

3

Ы

5378832

29,161

24

и

866761

94,342

4

Н

4192570

35,377

25

ж

738252

95,437

5

І

4154893

41,537

26

ұ

673484

96,435

6

Т

4066134

47,565

27

ө

655787

97,408

7

Р

4028709

53,537

28

ү

598755

98,295

8

Л

3824239

59,207

29

ә

524073

99,072

9

Д

3413312

64,267

30

я

231433

99,415

10

С

2708334

68,283

31

х

105688

99,572

11

М

2040371

71,308

32

ц

81165

99,692

12

Қ

1876617

74,090

33

ф

58378

99,779

13

О

1639224

76,520

34

в

55978

99,862

14

К

1633360

78,941

35

э

30250

99,907

15

Ғ

1256146

80,804

36

ь

25076

99,944

16

Б

1229938

82,627

37

ю

20877

99,975

17

Й

1175543

84,370

38

һ

5406

99,983

18

У

1103283

86,006

39

ъ

5148

99,991

19

З

1095869

87,630

40

ч

3702

99,996

20

П

978676

89,081

41

щ

1679

99,998

21

Ш

905698

90,424

42

ё

1018

100

Ұлттық пернетақта жасауда жеке әріп жиілігі ғана емес, саусақпен оңай әрі тез басу үшін әріптердің тіркесімінің де жиілік сөздіктерін ескеру қажет. Яғни қай әріп қай әріппен жиі тіркесіп қолданылады деген мәселе маңызды. Осы проблеманы шешу үшін қазақ тілінің жоғарыда аталған 7 миллионнан астам сөзқолданыстан тұратын қазақ тілінің мәтіндерінен құрастырылған «Қазақ тілінің сөзформалар жиілік сөздігінен», осы сөздіктің статистикалық деректерін пайдалана отырып, қазақ әріптерінің екіәріптік тіркестерінің жиілік сөздігін құрастырдық.

 2-кесте. Қазақ тілінің екіәріптік тіркестерінің жиілік сөздігінен үзінді:

 

Рет

саны

Әріп тіркесі

Абсолютті жиілік

Бір топ әріп тіркестерінің мәтінді қамту пайызы

 

 

Рет

саны

Әріп тіркесі

Абсолютті жиілік

Бір топ әріп тіркестерінің мәтінді қамту пайызы

 

 1

2

3

4

 

 1

2

3

4

1

ар

688045

2,035495

 

44

ма

229464

46,495744

2

ан

582201

3,757865

 

45

са

226934

47,167100

3

ал

565089

5,429610

 

46

ге

226772

47,837976

4

ын

562671

7,094202

 

47

ел

209952

48,459093

5

да

560939

8,753670

 

48

ек

208945

49,077231

6

та

511161

10,265877

 

49

ғы

207327

49,690582

7

ен

501533

11,749600

 

50

лд

198170

50,276843

8

ер

481450

13,173909

 

51

ыр

197109

50,859966

9

қа

460416

14,535993

 

52

ағ

196589

51,441550

10

де

458037

15,891038

 

53

рд

195039

52,018548

11

ін

451434

17,226550

 

54

ес

189725

52,579826

12

ла

422562

18,476647

 

55

іл

189148

53,139397

13

ды

417831

19,712748

 

56

тт

184683

53,685759

14

ты

404750

20,910150

 

57

бі

184178

54,230626

15

нд

399330

22,091518

 

58

ің

181594

54,767850

16

ға

396123

23,263399

 

59

лі

181226

55,303984

17

ке

371958

24,363790

 

60

гі

178293

55,831442

18

ай

369359

25,456493

 

61

ау

177800

56,357441

19

лы

342672

26,470245

 

62

қы

172081

56,866521

20

ті

333046

27,455520

 

63

ре

169334

57,367475

21

ді

331481

28,436166

 

64

ыс

168863

57,867035

22

ас

330440

29,413731

 

65

сі

168801

58,366412

23

сы

327308

30,382031

 

66

ып

166290

58,858360

24

ме

323281

31,338418

 

67

ні

163289

59,341430

25

ат

284740

32,180786

 

68

ам

161755

59,819962

26

ба

281240

33,012799

 

69

ік

154050

60,275700

27

ны

276945

33,832107

 

70

ым

147729

60,712738

28

ың

275833

34,648124

 

71

ім

147386

61,148761

29

ол

273816

35,458175

 

72

бо

146149

61,581124

30

те

273269

36,266607

 

73

қт

144973

62,010009

31

ет

272744

37,073486

 

74

ад

144878

62,438613

32

ры

263800

37,853906

 

75

бе

143874

62,864246

33

ық

261904

38,628716

 

76

шы

140779

63,280723

34

ра

257203

39,389619

 

77

се

137879

63,688621

35

на

250705

40,131299

 

78

ем

133338

64,083085

36

жа

248531

40,866547

 

79

із

131926

64,473371

37

ақ

243641

41,587328

 

80

кі

130520

64,859499

38

ыл

241848

42,302805

 

81

ег

128229

65,238848

39

ле

241186

43,016324

 

82

кө

127963

65,617411

40

не

239816

43,725790

 

83

ор

126556

65,991811

41

ст

239516

44,434368

 

84

ап

120653

66,348748

42

ір

237178

45,136030

 

85

мы

120124

66,704120

43

рі

230151

45,816903

 

86

ыз

119848

67,058675

Әріптерді пернетақтада орналастыруда әріп жиілігінен басқа, олардың қасындағы келесі әріппен тіркесуін де негізге алу пернетақта батырмасын басудың тиімділігі үшін қажет болғандықтан, олардың оң жақтарында жоғарыда үзінді келтірілген екіәріптік тіркестер жиілік сөздіктерінен алынған деректер мәліметіне сүйенген жөн болады.

Қазақ тілінің ұлттық компьютерлік пернетақтасында жиі кездесетін 19 әріп екі бөлікке бөлініп, пернетақтаның ортаңғы бөлігіне орналасады. Сол сияқты 2-кестедегі екіәріптік тіркестердің ең жиі қолданылатын тіркестердің екінші әріптерін жиі кездесетін әріптерге тіркесуге пернетақтаның жақын аралығына, яғни сол қол мен оң қол саусақтарына сәйкестендіріп орналастыру қажет.

Осы жиілік талдау (әріп және әріп тіркесінің жиілік сөздіктері) нәтижесі бойынша қазақ әріптері мен әріп тіркестерінің жиі кездесуі ескеріліп орналастырылған пернетақтаның пилоттық жобасы ұсынылды.

Пернетақтада әрбір әріптің кирилдегі және латындағы баламалары келтірілді. Пернетақтаның ортаңғы бөлігінде жиілік сөздіктегі ең жиі қолданған әріптер орын алды, ал олардың оң жақтарында екіәріптік тіркестер жиілік сөздігінен алынған әріптер орналастырылды.

Пернетақтаның шеткі жақтарына сирек кездескен әріптер орналастырылды. Пернетақтада көрініс таппаған дыбыстар: ш, ч мынадай әріп тіркестерінің sh/ш, ch/ч әрбіреуінің пернетақтада бар болуынан, олар орын алмады.

1-сурет. Статистикалық негіздегі пернетақта

Әріптерді пернетақтада орналастыруда оның бетіндегі батырмалар орналастырылған қатардың басуға, яғни мәтін теруге ыңғайлылығына қарай актив және пассив аймақтарға бөлінеді. Пернетақтаның әріп теруге ыңғайлы жері ортаңғы аймақ, әсіресе кертік тұрған жердің айналасы, асты мен үсті болып табылады. Ал шеткі батырмалар пассив аймаққа жатады. Актив және пассив аймақтарды пернетақтаның горизанталь (көлденең) және вертикаль (тіке) бөліктері бойынша да көрсетуге болады. Көлденең меже бойынша актив аймақ – ол екі кертік тұрған ортаңғы қатар, яғни қазіргі кирилдегі Ф әрпінен басталып, Э әрпіне аяталатын қатар. Одан кейінгі актив аймақ осы қатардың үстінде орналасқан үстіңгі қатар. Ал астыңғы қатар көбінесе сиректеу кездесетін әріптер орналасатын аймақ.

Батырмалардың тік бағыттағы (вертикалды) межесі кертік тұрған батырмалардың жаны, яғни ортаңғы, екінші қатардың жаны, ортаңғы тұсы. Сонымен қатар үстіңгі қатардағы кертпенің үстіңгі ортаңғы бөліктері. Одан кейінгісі кертпенің астыңғы ортаңғы бөліктері.

Ал осы үш қатардың шеткі бөліктері пассив аймақ болып есептеліп, сирек кездесетін әріптер не тыныс белгілер орналастырылады.

Осы әріптер орналастырылған пернетақта пилоттық жоба ретінде ұсынылып, пернетақтада теруге арналған арнайы компьютерлік бағдарлама жасалды. Жиілік талдау бойынша орналастырылған латын әріптері бірнеше пернетақта батырмасына жапсырылып, бұл пернетақта нұсқасының мәтін теруге ыңғайлы, тиімділігі уақыт сыйымдылығы мен қуат сыйымдылығына қарай сынақтан өткізілуде.

Сонымен егер жиілік ұстанымын негізге алатын болсақ, ең жиі қолданатын қазақ әріптері пернетақтаның ортаңғы жағында орналасуы қажет. Олар екі топқа бөлініп, бірінші, сол жақ қол саусақтарына және екінші, оң жақ қол саусақтарына деп ажыратылуы қажет. Сонымен бірге, екіәріптік тіркестердің статистикасы бойынша тіркестің екінші әрпі, тіркестің бірінші әрпінің оң жағына жақын орналасуы қажет деп білеміз.

 

Асқар ЖҰБАНОВ,

А.Байтұрсынұлы атындағы Тіл білімі институтының бас ғылыми

қызметкері, филология ғылымдарының докторы, профессор

Айман ЖАҢАБЕКОВА,

А.Байтұрсынұлы атындағы Тіл білімі институтының бас ғылыми

қызметкері, филология ғылымдарының докторы

Алматы қаласы