Mazir
23 июн 12:47korilim:51 508 Madeniet

Терминологиялық база: тәжірибе және технология


Бүгін Нұр-Сұлтан қаласында Қазақстан Республикасы Білім және ғылым министрлігінің Тіл саясаты комитеті     Ш. Шаяхметов атындағы «Тіл-Қазына» ұлттық ғылыми-практикалық орталығымен бірлесе өткізген, «Терминологиялық база: тәжірибе және технология» атты республикалық әдістемелік семинарда Digital Library басқару жүйесі негізінде терминологиялық база құрастыру тәжірибесі жөнінде Аударма ісі мамандығының докторанты Айнұр Баекеева ой бөлісті..
         
Термиология мәселелерімен кімдердің айналысқаны абзал деген сұрақ көпті мазалап жүр? Сіздің көзқарасыңызды білсек?

 Отандық тіл білімінде терминология мәселелерімен тек терминологтар ғана айналысу қажет деген дәстүрлі пікір қалыптасып келгені рас. Алайда тек қана тіл мамандары ғана емес, әр түрлі пән салалары мамандары, аудармашылар, мемлекеттік қызметкерлер, т.б. мамандар да өз қызметтерінде күн сайын өз пән саласына қатысты терминдермен жұмыс жасауларына тура келеді.

Біраздан бері барлық ғалымдарды, пән салаларындағы тәжірибеші мамандарды толғандырып келе жатқан мәселелердің бірі – осы пән салалары терминдерін жүйелеу, оларды қазіргі таңдағы ақпараттық технологиялар жетістіктерін тиімді пайдалана отырып халықаралық стандарттарға сәйкес жасалған автоматтандырылған веб‑платформаларға енгізу болып табылатыны сөзсіз. 
Осы орайда, қазақ тілінің терминдер корпусын біріздендіріп жүйелеу мақсатында бастаған жобамыздың тәжірибесімен бөлісуді жөн көрдік.
РҒА Сібір бөлімі, Новосібір мемлекеттік университетінің Есептеу технологиялары институты (Федотов А.М.) мен Л.Н. Гумилев атындағы ЕҰУ, Ақпараттық технологиялар кафедрасы (Тусупов Ж.А., Самбетбаева М.А.) бірігіп жасаған электрондық тезаурус жобасына, Л.Н. Гумилев атындағы ЕҰУ, Аударма теориясы мен практикасы кафедрасында (Тажибаева С.Ж., Баекеева А.Т.) тау‑кен терминдерінің көптілді басқарылмалы тезаурусын құрастыру 2018 жылы жобасын бастадық.

Digital Library басқару жүйесі негізіндегі тезаурус құрастыру қалай жүргізіледі?
Бұл Новосібір мемлекеттік университеті мен Л.Н. Гумилев атындағы Еуразия ұлттық униерситетінің біріккен жобасы аясындағы үлкен жұмыстың бас әзірлеушісі физико‑математика ғылымдарының докторы, профессор А.М. Федотов,  Ж.А. Тусупов және осы кісілерден тәлім алған шәкірті Ақпараттық технология мамандығының PhD докторы М.А. Самбетбаева.

Осы тезаурус ISO 25964-1:2011 (бірінші бөлім) және ISO 25964-1:2013 (екінші бөлім) соңғы халықаралық стандарттары негізінде құрастырылды [1, 2]. Аталған стандарттар негізінде құрастырылған тезаурус басқа да халықаралық тезаурустармен өзара әрекеттесі мүмкіндігін береді, яғни бұл дегеніміз, машиналық немесе автоматтандырылған аударманы арнайы пән саласы үшін орындау кезінде осы тезаурусқа енгізілген қазақ, ағылшын, орыс тілдеріндегі контент арқылы аудамаға арналған компьютерлік жасақтамалар тезаурус мазмұнын көре алып, релевантты ақпаратты іздеу процесіне қатыса алады.       

Мұндай халықаралық стандарттарға сай жасалған тезаурустарға мыналарды жатқызамыз: AGROVOC тезаурусы, AGCOM тезаурусы, EuroVOC тезаурусы, SNOMED тезаурусы, WordNet тезаурусы, ЮНЕСКО тезаурусы [3-8]. 

Сонымен, біздің ұсынып отырған тезаурусымыз белгілі бір пән саласына арналған сөздіктердің толық базасы болып табылады [9]. 
         Тезаурус өз ішіне терминдердің түрлері, байланыстары, топтарымен қоса, түрлі сөздіктерді енгізе алады: 
  • анықтамалық сөздік, 
  • көптілді сөздік, 
  • синонимдер сөздігі, 
  • антонимдер сөздігі, 
  • омонимдер сөздігі, 
  • түсіндірме сөздік, т.т. 

Тезауруста терминдер семантикалық және функционалдық жағынан нақты анықталып, олардың лингвистикалық баламалары бекітіліп, иерархиялық түрде жіктеліп, беріледі. 

Әдетте тілдік корпустар бірнеше ондаған жылдар бойы жинақталған түбегейлі еңбекті талап ететін жоба. Өкінішке орай Қазақстанда бір ғана «Қазақ тілінің Алматы корпусы» қызмет етеді [10]. Қазақ тілінің Алматы корпусының тек қана көркем әдебиет пен периодикалық және публицистикалық шығармалар негізінде жасалғандығында. Аталған корпуста пән салаларының терминдері қарастырылмаған. Бұл термин саласындағы тілші, аудармашы мамандардың алдына үлкен мақсат пен міндеттерді артады. Сондықтан терминологияны пәнаралық бағытта, компьютерлік лингвистика, пән салалары, салалық терминология мен салалық аударма тоғысында зерттеп, осы салаларда ғасырлар бойы атқарылып келген ақпараттарды жүйелеп, біріздендіріп, электрондық басқарылмалы платформаларға жүктеу жұмыстарын атқару қажет екендігін білдіреді.

Бұл тезаурус жүйеленген терминдер арасындағы семантикалық байланыстар мен сөздік мақалаларды көрсете алады. Бұл дегеніміз, аталған тезаурусты қажетінше сөздік мақалалармен, мысалдармен, мәтіндермен толықтыру арқылы қазақ тілінің ғылыми тіл ретіндегі корпусын құрастырудың алғышарттарын да жасауға болады.

Бұл тезаурусымызға енгізетін терминдерге Терминком бекіткен «Кен ісі және металлургия» саласының терминологиялық базасы арқау болды [11].

Digital Library басқару жүйесі негізінде құрастырылған көптілді терминологиялық базаның бетін мына суреттен көре аласыздар (сурет 1).
Сурет 1 – Digital Library басқару жүйесі негізінде құрастырылған көптілді терминологиялық базаның беті
Аталған тезауруста салалық терминдердің сипаттамасы (description), лингвистикалық эквиваленттері (LE – linguistic equivalents), синонимдері (абсолюттік синонимдері), антонимдері (бар болған жағдайда), ассоциативтік терминдері, терминдердің бір бірімен иерархиялық байланысы, яғни терминдердің жоғарғы (broader term) және төменгі (narrower term) ұғымдары беріледі. Терминдердің жоғарғы және төменгі ұғымдарын келесі суреттен көре аласыздар (сурет 2).

Сурет 2 – Тау-кен терминдерінің тезаурусындағы жоғарғы және төменгі ұғымдар
 М.А. Сәмбетбаеваның жетекшілігімен ҚР БҒМ Ақпараттық және есептеуіш технологиялар институтында осы біріккен жоба аясында Қазақстандық интероперабельді платформа әзірленді (сурет 3). 

Сурет 3 – Тау-кен терминдерінің тезаурусындағы жоғарғы және төменгі ұғымдар
Аталған жоба аясында Л.Н. Гумилев атындағы Еуразия ұлттық университеті, Аударма теориясы мен практикасы кафедрасының «Аударма ісі» мамандығында оқитын докторанттар мен магистранттармен бірігіп әр пән саласын қамтитын тезаурустар құрастыру жұмысын бастадық. 

Мамандар негізінен аудармашы болғандықтан, салалық терминдер тезаурусын үш тілде (қазақ, ағылшын, орыс) әзірлеуде, алайда бұл тезаурусқа француз, неміс және басқа да тілдерді енгізу мүмкіндігі бар. Сонымен, осы тезаурусты жасауда әр салаларда аудармашылық тәжірибесі бар мамандар іріктеліп алынды:

         Тау‑кен терминдері – Баекеева Айнур (қазақ, ағылшын, орыс)
         Салық терминдері – Бакраев Акбар (қазақ, ағылшын, орыс)
         Зергерлік бұйымдар атаулары – Кожахметова Гульсара (қазақ, ағылшын, орыс)
         Құрылыс терминдері – Темирова Зухра (қазақ, ағылшын, орыс)
         Дипломатия терминдері – Байгужин Берік (қазақ, ағылшын, орыс, араб)

Көптілді салалық терминологиялық базаны басқарылмалы тезаурусқа енгізудің қадамдық алгоритмін әзірледік. Тау-кен терминдерінің терминологиялық базасының негізінде иерархиялық алгоритм тілші, аудармашы мамандарға бейімделіп жасалды. Бұл алгоритм басқа да ғылыми пән салалары терминдерінің тезаурусын құрастырудың үлгісі болып табылады. 

Мұндай көптілді терминологиялық базаға сала терминдерін енгізу жұмысы сала терминдерін жақсы түсінетін, бірнеше тіл арасында аударма жасап жүрген тәжірибеші салалық аудармашылар мен тіл мамандарына өте қажетті. Себебі мұндай ғылым мен техниканың пән саласындағы тезаурусты толтыруға құзыретті маман болуы шарт. Осы орайда біз аталған қадамдық алгоритмді Л.Н. Гумилев атындағы Еуразия ұлттық универеситеті Аударма теорисы мен практикасы кафедрасының докторанттары мен магистранттарына, ұлттық және трансұлттық компаниялардағы тәжірибеші аудармашыларға, мемлекеттік органдардағы тіл мамандарына ұсындық (кесте 1). Мамандардың аударма ісіндегі еңбек өтілі мен іс‑тәжірибесі 10 жылдан жоғары.

Кесте 1 – Тезаурус толтырудың қадамдық алгоритміне баға берген салалық аудармашылар

Аудармашының жұмыс тілдеріЛауазымыСаны
Қазақ, орыс, ағылшынАудармашы, докторант8
Қазақ, орыс, ағылшынАудармашы, магистрант17
Қазақ, орыс, ағылшынАудармашы, ф.ғ.к., PhD5
Қазақ, орысАудармашы, мемлекеттік органдар мамандары3
Қазақ, орыс және шетел тілі (француз, неміс, араб, қытай, корей, т.б.)Аудармашы, магистр6

Барлық саны 39 аударма саласындағы мамандар Digital Library платформасында Zthes деректер схемасында әзірленген салалық терминдердің көптілді басқарылмалы тезаурусын құрастырудың қадамдық алгоритмін ақпараттық технология мамандарының жетістіктерін аудармашыларға түсінікті тілмен түсіндірілгенін растады.
Digital Library басқару жүйесі терминдерді біріздендіру мен жүйелеудің аясын кеңейте алады ма? Әлде? 
         
Бұл тезаурустың басты ерекшелігі көптеген электрондық сөздіктерде термин іздеу барысында кездесетін көп варианттылық мәселесін шеше алады, яғни бұл Digital Library басқару жүйесі негізінде жасалған тезаурустың сала мамандарына беретін басты артықшылығы – ол термин іздеу барысындағы таргеттік немесе релеванттық іздеу, яғни салалық терминнің нақты бір саладағы семантикалық және функционалдық жағы нақты анықталады, олардың қазақ, орыс, ағылшын тілдеріндегі лингвистикалық баламалары бекітіліп, нақты сол терминге қатысты барлық ақпарат тізбегіне қол жеткізе алу мүмкіндігі бар.

Сонымен, тіліміздегі терминдерді біріздендіру мен жүйелеудің бірден бір жолы – Digital Library платформасы арқылы электрондық тезаурус құрастыру деп пайымдаймыз. Мұндай пікірдің дәлелі ретінде салалық аударма үшін құрастырылып жатқан тезаурустағы таргеттік немесе релеванттық іздеуді басты себеп деп есептейміз. Осыдан 5-6 жыл бұрынғы әзірленген электрондық сөздіктердің өзі қолданыстан тыс қалып жатыр, және осы аталған мәселелерді шешу жолында салалық терминологияға тың шешімдер қажет. Мұндай шешім жасауға қазақ тілінің терминологиялық қорында жинақталған 10 мыңнан аса тау‑кен терминдері, қостілді және көптілді электрондық лексикографиялық дереккөздерден алынған терминдердің талдауы дәлел бола алады.

Әңгімеңізге рахмет.
Басып шығару
lasuna pills - himcolin usa buy himcolin sale

gabapentin tablet - nurofen uk azulfidine 500 mg without prescription

buy celebrex 200mg pill - cheap urispas for sale order indocin pill

order mebeverine 135mg without prescription - etoricoxib 120mg for sale pletal cost

voltaren uk - purchase cambia generic purchase aspirin pill

rumalaya without prescription - buy elavil generic amitriptyline cheap

purchase pyridostigmine for sale - buy sumatriptan cheap azathioprine online buy

Пікір қосу
Janalyqtar toptamasy
"Қорғансыздың күні"11:42«Кітап-Amanat» орталығы ашылды10:55«Кітап-Аманат» орталығы ашылды.10:45АТЫРАУДА «КІТАП-AMANAT» МӘДЕНИ-АҒАРТУ ОРТАЛЫҒЫ АШЫЛДЫ10:21«КІТАП-AMANAT» партиялық жоба аясында кітап орталығы ашылды10:14ШҚО-да алғаш рет бірегей кітап орталығы ашылды09:57«Кітап-Аманат» жобасы Шымкентте жалғасты09:52"Мемлекеттік тіл және БАҚ - 2023" байқауының жеңімпаздары анықталды11:55БОЛАТ НАЗАРБАЕВ ҚАЙТЫС БОЛДЫ11:19«ҚАЗАҚША МӘЗІР» РЕСПУБЛИКАЛЫҚ КОНКУРСЫ ӨТТІ11:52Көк Туға – Құрмет!15:37«Кітап-Аманат» дүкенінде белгілі ақын, Алмас Ахметбекұлы кітаптарының тұсаукесер рәсімі болып өтті.13:19Халықаралық семинар16:39Кеше, Жамбыл атындағы кітапханада белгілі қаламгер, күйші Таласбек Әсемқұловтың 8 томдық жинағының кезекті 6-8 томдарының тұсаукесер рәсімі болып өтті.20:35қателік10:23"Бір тойым..."10:17Абзал Құспан тик ток паракшасынан алынды16:31ТІЛДЕР МЕРЕКЕСІНІҢ МЕРЕЙІ АСҚАҚ19:24ҚҰДІЕТТІ ОТ МАҒЖАН ЖЫРЛАРЫ «МЕН ҚАЗАҚША СӨЙЛЕЙМІН» АКЦИЯСЫ ӨЗ МӘРЕСІНЕ ЖЕТТІ18:44«Анасының артынан баласы мен қыздары секіре берген»: Сырдария өзеніндегі қайғылы оқиға туралы куәгерлер айтып берді09:10Қырғызстанда 2027 жылдан бастап пластик пакетке тыйым салынады12:41«Сөз түзелді, тыңдаушы, сен де түзел...»12:311 440 000 ТЕҢГЕ16:48«Азия Дауысы» арма екен?!16:38ТОҒЖАНОВ деген КІМ?15:45Нағыз қазақ – Домбыра!22:30Биыл «Динамо» спорт қоғамына 100 жыл17:36Жаңажол кен орнындағы өрт 14 сағатта сөндірілді10:06Проблемалық несиесі бар адамдарға жаңа кредит берілмейді11:13Ірі мұнай-газ компаниясы арзан бағада жекеменшікке сатылып кеткен11:15