Специалист по компьютерным наукам Бирзейтского университета в Палестине создал программу под названием «Арабская онтология», которая включает в себя весь словарный запас арабского языка, а также является системой, которая позволит на своей базе создавать новое программное обеспечение по арабскому языку, например, лучший переводчик, сообщает The Arab American News.
Мустафа Джаррар, доцент кафедры информатики Бирзейтского университета в течение восьми лет неустанно трудился над реализацией своего уникального проекта. Созданная им программа может использоваться не только как поисковик для арабских слов и обыкновенный словарь, но является еще и тезаурусом, логической системой – онтологией, которая распознает уникальные характеристики арабского языка. Впервые создана информационная технология, которая может найти взаимосвязи между значениями слов в арабском языке.
Как сообщает «Исламосфера», программа “Арабская онтология” предоставляет более точные результаты поиска Google на арабском языке, лучший онлайн-перевод арабского текста и возможность нового понимания языка не только для студентов, но и арабских филологов.
Это уникальный проект, который не имеет аналогов в других языках. Поисковая система включает данные, взятые из 150 арабских словарей, которые были введены в программу вручную.
«Представьте, что у вас есть Оксфордский английский словарь, словарь Merriam-Webster и все остальные словари, собранные в одном месте, интегрированные и унифицированные в одной базе данных», – говорит Джаррар.
Это была кропотливая работа. Сначала Джаррар попытался ввести информацию из книг с помощью сканера. Но для извлечения полезных данных из книг требуется программное обеспечение оптического распознавания символов, известное как OCR, которое может читать по-арабски.
“Я пытался использовать OCR, но это не сработало”, – сказал Джаррар. – “Программное обеспечение OCR на арабском языке все еще функционирует довольно плохо. Количество исправлений, которое вам нужно сделать, гораздо больше, чем если бы вы ввели текст с нуля, вручную”.
Он переложил эту работу на студентов своего университета, которые должны были вручную ввести всю необходимую информацию. Каждый студент должен был отработать 120 часов в данном проекте. На них также была возложена задача проверки и корректировки текстов. Посчитав, что это очень трудоемкая и кропотливая задача, Джаррар решил, что общественный характер плохо скажется на качестве работы. В итоге он привлек заинтересованных студентов, которые могли бы качественно выполнить задачу, и оплатил их труд.
Пресс-служба Управления мусульман Узбекистана