Фреквенцијски речник - монументални пројекат

ЈП "Службени гласник" данас је у Ректорату Београдског универзитета представио монументални пројекат проф. Ђорђа Костића (1909-1995) у који је уграђено 11 милиона речи да би се створио јединствени речник српског језика о учесталости коришћења одређених речи кроз период од 12. века до савременог доба.

Пред научну јавност су изнета прва три тома "Фреквенцијског речника - Квантитативног описа структуре српског језика" који представљају прво коло "Српски језик од XII до XVIII века" и баве се речником Доментијанових дела.

О целом пројекту, који је започет 1957. године, а трајаће још низ година, говорили су уредник Библиотеке LEXIS Милојко Кнежевић, приређивач Речника др Александар Костић и стручни рецензент проф. др Ђорђе Трифуновић.

Директор "Гласника" Слободан Гавриловић изразио је задовољство што је ова издавачка кућа преузела реализацију тако важног пројекта за српску културу који сматра да је највећи издавачки подухват у историји "Гласника".

Он је констатовао да су само велики сањари попут Костића у стању да се подухвате посла који је обухватио 11 милиона речи и тако уврстио Србију међу велике културе које имају Фреквенцијске речнике свог језика кроз историју. Он је напоменуо да ће Гласник објавити цео речник у дигиталној форми.

Гаврловић се пожалио да јавност није довољно упозната да овим пројектом на коме сарађују са Институтом за експерименталну фонетику и патологију говора и Лабораторијом за експерименталну психологију Филозофског факултета БУ.

Гавриловић је поклонио прва три тома Речника ректору БУ проф. др Бранку Ковачевићу.

Говорећи о пионирском раду проф. др Костића који је основао Институт за експерименталну фонетику и патологију говора, уредник едиције LEXIS Кнежевић је истакао да је он у оквиру пројекта машинског превођења и аутоматског препознавања текста формирао ручно анотирани дијахрони корпус српског језика, обима 11 милиона речи, од 12. века до савременог језика.

Почетком 1996. године, ручно обрађена грађа пребачена је у електронски облик.

Направљен је Фреквенцијски речник савременог српског језика (седам томова) изведен из два подузорка савременог српског језика (поетски текстови и дневна штампа).

Поред фреквенције одредница дате су и фреквенције сваког граматичког облика одредница које су су јавиле у узорку (у току је проширење Речника додавањем узорка литерарне прозе).

Управо објављени Фреквенцијски речник Доментијана, омогућава претраживање одредница и изворних текстова. У првом тому дати су изворни и граматички обрађени текстови оба Доментијанова житија са одредницама и граматичком спецификацијом сваке речи. У другом тому су фреквенцијски речници житија св. Симеона и св. Саве. Оба житија садрже 78.284 речи, 4.606 одредница и 15.783 граматичка облика одредница. Од 3.139 граматичких облика система граматичког кодирања српскословенског језика, код Доментијана се јављају 972.

У обрађеном корпусу српског језика посебан значај, како је навео његов приређивач Александар Костић има сегмент од 12. до 18. века (500.000 речи) који, прецизном анотацијом граматичких облика и анализом учесталости сваке речи, истраживачима знатно олакшава проучавање најранијих фаза развоја српског језика.

Извор: РТВ