Moodle
sci.vanyog.com icon
Икона на Bible6
Компютърна
Библия 6

Download Mac download Linux 24b download Linux 23b download Android download Facebook

Бърз хостинг от 2.90 лева!

Българска граматика grammar-bg

12:50:25 часа на 18 юли 2016 Visited: 29076, Today: 0

Публикувани са изпълними файлове за Windows на адрес: http://vanyog.github.io/grammar-bg/.

grammar-bg readme.html fail

Описание

grammar-bg представлява опит за компютърно междуплатформено представяне на българския език. Надявам се проектът grammar-bg да бъде полезен при: създаване на различни речници (правописни, синонимни, тълковни, двуезични) и програми за: проверка на правописа и граматиката, показване на справочна информация, автоматична обработка на български текстове, превод от български на друг език или обратно и т.н.

grammar-bg е проект с отворен код (GNU GPL 3) и представлява набор от C++ заглавни файлове и файлове с код, ползващи библиотеката Qt. В тези файлове се дефинират набор от класове, описващи речниковия състав (и в бъдеще) граматиката на българския език. На базата на тези файлове е съставена компютърна програма grammar-bg, която демонстрира някои от възможностите на проекта - дава информация за морфологията на думите, прави проверка на правописа и др.

В началните си версии grammar-bg ползваше базата данни от bgoffice (http://bgoffice.sourceforge.net), но в момента, след развитието, което получи Речник на българския език използва неговата база данни.

Изтегляне на необходимите файлове

Изходния код на grammar-bg се публикува в github.com/vanyog/grammar-bg.
За функциите показване на синоними и превод на английски са необходими речниците bg-en и thesaurus от bgoffice, които се доставят с изходния код на grammar-bg, но най-новите им версии може да се изтеглят SVN хранилището на bgoffice.
За да може да компилирате grammar-bg, трябва преди това да сте изтеглили и инсталирали Qt Open Source. (Информация на български за работа с Qt има в книгата "Програмиране с Qt".)

Компилиране

Изходният код на grammar-bg може да изтеглите от https://github.com/vanyog/grammar-bg във вид на ZIP файл (през бутона "Code" -> "Download ZIP" на страницата в GitHub), чрез програма Git клиент или директно с Qt Creator.

След като вече разполагате с изходния код, в Qt Creator отворете файл grammar-bg.pro и потвърдете с "Configure project" създаването на целеви комплект за средата на Вашия компютър.

За да може компилираната програма да намери файловете с данни, в Qt Creator, щракнете Projects и след това върху страница Run на целевия комплект. Срещу Working Directory щракнете Choose... и изберете за работна директория, директорията с код, в която се намира поддиректорията с данни data.

За компилиране и стартиране на програмата, щрекнете бутона Run с форма на зелен триъгълник.

Забележка:

При първото стартиране grammar-bg подрежда по азбучен ред кореновите форми, а когато щракнете бутона "Всички словоформи" се подреждат по азбучен ред и всички словоформи. Подреждането може да продължи до няколко минути на по-бавни компютри, но след като бъде извършено, редът на думите се записва в два файла - roots.dat и forms.dat и при следващи стартирания се чете от там, което става многократно по-бързо.

Публикувани досега версии

2 февруари 2021 г. - версия 2.2.1
Публикуван е изпалним файл за Windows.

1 февруари 2021 г. - версия 2.2.0
Публикуван е изпалним файл за macOS.

31 януари 2021 г. - версия 2.2.0
Само като програмен код в GitHub.

  • Компилиране с последваната главна версия 5 на Qt - 5.12.2. Обмисля се мигриране към главна версия 6.
  • Добавени нови функции: Помощ - Подробна помощ; подобрение на Редактиране - Търсене, целящо по-прецизно намиране на думи, състоящи се от зададени букви;
  • Подобрения в интерфейса: подсказващи надписи (Tooltips), превода на български, хиперлинк "Oline"

31 март 2013 г. - версия 2.0
През изминалото от публикуването на предишната версия време по програмата се работеше и новата версия съдържа следните новости:

  • Като източник на данни се използват .csv файлове с таблици от базата данни на проекта Речник на българския език.
  • В допълнителен файл w_words_local.csv се добавят липсващи в Речник на българския език думи. (Бутон: "Добавяне".)
  • Добавена е правописна проверка на текстов файл с UTF-8 кодиране. (Меню: "Инструменти - Правописна проверка на файл (UTF-8)")
  • Думите от проверявания текст се показват в списъка вдясно.
  • Програмата може да маркира думите от проверявания текст, които имат определена морфологична характеристика, например: част на речта, лице, число и т.н. (Характеристиката и нейната стойност се задават с падащите списъци вдясно

21 май 2008 г. - версия 1.0

  • Най-съществената новост - проверка на правописа. Може да се проверява, копиран в клипборд текст, или текстов файл с кодировка Windows 1251.
  • Превод на дума английски.
  • Показване на синонимите.

26 февруари 2008 г. - версия 0.3
Вече са реализирани и опциите за търсене на думи, които се "състоят от" определени части, както и "запис във файл" на всички намерени думи. Направени са малки подобрения в интерфейса.

16 февруари 2008 г. - версия 0.2
В тази версия е добавена функция за търсене на думи. След избиране на "Редактиране" -> "Търсене" от главното меню, се показва диалог, в който можете да напишете отделни букви, срички или въобще части, които трябва да съдържа търсената дума. Последните трябва да са отделени с интервали. Търсенето се осъществява след щракването на бутона "Следващо търсене". Предстои да бъдат добавени още възможности за търсене.

25 ноември 2007 г.
Следваща версия, носеща вече номер 0.1, позволява запис на показвания списък от основни форми на думите или списък от всички словоформи от речниците на bgoffice в .txt файл.

14 март 2007 г.
Първа, публикувана версия на проекта представлява програма с графичен интерфейс, която: чете информацията от файловете на data директорията на bgoffice и показва списък на кореновите или производни форми на описаните в тези файлове думи. Показва също и съдържащата се в тези файлове граматическа информация за различните словоформи. Практическа полза от програмата в този вид може да има от това, че позволява лесно да се намират различни словоформи и да се провери коректността на информацията за тях.

Автор на проекта:
Ваньо Георгиев
vanyog.com