-------- Forwarded Message -------- From: Martin KrupaTo: Marek Nagy Cc: 'Robert Mraz' Subject: Re: [Fwd: prezentacia novych bakalarskych tem] Date: Thu, 1 Oct 2015 08:47:03 +0200 sme ochotni viest aj dalsie bakalarky. Ak by bol zaujem, myslim, ze do tyzdna vieme pripravit 1-2 dalsie. 1. Názov zadania: Návrh a výroba dopytovacieho jazyka nad CMS BUXUS Text zadania: Systémy pre manažment obsahu (Content Management Systems, CMS) často obsahujú šablóny, ktoré napr. podporujú rôzne typické scenáre použitia. Cieľom je navrhnúť a implementovať jednoduchý dopytovací jazyk nad CMS (Content Management System) BUXUS, ktorý zjednoduší a zrýchli programovanie šablón programátorom (príklad: "SELECT * FROM produkt WHERE cena > 100" vyberie v CMS BUXUS stránky typu produkt s vlastnosťou cena > 100). Analyzujte súčasné dopytovacie jazyky pre špecifické aplikácie (napr. Facebook Query Language, Yahoo Query Language). Analyzujte potreby programátora (aj pokročilého používateľa) v CMS BUXUS. Na základe analýzy navrhnite BUXUS Query Language - BQL. Navrhnutý dopytovací jazyk implementujte do CMS BUXUS. Implementácia by mala zvládať parsovanie textových BQL dopytov a takisto podporovať Fluent API pre vyskladávanie dopytov. Poznámka pre študenta implementacia sa predpoklada v PHP 2. Názov zadania: Štatistický diakritikovač slovenčiny Text zadania: Na Internete je veľa slovenských textov bez diakritiky a nové stále pribúdajú, aj vďaka mobilným zariadeniam, takže táto téma je stále aktuálna. Na rozdiel od zvyčajného prístupu, to navrhujeme nerobiť analýzou textu ale štatisticky, spracovaním počtu výskytov v kvalitnom jazykovom korpuse. Analyzujte problematiku štatistickej korektúry textov. Inšpirujte sa systémom Asfur, ktorý je prototypovou implementáciou textového editoru, ktorý dopĺňa zvyšok slov podľa prvých písmen a navrhnite nový štatistický diakritikovač slovenčiny. Vyberte vhodný štatistický model pre slovenčinu, zvážte n-gramy. Nájdite nový korpus a spravte štatistiku nad ním. Navrhnutý diakritikovač implementujte ako webovú službu v JavaScripte. Navrhnite aj podporu pre kontrolu pravopisu alebo podporu pre iné podobné jazyky, napr. pre češtinu. Poznámka pre študenta K dispozícii je funkčný prototyp systému Asfur, ktorý je založený na navrhnutom štatistickom prístupe. Asfur je produkt troch asistentov na UI MFF UK z roku 1996, jeden z nich je zadávateľom tejto práce. Prioritne to bol textový editor pre handikepovaných používateľov, ktorý dopĺňal zvyšok slov podľa prvých písmen. Okrem iného vedel doplniť diakritiku a opravovať pravopis. Produkt bol založený na štatistike výskytov, k dispozícii bol jazykový korpus z denníka Pravda. Výsledky boli skvelé, úspešnosť nad 98% aj s tak obmedzeným korpusom. Celý produkt Asfur je k dispozícii: vrátane kódu v C++, dokumentácie a osobných konzultácií. Dakujem a pekny den prajem, m. -- http://www.ui42.sk/blog http://twitter.com/martinkrupa mobile: +421 905 403 728