-------- Forwarded Message --------
From: Martin Krupa 
To: Marek Nagy 
Cc: 'Robert Mraz' 
Subject: Re: [Fwd: prezentacia novych bakalarskych tem]
Date: Thu, 1 Oct 2015 08:47:03 +0200

sme ochotni viest aj dalsie bakalarky.
Ak by bol zaujem, myslim, ze do tyzdna vieme pripravit 1-2 dalsie.

1.
Názov zadania: Návrh a výroba dopytovacieho jazyka nad CMS BUXUS
Text zadania:
Systémy pre manažment obsahu (Content Management Systems, CMS) často
obsahujú šablóny, ktoré napr. podporujú rôzne typické scenáre použitia.
Cieľom je navrhnúť a implementovať jednoduchý dopytovací jazyk nad CMS
(Content Management System) BUXUS, ktorý zjednoduší a zrýchli
programovanie šablón programátorom (príklad: "SELECT * FROM produkt
WHERE cena > 100" vyberie v CMS BUXUS stránky typu produkt s
vlastnosťou cena > 100). 

Analyzujte súčasné dopytovacie jazyky pre špecifické aplikácie (napr.
Facebook Query Language, Yahoo Query Language). Analyzujte potreby
programátora (aj pokročilého používateľa) v CMS BUXUS. Na základe
analýzy navrhnite BUXUS Query Language - BQL. Navrhnutý dopytovací
jazyk implementujte do CMS BUXUS. Implementácia by mala zvládať
parsovanie textových BQL dopytov a takisto podporovať Fluent API pre
vyskladávanie dopytov.
Poznámka pre študenta
implementacia sa predpoklada v PHP

2. Názov zadania: Štatistický diakritikovač slovenčiny
Text zadania:
Na Internete je veľa slovenských textov bez diakritiky a nové stále
pribúdajú, aj vďaka mobilným zariadeniam, takže táto téma je stále
aktuálna. Na rozdiel od zvyčajného prístupu, to navrhujeme nerobiť
analýzou textu ale štatisticky, spracovaním počtu výskytov v kvalitnom
jazykovom korpuse.

Analyzujte problematiku štatistickej korektúry textov. Inšpirujte sa
systémom Asfur, ktorý je prototypovou implementáciou textového editoru,
ktorý dopĺňa zvyšok slov podľa prvých písmen a navrhnite nový
štatistický diakritikovač slovenčiny. Vyberte vhodný štatistický model
pre slovenčinu, zvážte n-gramy. Nájdite nový korpus a spravte
štatistiku nad ním. Navrhnutý diakritikovač implementujte ako webovú
službu v JavaScripte. Navrhnite aj podporu pre kontrolu pravopisu alebo
podporu pre iné podobné jazyky, napr. pre češtinu.
Poznámka pre študenta
K dispozícii je funkčný prototyp systému Asfur, ktorý je založený na
navrhnutom štatistickom prístupe. Asfur je produkt troch asistentov na
UI MFF UK z roku 1996, jeden z nich je zadávateľom tejto práce.
Prioritne to bol textový editor pre handikepovaných používateľov, ktorý
dopĺňal zvyšok slov podľa prvých písmen. Okrem iného vedel doplniť
diakritiku a opravovať pravopis. Produkt bol založený na štatistike
výskytov, k dispozícii bol jazykový korpus z denníka Pravda. Výsledky
boli skvelé, úspešnosť nad 98% aj s tak obmedzeným korpusom. Celý
produkt Asfur je k dispozícii: vrátane kódu v C++, dokumentácie a
osobných konzultácií.
Dakujem a pekny den prajem,

m.
-- 
http://www.ui42.sk/blog
http://twitter.com/martinkrupa
mobile: +421 905 403 728