(27 intermediate revisions by 2 users not shown)
Line 13: Line 13:
 
:[[https://dai.fmph.uniba.sk/w/Milan_Ftacnik/sk Milan Ftáčnik]]
 
:[[https://dai.fmph.uniba.sk/w/Milan_Ftacnik/sk Milan Ftáčnik]]
 
;Cvičiaci
 
;Cvičiaci
:[[https://dai.fmph.uniba.sk/w/Zuzana_Haladova/sk Zuzana Berger Haladová]]
+
:[[https://dai.fmph.uniba.sk/w/Viktor_Kocur/sk Viktor Kocur]]
 +
 
  
 
== Kontakty ==
 
== Kontakty ==
Line 19: Line 20:
 
;Oficiálna stránka kurzu
 
;Oficiálna stránka kurzu
 
:<code>[https://dai.fmph.uniba.sk/w/Course:Rozpoznavanie_obrazcov/sk https://dai.fmph.uniba.sk/w/Course:Rozpoznavanie_obrazcov/sk]</code>
 
:<code>[https://dai.fmph.uniba.sk/w/Course:Rozpoznavanie_obrazcov/sk https://dai.fmph.uniba.sk/w/Course:Rozpoznavanie_obrazcov/sk]</code>
<!--:<code>zhaladova{z@vin@@č}fmph.uniba.sk</code>-->
+
 
  
  
Line 25: Line 26:
  
 
;Prednášky
 
;Prednášky
 +
 +
;Cvičenia
 +
 +
* 1. cvičenie - Príznaky
 +
* 2. cvičenie - Štatistika I
 +
* 3. cvičenie - Štatistika II
 +
* 4. cvičenie - Informačno-teoretické miery
 +
* 5. cvičenie - PCA, LDA
 +
* 6. cvičenie - Lineárny klasifikátor, SVM
 +
* 7. cvičenie - kNN
 +
* 8. cvičenie - Naivný Bayesov klasifkátor, Validácia
 +
* 9. cvičenie - Validácia, Rozhodovacie stromy
 +
* 10. cvičenie - Neurónové siete
 +
 +
 +
Všetky prezentácie a ostatné materiály sú aj na [https://github.com/kocurvik/edu/ githube] pod zložkou RO.
 +
 +
 +
 +
 +
;Bodovanie cvičení
 +
 +
[https://docs.google.com/spreadsheets/d/1__7MTo89wx5vF7VcWWYqoBZ2-aH7OxTYwCNwrOkcJFA/edit?usp=sharing Bodovacia Tabuľka]
 +
 +
Dohromady je možné z cvičení získať 40 bodov. Pre pripustenie k skúške je nutné získať aspoň 20 bodov (50%).
 +
 +
10 bodov bude udelených v priebehu semestra za aktívnu účasť na cvičeniach. 5 bodov bude udelených za predbežný report k projektu, ktorý bude nutné odovzdať pár týždňov pred koncom semestra. 25 bodov bude udelených za prezentáciu a finálny report k projektu. Projekty budú prezentované na konci semestra.
 +
 +
;Projekty
 +
 +
Projekt sa bude skladať zo 4 častí: výber databázy, výber/redukcia príznakov, klasifikácia dát a vyhodnotenie.
 +
 +
* Možné úlohy/databazy na [https://www.kaggle.com/datasets kaggle] alebo napr. [http://archive.ics.uci.edu/ml/index.php tu]. Rovnako môžete navrhnúť vlastné datasety, alebo úlohy do diplomiek/na iné predmety. V prípade, že nebudete generovať príznaky samostatne (napr. z obrázkov) tak je nutné aby mala databáza aspoň 10 príznakov a aspoň 500 objektov. Keďže ide o klasifikáciu, tak si rozmyslite čo budete v databáze klasifikovať. Databázy sa budú schvaľovať na cvičeni '''TBA'''.
 +
 +
* Bude sa očakávať, že použijete aspoň jednu metódu na výber (napr. dopredný, spätný) alebo redukciu (napr. PCA, ICA, LSA, LDA, CCA, PLS) príznakov. Ak to bude vhodné skúste použiť aj inú predúpravu príznakov.
 +
 +
* Na klasifikáciu vyskúšate aspoň 2 algoritmy. Napr. SVM, Lineárny klasifikátor, ANN, SOM, Stromy, Bayes, kNN atď. Klasifikáciu otestuje aj bez toho aby ste použili výber/redukciu príznakov.
 +
 +
* Výsledky klasifikácie vyhodnotíte. Nezabudnite na rozdelenie dát na train/val/test. Ako vyhodnotenie môžete uvádzať presnosť v percentách, ROC krivky, matice zámen. Porovnajte použité klasifikátory s aj bez výberu/redukcie príznakov.
 +
 +
V predbežnom reporte popíšete databázu, zhrniete vlastnosti príznakov, určíte váš cieľ čo na nej chcete klasifikovať a metódy ktoré chcete použiť. Predbežný report je potrebné poslať mailom do '''23.4.2020'''.
 +
 +
Vo finálnom reporte taktiež popíšte databázu, napíšete aké metódy ste použili, prečo ste ich použili a ako ste ich použili. Hlavná časť reportu bude spočívať vo vyhodnotení a porovnaní výsledkov jednotlivých postupov. Report bude taktiež v pdf a bude nutné ho poslať mailom do '''18.5.2020 16:00'''.
 +
 +
Prezentácia bude obsahovať rovnaké informácie ako report. Zhodnotíte v nej aj klady a zápory metód ideálne na konkrétnych príkladoch a neformálne závery (ako náročné boli rôzne postupy, kde boli úskalia atď.). Prezentácie sa budú preztentovať na cvičení '''18.5.2020'''.
 +
 +
;Projects (EN)
 +
 +
The project will contain 4 parts: database selection, selection/reduction of features, classification and evaluation.
 +
 +
* You can select a database on [https://www.kaggle.com/datasets kaggle] or [http://archive.ics.uci.edu/ml/index.php here]. You can also choose any other dataset or project for your thesis/other classes. In case that you are not generating the features yourself (for example from images) it is necessary for the database to contain at least 500 objects with 10 features. Since this will be a classification task it is necessary to determine what you want to classify. I will personally approve your selected database. The data of the approval is '''TBA'''.
 +
 +
* You have to use at least one selection method (forward/backward) or a reduction method (PCA, ICA, LSA, LDA, CCA, PLS) for features. If possible you should also use some other form of feature preprocessing.
 +
 +
* You have to use at least 2 algorithms for classification (SVM, Linear classifier, ANN, SOM, Forests, Bayes, kNN). Test the classification both with and without feature selection/reduction.
 +
 +
* You have to evaluate all of the selected approaches to classification. Do not forget to split the data into train/val/test. You have to evaluate the classification accuracy using ROC curves, confusion matrices or precision and recall metrics. You have to perform the evaluation for models where you both did and did not apply feature selection/reduction.
 +
 +
In the preliminary report you will have to describe the database and the features it contains. You will have to specify what your goal is and which methods you want to use. The preliminary report deadline is '''23.4.2020'''.
 +
 +
The final report has to include the description of the database and the methods you have used along with an explanation of why you chose the methods and how you applied them. The most important part of the report will be the evaluation where you evaluate all of the approaches you have used. The report has to be a PDF file. The report deadilne is '''18.5.2020 16:00'''.
 +
 +
You will also be required to prepare a presentation with the same information as in the report. You should include positives and negatives of your selected approaches. You should evaluate the positives and negatives of the chosen methods. You can also present some informal conclusions (difficulties you had to overcome, what did not work etc.). The presentations will be presented at the last lab session '''18.5.2020'''.
 +
 +
 +
<!--
 
*20.2. Úvod do problematiky [http://www.sccg.sk/~ftacnik/RO1-uvod.pptx pptx]
 
*20.2. Úvod do problematiky [http://www.sccg.sk/~ftacnik/RO1-uvod.pptx pptx]
  
Line 43: Line 110:
 
*8.5. Sviatok- Konzultácie v stredu 9.5. 9:00 - 10:40, M 153, pridite na 9:00
 
*8.5. Sviatok- Konzultácie v stredu 9.5. 9:00 - 10:40, M 153, pridite na 9:00
 
*15.5. Odovzdavanie projektov. NEZABUDNITE POSLAT REPORT DO 13.5. na zhaladova@gmail.com. SKONTROLUJTE SI CI REPORT A PREZENTACIA SPLNAJU POZIADAVKY PODLA [http://www.sccg.sk/~haladova/ROProjekty.pdf projekty].
 
*15.5. Odovzdavanie projektov. NEZABUDNITE POSLAT REPORT DO 13.5. na zhaladova@gmail.com. SKONTROLUJTE SI CI REPORT A PREZENTACIA SPLNAJU POZIADAVKY PODLA [http://www.sccg.sk/~haladova/ROProjekty.pdf projekty].
 
+
-->
 
==Body==
 
==Body==
 +
<!--
 
Výsledne hodnotenie z cvičení si pozrite tu [https://docs.google.com/spreadsheets/d/1fgeGp65oskMmipE4Q6gPrJsYJceoEyHqyLpNSMsLlwM/edit?usp=sharing body]
 
Výsledne hodnotenie z cvičení si pozrite tu [https://docs.google.com/spreadsheets/d/1fgeGp65oskMmipE4Q6gPrJsYJceoEyHqyLpNSMsLlwM/edit?usp=sharing body]
  
<!--
+
 
 
{| class="table-responsive alternative"
 
{| class="table-responsive alternative"
 
|+Bodovanie cvičení
 
|+Bodovanie cvičení

Latest revision as of 21:07, 5 July 2020

Rozpoznávanie obrazcov 2-AIN-204


Toto je stránka k predmetu Rozpoznávanie obrazcov Informačný list predmetu >

Ľudia podieľajúci sa na výučbe

Prednášajúci
[Milan Ftáčnik]
Cvičiaci
[Viktor Kocur]


Kontakty

Oficiálna stránka kurzu
https://dai.fmph.uniba.sk/w/Course:Rozpoznavanie_obrazcov/sk


Organizácia výučby

Prednášky
Cvičenia
  • 1. cvičenie - Príznaky
  • 2. cvičenie - Štatistika I
  • 3. cvičenie - Štatistika II
  • 4. cvičenie - Informačno-teoretické miery
  • 5. cvičenie - PCA, LDA
  • 6. cvičenie - Lineárny klasifikátor, SVM
  • 7. cvičenie - kNN
  • 8. cvičenie - Naivný Bayesov klasifkátor, Validácia
  • 9. cvičenie - Validácia, Rozhodovacie stromy
  • 10. cvičenie - Neurónové siete


Všetky prezentácie a ostatné materiály sú aj na githube pod zložkou RO.



Bodovanie cvičení

Bodovacia Tabuľka

Dohromady je možné z cvičení získať 40 bodov. Pre pripustenie k skúške je nutné získať aspoň 20 bodov (50%).

10 bodov bude udelených v priebehu semestra za aktívnu účasť na cvičeniach. 5 bodov bude udelených za predbežný report k projektu, ktorý bude nutné odovzdať pár týždňov pred koncom semestra. 25 bodov bude udelených za prezentáciu a finálny report k projektu. Projekty budú prezentované na konci semestra.

Projekty

Projekt sa bude skladať zo 4 častí: výber databázy, výber/redukcia príznakov, klasifikácia dát a vyhodnotenie.

  • Možné úlohy/databazy na kaggle alebo napr. tu. Rovnako môžete navrhnúť vlastné datasety, alebo úlohy do diplomiek/na iné predmety. V prípade, že nebudete generovať príznaky samostatne (napr. z obrázkov) tak je nutné aby mala databáza aspoň 10 príznakov a aspoň 500 objektov. Keďže ide o klasifikáciu, tak si rozmyslite čo budete v databáze klasifikovať. Databázy sa budú schvaľovať na cvičeni TBA.
  • Bude sa očakávať, že použijete aspoň jednu metódu na výber (napr. dopredný, spätný) alebo redukciu (napr. PCA, ICA, LSA, LDA, CCA, PLS) príznakov. Ak to bude vhodné skúste použiť aj inú predúpravu príznakov.
  • Na klasifikáciu vyskúšate aspoň 2 algoritmy. Napr. SVM, Lineárny klasifikátor, ANN, SOM, Stromy, Bayes, kNN atď. Klasifikáciu otestuje aj bez toho aby ste použili výber/redukciu príznakov.
  • Výsledky klasifikácie vyhodnotíte. Nezabudnite na rozdelenie dát na train/val/test. Ako vyhodnotenie môžete uvádzať presnosť v percentách, ROC krivky, matice zámen. Porovnajte použité klasifikátory s aj bez výberu/redukcie príznakov.

V predbežnom reporte popíšete databázu, zhrniete vlastnosti príznakov, určíte váš cieľ čo na nej chcete klasifikovať a metódy ktoré chcete použiť. Predbežný report je potrebné poslať mailom do 23.4.2020.

Vo finálnom reporte taktiež popíšte databázu, napíšete aké metódy ste použili, prečo ste ich použili a ako ste ich použili. Hlavná časť reportu bude spočívať vo vyhodnotení a porovnaní výsledkov jednotlivých postupov. Report bude taktiež v pdf a bude nutné ho poslať mailom do 18.5.2020 16:00.

Prezentácia bude obsahovať rovnaké informácie ako report. Zhodnotíte v nej aj klady a zápory metód ideálne na konkrétnych príkladoch a neformálne závery (ako náročné boli rôzne postupy, kde boli úskalia atď.). Prezentácie sa budú preztentovať na cvičení 18.5.2020.

Projects (EN)

The project will contain 4 parts: database selection, selection/reduction of features, classification and evaluation.

  • You can select a database on kaggle or here. You can also choose any other dataset or project for your thesis/other classes. In case that you are not generating the features yourself (for example from images) it is necessary for the database to contain at least 500 objects with 10 features. Since this will be a classification task it is necessary to determine what you want to classify. I will personally approve your selected database. The data of the approval is TBA.
  • You have to use at least one selection method (forward/backward) or a reduction method (PCA, ICA, LSA, LDA, CCA, PLS) for features. If possible you should also use some other form of feature preprocessing.
  • You have to use at least 2 algorithms for classification (SVM, Linear classifier, ANN, SOM, Forests, Bayes, kNN). Test the classification both with and without feature selection/reduction.
  • You have to evaluate all of the selected approaches to classification. Do not forget to split the data into train/val/test. You have to evaluate the classification accuracy using ROC curves, confusion matrices or precision and recall metrics. You have to perform the evaluation for models where you both did and did not apply feature selection/reduction.

In the preliminary report you will have to describe the database and the features it contains. You will have to specify what your goal is and which methods you want to use. The preliminary report deadline is 23.4.2020.

The final report has to include the description of the database and the methods you have used along with an explanation of why you chose the methods and how you applied them. The most important part of the report will be the evaluation where you evaluate all of the approaches you have used. The report has to be a PDF file. The report deadilne is 18.5.2020 16:00.

You will also be required to prepare a presentation with the same information as in the report. You should include positives and negatives of your selected approaches. You should evaluate the positives and negatives of the chosen methods. You can also present some informal conclusions (difficulties you had to overcome, what did not work etc.). The presentations will be presented at the last lab session 18.5.2020.


Body