(10 intermediate revisions by the same user not shown)
Riadok 29: Riadok 29:
 
;Cvičenia
 
;Cvičenia
  
* 1. cvičenie - Príznaky - [http://www.sccg.sk/~kocur/edu/RO/cv01/cv01.pdf prezentácia]
+
* 1. cvičenie - Príznaky
* 2. cvičenie - Štatistika I - [http://www.sccg.sk/~kocur/edu/RO/cv02/cv02.pdf prezentácia] [http://www.sccg.sk/~kocur/edu/RO/cv02/cv02-handout.pdf (nerozsekaná verzia)]
+
* 2. cvičenie - Štatistika I
* 3. cvičenie - Štatistika II - [http://www.sccg.sk/~kocur/edu/RO/cv03/cv03.pdf prezentácia] [http://www.sccg.sk/~kocur/edu/RO/cv03/cv03-handout.pdf (nerozsekaná verzia)]
+
* 3. cvičenie - Štatistika II
* 4. cvičenie - Informačno-teoretické miery - [http://www.sccg.sk/~kocur/edu/RO/cv04/cv04.pdf prezentácia]
+
* 4. cvičenie - Informačno-teoretické miery
* 5. cvičenie - PCA, LDA - [http://www.sccg.sk/~kocur/edu/RO/cv05/cv05.pdf prezentácia] [http://www.sccg.sk/~kocur/edu/RO/cv05/cv05.zip súbory]
+
* 5. cvičenie - PCA, LDA
* 6. cvičenie - Lineárny klasifikátor, SVM - [http://www.sccg.sk/~kocur/edu/RO/cv06/cv06.pdf prezentácia] [http://www.sccg.sk/~kocur/edu/RO/cv06/cv06.zip súbory] [[Médiá:RO_cv06_data.zip]]
+
* 6. cvičenie - Lineárny klasifikátor, SVM
* 7. cvičenie - kNN - [http://www.sccg.sk/~kocur/edu/RO/cv07/cv07.pdf prezentácia]
+
* 7. cvičenie - kNN
* 8. cvičenie - Naivný Bayesov klasifkátor, Validácia - [http://www.sccg.sk/~kocur/edu/RO/cv08/cv08.pdf prezentácia]
+
* 8. cvičenie - Naivný Bayesov klasifkátor, Validácia
* 9. cvičenie - Validácia, Rozhodovacie stromy - [http://www.sccg.sk/~kocur/edu/RO/cv09/cv09.pdf prezentácia]
+
* 9. cvičenie - Validácia, Rozhodovacie stromy
 +
* 10. cvičenie - Neurónové siete
 +
 
 +
 
 +
Všetky prezentácie a ostatné materiály sú aj na [https://github.com/kocurvik/edu/ githube] pod zložkou RO.
 +
 
 +
 
  
  
Riadok 44: Riadok 50:
 
[https://docs.google.com/spreadsheets/d/1__7MTo89wx5vF7VcWWYqoBZ2-aH7OxTYwCNwrOkcJFA/edit?usp=sharing Bodovacia Tabuľka]
 
[https://docs.google.com/spreadsheets/d/1__7MTo89wx5vF7VcWWYqoBZ2-aH7OxTYwCNwrOkcJFA/edit?usp=sharing Bodovacia Tabuľka]
  
Dohromady je možné z cvičení získať 20 bodov. Pre pripustenie k skúške je nutné získať aspoň 20 bodov (50%).
+
Dohromady je možné z cvičení získať 40 bodov. Pre pripustenie k skúške je nutné získať aspoň 20 bodov (50%).
  
 
10 bodov bude udelených v priebehu semestra za aktívnu účasť na cvičeniach. 5 bodov bude udelených za predbežný report k projektu, ktorý bude nutné odovzdať pár týždňov pred koncom semestra. 25 bodov bude udelených za prezentáciu a finálny report k projektu. Projekty budú prezentované na konci semestra.
 
10 bodov bude udelených v priebehu semestra za aktívnu účasť na cvičeniach. 5 bodov bude udelených za predbežný report k projektu, ktorý bude nutné odovzdať pár týždňov pred koncom semestra. 25 bodov bude udelených za prezentáciu a finálny report k projektu. Projekty budú prezentované na konci semestra.
Riadok 52: Riadok 58:
 
Projekt sa bude skladať zo 4 častí: výber databázy, výber/redukcia príznakov, klasifikácia dát a vyhodnotenie.
 
Projekt sa bude skladať zo 4 častí: výber databázy, výber/redukcia príznakov, klasifikácia dát a vyhodnotenie.
  
* Možné úlohy/databazy na [https://www.kaggle.com/datasets kaggle] alebo napr. [http://archive.ics.uci.edu/ml/index.php tu]. Rovnako môžete navrhnúť vlastné datasety, alebo úlohy do diplomiek/na iné predmety. V prípade, že nebudete generovať príznaky samostatne (napr. z obrázkov) tak je nutné aby mala databáza aspoň 10 príznakov a aspoň 500 objektov. Keďže ide o klasifikáciu, tak si rozmyslite čo budete v databáze klasifikovať. Databázy sa budú schvaľovať na '''cvičeni 12.3.2019'''.
+
* Možné úlohy/databazy na [https://www.kaggle.com/datasets kaggle] alebo napr. [http://archive.ics.uci.edu/ml/index.php tu]. Rovnako môžete navrhnúť vlastné datasety, alebo úlohy do diplomiek/na iné predmety. V prípade, že nebudete generovať príznaky samostatne (napr. z obrázkov) tak je nutné aby mala databáza aspoň 10 príznakov a aspoň 500 objektov. Keďže ide o klasifikáciu, tak si rozmyslite čo budete v databáze klasifikovať. Databázy sa budú schvaľovať na cvičeni '''TBA'''.
  
 
* Bude sa očakávať, že použijete aspoň jednu metódu na výber (napr. dopredný, spätný) alebo redukciu (napr. PCA, ICA, LSA, LDA, CCA, PLS) príznakov. Ak to bude vhodné skúste použiť aj inú predúpravu príznakov.
 
* Bude sa očakávať, že použijete aspoň jednu metódu na výber (napr. dopredný, spätný) alebo redukciu (napr. PCA, ICA, LSA, LDA, CCA, PLS) príznakov. Ak to bude vhodné skúste použiť aj inú predúpravu príznakov.
Riadok 60: Riadok 66:
 
* Výsledky klasifikácie vyhodnotíte. Nezabudnite na rozdelenie dát na train/val/test. Ako vyhodnotenie môžete uvádzať presnosť v percentách, ROC krivky, matice zámen. Porovnajte použité klasifikátory s aj bez výberu/redukcie príznakov.  
 
* Výsledky klasifikácie vyhodnotíte. Nezabudnite na rozdelenie dát na train/val/test. Ako vyhodnotenie môžete uvádzať presnosť v percentách, ROC krivky, matice zámen. Porovnajte použité klasifikátory s aj bez výberu/redukcie príznakov.  
  
V predbežnom reporte popíšete databázu, zhrniete vlastnosti príznakov, určíte váš cieľ čo na nej chcete klasifikovať a metódy ktoré chcete použiť. Report je potrebné poslať mailom do '''22.4.2019'''.
+
V predbežnom reporte popíšete databázu, zhrniete vlastnosti príznakov, určíte váš cieľ čo na nej chcete klasifikovať a metódy ktoré chcete použiť. Predbežný report je potrebné poslať mailom do '''23.4.2020'''.
 +
 
 +
Vo finálnom reporte taktiež popíšte databázu, napíšete aké metódy ste použili, prečo ste ich použili a ako ste ich použili. Hlavná časť reportu bude spočívať vo vyhodnotení a porovnaní výsledkov jednotlivých postupov. Report bude taktiež v pdf a bude nutné ho poslať mailom do '''18.5.2020 16:00'''.
 +
 
 +
Prezentácia bude obsahovať rovnaké informácie ako report. Zhodnotíte v nej aj klady a zápory metód ideálne na konkrétnych príkladoch a neformálne závery (ako náročné boli rôzne postupy, kde boli úskalia atď.). Prezentácie sa budú preztentovať na cvičení '''18.5.2020'''.
 +
 
 +
;Projects (EN)
 +
 
 +
The project will contain 4 parts: database selection, selection/reduction of features, classification and evaluation.
 +
 
 +
* You can select a database on [https://www.kaggle.com/datasets kaggle] or [http://archive.ics.uci.edu/ml/index.php here]. You can also choose any other dataset or project for your thesis/other classes. In case that you are not generating the features yourself (for example from images) it is necessary for the database to contain at least 500 objects with 10 features. Since this will be a classification task it is necessary to determine what you want to classify. I will personally approve your selected database. The data of the approval is '''TBA'''.
 +
 
 +
* You have to use at least one selection method (forward/backward) or a reduction method (PCA, ICA, LSA, LDA, CCA, PLS) for features. If possible you should also use some other form of feature preprocessing.
 +
 
 +
* You have to use at least 2 algorithms for classification (SVM, Linear classifier, ANN, SOM, Forests, Bayes, kNN). Test the classification both with and without feature selection/reduction.
 +
 
 +
* You have to evaluate all of the selected approaches to classification. Do not forget to split the data into train/val/test. You have to evaluate the classification accuracy using ROC curves, confusion matrices or precision and recall metrics. You have to perform the evaluation for models where you both did and did not apply feature selection/reduction.
 +
 
 +
In the preliminary report you will have to describe the database and the features it contains. You will have to specify what your goal is and which methods you want to use. The preliminary report deadline is '''23.4.2020'''.
  
Vo finálnom reporte taktiež popíšte databázu, napíšete aké metódy ste použili, prečo ste ich použili a ako ste ich použili. Hlavná časť reportu bude spočívať vo vyhodnotení a porovnaní výsledkov jednotlivých postupov. Report bude taktiež v pdf a bude nutné ho poslať mailom do '''12.5.2019'''.
+
The final report has to include the description of the database and the methods you have used along with an explanation of why you chose the methods and how you applied them. The most important part of the report will be the evaluation where you evaluate all of the approaches you have used. The report has to be a PDF file. The report deadilne is '''18.5.2020 16:00'''.
  
Prezentácia bude obsahovať rovnaké informácie ako report. Zhodnotíte v nej aj klady a zápory metód ideálne na konkrétnych príkladoch a neformálne závery (ako náročné boli rôzne postupy, kde boli úskalia atď.). Prezentácie sa budú preztentovať na cvičení '''14.5.2019'''.  
+
You will also be required to prepare a presentation with the same information as in the report. You should include positives and negatives of your selected approaches. You should evaluate the positives and negatives of the chosen methods. You can also present some informal conclusions (difficulties you had to overcome, what did not work etc.). The presentations will be presented at the last lab session '''18.5.2020'''.
  
Podmienky sú taktiež v minuloročnej [http://www.sccg.sk/~haladova/ROProjekty.pdf prezentácii].
 
  
 
<!--
 
<!--

Verzia zo dňa a času 20:07, 5. júl 2020

Rozpoznávanie obrazcov 2-AIN-204


Toto je stránka k predmetu Rozpoznávanie obrazcov Informačný list predmetu >

Ľudia podieľajúci sa na výučbe

Prednášajúci
[Milan Ftáčnik]
Cvičiaci
[Viktor Kocur]


Kontakty

Oficiálna stránka kurzu
https://dai.fmph.uniba.sk/w/Course:Rozpoznavanie_obrazcov/sk


Organizácia výučby

Prednášky
Cvičenia
  • 1. cvičenie - Príznaky
  • 2. cvičenie - Štatistika I
  • 3. cvičenie - Štatistika II
  • 4. cvičenie - Informačno-teoretické miery
  • 5. cvičenie - PCA, LDA
  • 6. cvičenie - Lineárny klasifikátor, SVM
  • 7. cvičenie - kNN
  • 8. cvičenie - Naivný Bayesov klasifkátor, Validácia
  • 9. cvičenie - Validácia, Rozhodovacie stromy
  • 10. cvičenie - Neurónové siete


Všetky prezentácie a ostatné materiály sú aj na githube pod zložkou RO.



Bodovanie cvičení

Bodovacia Tabuľka

Dohromady je možné z cvičení získať 40 bodov. Pre pripustenie k skúške je nutné získať aspoň 20 bodov (50%).

10 bodov bude udelených v priebehu semestra za aktívnu účasť na cvičeniach. 5 bodov bude udelených za predbežný report k projektu, ktorý bude nutné odovzdať pár týždňov pred koncom semestra. 25 bodov bude udelených za prezentáciu a finálny report k projektu. Projekty budú prezentované na konci semestra.

Projekty

Projekt sa bude skladať zo 4 častí: výber databázy, výber/redukcia príznakov, klasifikácia dát a vyhodnotenie.

  • Možné úlohy/databazy na kaggle alebo napr. tu. Rovnako môžete navrhnúť vlastné datasety, alebo úlohy do diplomiek/na iné predmety. V prípade, že nebudete generovať príznaky samostatne (napr. z obrázkov) tak je nutné aby mala databáza aspoň 10 príznakov a aspoň 500 objektov. Keďže ide o klasifikáciu, tak si rozmyslite čo budete v databáze klasifikovať. Databázy sa budú schvaľovať na cvičeni TBA.
  • Bude sa očakávať, že použijete aspoň jednu metódu na výber (napr. dopredný, spätný) alebo redukciu (napr. PCA, ICA, LSA, LDA, CCA, PLS) príznakov. Ak to bude vhodné skúste použiť aj inú predúpravu príznakov.
  • Na klasifikáciu vyskúšate aspoň 2 algoritmy. Napr. SVM, Lineárny klasifikátor, ANN, SOM, Stromy, Bayes, kNN atď. Klasifikáciu otestuje aj bez toho aby ste použili výber/redukciu príznakov.
  • Výsledky klasifikácie vyhodnotíte. Nezabudnite na rozdelenie dát na train/val/test. Ako vyhodnotenie môžete uvádzať presnosť v percentách, ROC krivky, matice zámen. Porovnajte použité klasifikátory s aj bez výberu/redukcie príznakov.

V predbežnom reporte popíšete databázu, zhrniete vlastnosti príznakov, určíte váš cieľ čo na nej chcete klasifikovať a metódy ktoré chcete použiť. Predbežný report je potrebné poslať mailom do 23.4.2020.

Vo finálnom reporte taktiež popíšte databázu, napíšete aké metódy ste použili, prečo ste ich použili a ako ste ich použili. Hlavná časť reportu bude spočívať vo vyhodnotení a porovnaní výsledkov jednotlivých postupov. Report bude taktiež v pdf a bude nutné ho poslať mailom do 18.5.2020 16:00.

Prezentácia bude obsahovať rovnaké informácie ako report. Zhodnotíte v nej aj klady a zápory metód ideálne na konkrétnych príkladoch a neformálne závery (ako náročné boli rôzne postupy, kde boli úskalia atď.). Prezentácie sa budú preztentovať na cvičení 18.5.2020.

Projects (EN)

The project will contain 4 parts: database selection, selection/reduction of features, classification and evaluation.

  • You can select a database on kaggle or here. You can also choose any other dataset or project for your thesis/other classes. In case that you are not generating the features yourself (for example from images) it is necessary for the database to contain at least 500 objects with 10 features. Since this will be a classification task it is necessary to determine what you want to classify. I will personally approve your selected database. The data of the approval is TBA.
  • You have to use at least one selection method (forward/backward) or a reduction method (PCA, ICA, LSA, LDA, CCA, PLS) for features. If possible you should also use some other form of feature preprocessing.
  • You have to use at least 2 algorithms for classification (SVM, Linear classifier, ANN, SOM, Forests, Bayes, kNN). Test the classification both with and without feature selection/reduction.
  • You have to evaluate all of the selected approaches to classification. Do not forget to split the data into train/val/test. You have to evaluate the classification accuracy using ROC curves, confusion matrices or precision and recall metrics. You have to perform the evaluation for models where you both did and did not apply feature selection/reduction.

In the preliminary report you will have to describe the database and the features it contains. You will have to specify what your goal is and which methods you want to use. The preliminary report deadline is 23.4.2020.

The final report has to include the description of the database and the methods you have used along with an explanation of why you chose the methods and how you applied them. The most important part of the report will be the evaluation where you evaluate all of the approaches you have used. The report has to be a PDF file. The report deadilne is 18.5.2020 16:00.

You will also be required to prepare a presentation with the same information as in the report. You should include positives and negatives of your selected approaches. You should evaluate the positives and negatives of the chosen methods. You can also present some informal conclusions (difficulties you had to overcome, what did not work etc.). The presentations will be presented at the last lab session 18.5.2020.


Body