Zadání diplomové práce

Semi-supervizované učení hlubokých neuronových sítí

Semi-supervizované učení označuje učení klasifikačních a regresních modelů, pro které je k dispozici na jedné straně množina oštítkovaných dat, na druhé straně jiná, typicky mnohem větší množina neoštítkovaných dat. Vždy spočívá ve vytvoření určitého spojení mezi jednotlivými neoštítkovanými daty a jedním nebo více oštítkovanými daty. Toto spojeni může být buď ostré nebo fuzzy a vždy spočívá na nějakém druhu podobnosti mezi jednotlivými spojenými daty. Velké množství měr podobnosti, se kterými se setkáváme v tomto kontextu, sahá od vzdáleností založených na normách v eukleidovském prostoru po sémantické podobnosti reprezentované pomocí grafů. Navíc může semi-supervizované učení buď vyjít z oštítkovanýmch dat, které iniciují shlukování neoštítkovaných dat, nebo začít vytvářením shluků neoštítkovaných dat, které jsou následně přizpůsobeny dostupným oštítkovaným datům. Konečně, výzkum semi-supervizovaného učení se vzájemně ovlivňuje s výzkumem aktivního učení, které spočívá ve výběru těch neoštítkovaných dat, jejichž oštítkování je z nějakého hlediska nejužitečnější.

V tomto desetiletí jsou pravděpodobně nejpopulárnějším a nejrychleji se rozvíjejícím druhem klasifikačních i regresních modelů hluboké neuronové sítě. S nimi semi-supervizované učení dosud používalo pouze nejběžnější varianty jak přístupu vycházejícího z oštítkovaných dat, tak i přístupu vycházejícího ze shlukování neoštítkovaných dat, druhý z nich zejména pokud i shlukování je prováděno pomocí hlubokých sítí, konkrétně autoenkoderů. Výzkum důmyslnějších metod semi-supervizovaného učení je v kontextu hlubokých neuronových sítí úplně na začátku. Zvláště žádoucí by bylo využít schopnost hlubokých sítí extrahovat v průběhu učení nové, relevantnější příznaky. Důležitost výzkumu semi-supervizovaného učení hlubokých neuronových sítí je důsledkem skutečnosti, že hluboké učení potřebuje velké množství dat. Tato důležitost je zvláště vysoká v oblastech, kde je obtížné získat oštítkovaná data, buď proto, že musí být získávána experimentálně, nebo protože vyžaduje časově náročné zapojení člověka – experta, jako např. v oblastech analýza sentimentu, detekce proniknutí do sítě či detekce malware. Poslední zmíněná oblast je zamýšlenou oblastí aplikace navrženého výzkumu.

 

Semi-supervised learning of deep neural networks

Semi-supervised learning denotes learning of classification and regression models for which on the one hand a set of labelled data is available, on the other hand another, typically much larger, set of unlabelled data. It always consists in establishing some kind of connection of the items of the unlabelled data to one or more items of the labelled data. That connection can be either crisp or fuzzy and always relies on some kind of similarity between the connected data items. The plethora of similarity measures encountered in this context ranges from norm-based distances in Eucliedean spaces to graph-represented semantic similarities. Moreover, semi-supervised learning can start either from the labelled data, which initiate clustering the unlabelled data, or from forming clusters of the unlabelled data, which are subequently adapted to the available labelled data. Finally, research into semi-supervised learning mutually influences with research into active learning, which consists in choosing among the unlabelled data those that are from some point of view most useful to be labelled.

In this decade, deep neural networks are the probably most popular and most quickly developing kind of both classification and regression models. With them, semi-supervised learning has so far used only the most common variants of both the approach starting from the labelled data and the one starting from clustering the unlabelled data, the latter especially if also the clustering is performed by deep networks, in particular autoencoders. Research into more sophisticated methods of semi-supervised learning is in the context of deep neural networks only at the very beginning. Particularly desirable would be to exploit the ability of deep networks to extract new, more relevant features in the course of learning. The importance of research into semi-supervised learning of deep neural networks is a consequence of the fact that deep learning needs large amounts of data. This importance is especially high in areas where obtaining labelles is difficult, einther because they have to be obtained experimentally, or because it requires a time-consuming involvement of a human expert, such as in the areas of sentiment analysis, network intrusion detection, or malware detection. The last mentioned area is the intended application domain of the proposed research. amounts needed for deep learning, such as web content analysis, network intrusion detection, or malware detection. The last mentioned area is the intended application domain of the proposed research.

 

Doporučená literatura

·         M.J. Er, A. Kashyap, N. Wang. Deep semi-supervised learnin g using Multi-Layered Extreme Learning Machines. IEEE CYBER 2016, 457–462.

·         Z. He, H. Liu, Y. Wang, J. Hu. Generative adversarial netwo rks-based semi-supervised learning for hyperspectral image classification. Remote Sensing 9 (2017), article # 1042.

·         S. Thulasidasan, J. Bilmes. Acoustic classification usi ng semi-supervised Deep Neural Networks and stochastic entropy-regularization over nearest-neighbor graphs. IEEE ICASSP 2017, 2731–2735.

·         G. Wang, J. Qiao, X. Li, L. Wang, X. Qian. Improved Classification with Semi-superv ised Deep Belief Network. IFAC-PapersOnLine 50 (2017), 4174–4179.

·         H. Wu, S. Prasad. Semi-Supervised Deep Learning Using Pseudo Labels for Hyperspectral Image Classification. IEEE Transactions on Image Processing 27 (2018), 1259­–1270.