Název projektu
Analýza vzorů chování v komplexních sítích
Kód
SP2013/167
Řešitel
Období řešení projektu
01. 01. 2013 - 31. 12. 2013
Předmět výzkumu
** Předmět výzkumu v rámci projektu **
Komplexní sítě jsou vhodným prostředkem, kterým zachycuje strukturu složitých systémů s velkým počtem objektů a mnoha vzájemnými vztahy. Tyto vztahy jsou extrahovány z rozsáhlých log souborů v různých oblastech (například e-learningový systém Moodle nebo multiagentni systémy). Popis objektů v takovémto systému obsahuje mnoho různých údajů. Díky analýze vzorů chování objektů jsme schopni vytvořit pro jednotlivé objekty přehlednější a stručnější profily, které je vhodně popisují a reprezentují. Vzniklý redukovaný systém je snáze zpracovatelný a použitelný pro další metody (například detekci komunit v závislosti na intenzitě vazeb, hledání podsítě objektů, která splňuje pouze určité parametry v nalezeném profilu, určení podsítě vzhledem k vybranému kontextu). Tento způsob redukce popisu objektů a nalezení vzorů chování je využitelný v různých oblastech:
1. Struktura webu
a) Automatická klasifikace uživatelů webu do kategorií a vytváření jejich profilů chování
b) Na základě logů systému používaného v organizaci identifikovat chování uživatelů a používání části systému a takto ověřit správnost návrhu webu
c) Optimalizace nebo testování navigační struktury webu
2. Multiagentní systémy
a) Ověření správnosti návrhu multiagentního systému na základě podobného chování
b) Generování profilu agenta na základě jeho chování a chování ostatních agentů
3. Obecně
a) Nalezení cílové skupiny pro specifikovanou oblast
b) Hledání lidí se zajímavým chováním – klíčoví lidé, netradičně se chovající
c) Zjišťování společného chování skupin
d) Vizualizace komplexní sítě formou grafu – vizualizace vazeb vzniklých na základě analýzy chování, zvýraznění skupin uživatelů s podobným chováním
V rámci projektu se budou zkoumat následující kroky související s extrakcí vzorů chování uživatelů a využívající komplexní sítě:
1. Průzkum článků zabývajících se analýzou vzorů chování uživatelů a vyhledání vhodných experimentálních kolekcí v různých oblastech.
2. Vytvoření komplexní sítě – ohodnocení vazeb mezi objekty pomocí podobnosti sekvencí v log souborech (metody LCS, LCSS, a další).
3. Profil objektů – pomocí hierarchického shlukování se vytváří redukovaná reprezentace objektů (na základě nalezených vzorů chování).
4. Strukturní analýza komplexních sítí – spektrální shlukování, detekce komunit v komplexní síti, překrývající se shluky.
5. Filtrování sítě na základě kontextu – využití nalezených profilů k vybrání specifické podsítě.
6. Vizualizace grafů – hierarchizovaná vizualizace grafů, přehlednější způsoby vizuální reprezentace rozsáhlých komplexních sítí, vizualizace redukovaných systému.
Aktuálním problémem, který se ve výše popsaných bodech vyskytuje, je množství dat a jejich dynamičnost. V rámci projketu se budeme chtít také zabývat tím, jak spravně do procesu zavést rozšiřování již zpracovaných výsledků o nové záznamy z logu a jak využít dynamiku komplexních sítí k predikci. Jednou z možností jak toto velké množství dat řešit je také paralelizace výpočetního procesu.
** Harmonogram **
Předkládaný projekt je plánován na dobu jednoho roku. Projekt bude zpracováván paralelně v několika úlohách:
a) komplexní rešerše, zpracování podrobného stavu současného poznání, Q1
b) práce na experimentech, výsledky experimentu budou průběžně shrnovány do technického reportu, Q1, Q2, Q3
c) obeslání konferencí indexovaných WoS, Q1 až Q3
d) zpracování poznatků do formy časopiseckého článku, výběr vhodného časopisu (časopisů), Q4
** Tabulka publikační činnosti řešitelského týmu **
| RIV body | WOS | WOS IF | Scopus
Pavla Dráždilová | 37,18 | 4 | 1 | 16
Jiří Dvorský | 206,5 | 28 | 1 | 37
Jan Martinovič | 230,8 | 28 | 2 | 53
Kateřina Slaninová | 16,5 | 4 | 1 | 18
Lukáš Vojáček | | 1 | 0 | 3
Václav Svatoň | | 0 | 0 | 3
Alisa Babskova | | 0 0 | 1
Jednotlivé sloupce tabulky obsahují:
a) RIV 2012
b) Aktuální stav publikací – celkový počet záznamů na WoS
c) Aktuální stav publikací - IF časopisy WoS
d) Aktuální stav publikací - články uvedené v databázi Scopus
** Tým **
Tým tvoří 4 zaměstnanci, 4 interní doktorandi a dále předpokládáme možné zapojení minimálně dalších 7 studentů magisterského studijního programu.
** Historie řešitelského týmu **
Akademičtí pracovníci, kteří se podílejí na řešení projektu, se již řadu let věnují výzkumu v oblastech, které jsou i předmětem tohoto projektu. Jedná se zejména o analýzu log souborů, analýzu sociálních sítí, shlukování a hledání vzorů chování. Mohou tedy kvalifikovaně vést studenty doktorského i magisterského studia a pomohou jim při řešení popsaných problémů a převodu získaných výsledků do publikací.
Vybrané publikace:
1. Snášel V., Abraham Q., Martinovič J., Dráždilová P., Slaninová K., Daradoumis T.,Xhafa F., and Martiínez-Monés A.. E-assessment of individual and group learning processes. Journal of Computational and Theoretical Nanoscience, volume 9, January, pp 286–303, 2012, ISSN 1546-1955 (IF=0.843, Web of Science)
2. Slaninová K., Kocyan T., Martinovič J., Dráždilová P., Snášel V.: Dynamic Time Warping in Analysis of Student Behavioral Patterns. Databases, Texts, Specifications, and Objects Workshop 2012 (DATESO 2012). Žernov, Rovensko pod Troskami, Czech Republic, 04/2012.
3. Kocyan T., Martinovič J., Podhorányi M., Vondrák I.: Unsupervised Algorithm for Retrieving Characteristic Patterns From Time-Warped Data Collections. The 11th International Conference on Modeling and Applied Simulation (MAS 2012). Vienna, Austria, 09/2012.
4. Slaninová K., Martinovič J., Kocyan T., Dráždilová P., Snášel V.: Left-Right Oscillate Algorithm for Community Detection used in E-learning system. CISIM 2012, Venice, Italy, 09/2012.
** Finanční náklady na řešení **
Náklady na řešení jsou navrženy tak, aby prostředky byly vynaloženy především na studenty formou stipendií a na realizaci cest na zahraniční i lokální konference. Pro cestovné předpokládáme náklady cca 30 tis. Kč na jednu zahraniční konferenci. Dále jsou alokovány peníze na nákup nových notebooků nebo úložiště dat pro možnost provádění experiment a na odborné překlady. Menší část financí je určena na odměny pro akademické pracovníky.
Členové řešitelského týmu
Ing. Jan Martinovič, Ph.D.
Mgr. Pavla Dráždilová, Ph.D.
doc. Mgr. Jiří Dvorský, Ph.D.
Ing. Kateřina Slaninová, Ph.D.
Mgr. Pavla Dráždilová, Ph.D.
Ing. Václav Svatoň, Ph.D.
Ing. Lukáš Vojáček, Ph.D.
Ing. Jaroslav Hořejší
Ing. Alisa Babskova
Ing. Radim Vavřík
Ing. Martin Golasowski, Ph.D.
Ing. Vojtěch Bojko
Ing. David Martiník
Ing. Adam Kašpar
Ing. Ondřej Witke
Bc. Pavol Kubjatko
Specifikace výstupů projektu (cíl projektu)
Cílem projektu je návrh a implementace postupů pro analýzu uživatelského chování v systémech, které v rámci svého běhu vytvářejí logy činností uživatelů. V rámci těchto postupů chceme využít metody, jakými jsou: shlukování pomocí SOM, spektrálním shlukování, algoritmy pro analýzu komplexních sítí a to včetně jejich dynamiky, metody pro vizualizaci grafů a další. Dalším cílem projektu je návrh efektivních implementací vybraných algoritmů založených na paralelizaci výpočtů. A v neposlední řadě je cílem příprava společných publikací na konferencích a v časopisech s impaktním faktorem.