Přeskočit na hlavní obsah
Přeskočit hlavičku
Název projektu
Paralelní zpracování velkých dat 2
Kód
SP2015/146
Řešitel
Období řešení projektu
01. 01. 2015 - 31. 12. 2015
Předmět výzkumu
Dnešní doba generuje velké množství dat z různých senzorů, měřících zařízení, prodejních informací, sociálních sítí, sekvencování DNA a dalších zdrojů. Velké množství těchto dat je také uloženo v různých databázích a datových skladech. Všechna tato data lze analyzovat a výsledky využít v různých odvětvích například k prevenci šíření nemocí, předvídání kvality výroby, ovládání zařízení pomocí analýzy EEG signálů, predikce závažných situací v energetických sítích, hledání vzorů a skupin lidí na sociálních sítích apod. Ve všech případech se jedná o data velmi rozsáhlá, jejichž analýza vyžaduje velký výpočetní výkon a/nebo návrh úplně nových algoritmů, které jsou schopné takováto data analyzovat. Velký výpočetní výkon je dnes dosahován zejména využitím paralelizace výpočtů pomocí standartních procesorových jader ve větších nebo menších superpočítačích a výpočetních serverech. Dále jsou čím dál tím více využívané paralelní architektury grafických procesorů a také v loňském roce představené platformě firmy Intel Many Integrated Cores (MIC). Tyto masivně paralelní architektury přináší exponenciální navýšení výkonu za cenu změny a přepracování využívaných algoritmů, které pak mohou těžit z masivní paralelizace některých operací. Nejefektivnější cestou je pak využít výhod všech architektur současně. K těmto potřebám budou využity dva výpočetní servery skupiny pro analýzu a zpracování dat. Jedná se o systémy se 40 a 82 procesorovými jádry a velkou operační pamětí a připojenými akceleračními kartami. Hlavním předmětem projektu bude analýza dat ze síťového provozu, telekomunikačních provozních údajů, DNA dat, medicínských dat, signálu EEG, zpracování obrazu, detekce plagiátů apod. Pro tyto účely budou prováděny experimenty s metodami pro klasifikaci, shlukování, redukci dimenze apod. Dále budou pokračovat práce na metodách pro řízení a provozování inteligentního domu, které započali v minulém projektu. V neposlední řadě bude velká pozornost věnována i budování knihovny algoritmů, které budou použity ve všech zmíněných oblastech stejně jako v budoucnu při implementaci projektové výuky na katedře Informatiky, tj. bude dbáno o to, aby studenti magisterských a posléze i bakalářských programů mohli aktivně přispívat k vědě a výzkumu na katedře. V návaznosti na předchozí projekty, které byly řešeny v minulých letech, je tento rok zaměřen na zpracování medicínských dat, nad kterými pracujeme ve společné laboratoři s Fakultní nemocnicí Olomouc. Dále pak na realizaci masivně paralelních a exa-scale implementacích bio-inspirovaných algoritmů za využití zmíněných paralelních technologiích.
Členové řešitelského týmu
Ing. Michal Radecký, Ph.D., MBA
prof. Ing. Jan Platoš, Ph.D.
prof. Ing. Pavel Krömer, Ph.D.
Ing. Jan Martinovič, Ph.D.
doc. Ing. Petr Gajdoš, Ph.D.
prof. RNDr. Václav Snášel, CSc.
RNDr. Eliška Ochodková, Ph.D.
Mgr. Pavla Dráždilová, Ph.D.
doc. Mgr. Jiří Dvorský, Ph.D.
doc. Mgr. Miloš Kudělka, Ph.D.
Ing. Hussam Abdulla, Ph.D.
Ajith Abraham Padath, PhD.
prof. Ing. Jan Platoš, Ph.D.
Mgr. Hussein Khaled Hussein Soori
Ing. Michal Prílepok, Ph.D.
Dipl.Ing. Pavel Dmitrievitch Bobrov
Ing. Michal Vašinek, Ph.D.
Ing. Jana Nowaková, Ph.D.
Mgr. Tomáš Novosád, Ph.D.
RNDr. Ing. Martin Radvanský, Ph.D.
Ing. Pavel Polyakov
Ing. Lukáš Zaorálek
Ing. Petr Berek
Mgr. Šárka Zehnalová
Ing. Pavel Dohnálek, Ph.D.
Mgr. Martin Kopka, Ph.D. MBA
Ing. Jan Janoušek
Ing. Tomáš Buriánek
Ing. Tomáš Ježowicz
Ing. Martin Prokeš
Ing. Nour Easa Oweis
Ing. Tomáš Vantuch, Ph.D.
Specifikace výstupů projektu (cíl projektu)
Cílem projektu je pokračovat ve výzkumu v oblasti efektivních metod pro zpracování velkých dat za pomocí klasických procesorů, grafických akcelerátoru i nové výpočetní platformy s architekturou many-integrated-cores. Hlavním cílem bude zpracování velkých dat generovaných různými systémy, například měření senzory inteligentního domu, měření EEG dat, zpracování DNA dat ze sekvencerů, zpracování rozsáhlých grafů a sociálních sítí a dalších. Velký důraz bude kladen na návrh algoritmů pro masivně paralelní zpracování ve spolupráci všech zmíněných technologií. Při řešení budou využity i nově pořízené výpočetní servery obsahující všechny technologie.

V návaznosti na předchozí projekty, které byly řešeny v minulých letech, je tento rok zaměřen na zpracování medicínských dat, nad kterými pracujeme ve společné laboratoři s Fakultní nemocnicí Olomouc. Dále pak na realizaci masivně paralelních a exa-scale implementacích bio-inspirovaných algoritmů za využití zmíněných paralelních technologiích.

V projektu bude pracovat několik týmu na jednotlivých aspektech problematiky. Velký zřetel bude kladen na práci s reálnými daty a řešení problémů z praxe, tedy zejména na aplikovaný výzkum. Studenti doktorského i magisterského studia naleznou v tomto projektu velké uplatnění, neboť práce nad reálnými daty a řešení reálných problému je bude kromě poznání motivovat také aplikací výsledků v reálném životě. To jim umožní zapojit se do výzkumu a vývoje i v dlouhodobém horizontu. Projekt navazuje na projekt z roku 2012, 2013 i 2014 a na tento rok si klade následující cíle:

• Efektivní zpracování rozsáhlých dat ze síťového provozu a provozních telekomunikačních dat.
• Pokračování v budování platformy inteligentního domu.
• Masivně paralelní a exa-scale implementace bio-inspirovaných algoritmů.
• Provádění experimentu s daty z oblastí energetiky, sociálních sítí, DNA sekvencování a jiných.
• Publikování výsledku na konferencích indexovaných v ISI a příprava a publikací článků v časopisech s impaktním faktorem.
• Navázání a prohloubení spolupráce se zahraničními pracovišti

Rozpočet projektu - uznané náklady

Návrh Skutečnost
1. Osobní náklady
Z toho
241200,- 99925,-
1.1. Mzdy (včetně pohyblivých složek) 180000,- 74571,-
1.2. Odvody pojistného na veřejné zdravotně pojištění a pojistného na sociální zabezpečení a příspěvku na státní politiku zaměstnanosti 61200,- 25354,-
2. Stipendia 362000,- 512300,-
3. Materiálové náklady 253000,- 206700,-
4. Drobný hmotný a nehmotný majetek 8800,- 9451,-
5. Služby 110000,- 120553,-
6. Cestovní náhrady 240000,- 266071,-
7. Doplňkové (režijní) náklady max. do výše 10% poskytnuté podpory 135000,- 135000,-
8. Konference pořádané VŠB-TUO k prezentaci výsledků studentského grantu (max. do výše 10% poskytnuté podpory) 0,- 0,-
9. Pořízení investic 0,- 0,-
Plánované náklady 1350000,-
Uznané náklady 1350000,-
Celkem běžné finanční prostředky 1350000,- 1350000,-