Název projektu
Paralelní zpracování velkých dat
Kód
SP2014/110
Řešitel
Období řešení projektu
01. 01. 2014 - 31. 12. 2014
Předmět výzkumu
Dnešní doba generuje velké množství dat z různých senzorů, měřících zařízení, prodejních informací, sociálních sítí, sekvencování DNA a dalších zdrojů. Velké množství těchto dat je také uloženo v různých databázích a datových skladech. Všechna tato data lze analyzovat a výsledky využít v různých odvětvích například k prevenci šíření nemocí, předvídání kvality výroby, ovládání zařízení pomocí analýzy EEG signálů, predikce závažných situací v energetických sítích, hledání vzorů a skupin lidí na sociálních sítích apod. Ve všech případech se jedná o data velmi rozsáhlá, jejichž analýza vyžaduje velký výpočetní výkon a/nebo návrh úplně nových algoritmů, které jsou schopné takováto data analyzovat.
Velký výpočetní výkon je dnes dosahován zejména využitím paralelizace výpočtů pomocí standartních procesorových jader ve větších nebo menších superpočítačích a výpočetních serverech. Dále jsou čím dál tím více využívané paralelní architektury grafických procesorů a také v loňském roce představené platformě firmy Intel Many Integrated Cores (MIC). Tyto masivně paralelní architektury přináší exponenciální navýšení výkonu za cenu změny a přepracování využívaných algoritmů, které pak mohou těžit z masivní paralelizace některých operací. Nejefektivnější cestou je pak využít výhod všech architektur současně. K tomuto účelu bude využit i nově pořízený server, který kromě 42 výpočetních procesorových jader obsahuje také 2 grafické akcelerátory a jednu výpočetní kartu s platformou MIC.
Předmětem výzkumu bude návrh a implementace metod redukce dimenze, shlukové analýzy, hledání vzorů, komprese dat, zpracování DNA, analýzy EEG, zpracování obrázků, detekce plagiátů a v neposlední řadě plánování využití spotřebičů v tzv. inteligentních domech. Oblast inteligentních domů bude tento rok tvořit jednu z hlavních oblastí, které bude projekt věnován, neboť součástí projektu bude i vybudování kompletní platformy rozsáhlejšího inteligentního domu ve formě nové budovy FEI a návrh kompletních řídícího a plánovacího systému. Vybudovaná platforma bude obsahovat jak obnovitelné zdroje energie jako jsou solární panely, tak také systému pro uložení energie ve formě baterií a další potřebné součásti pro efektivní a robustní řešení inteligentního domu. V rámci tohoto projektu se počítá s částí nákladů na vybudování této platformy a zejména pak návrh a realizace řídicího systému pro efektivní management této platformy za různých klimatických a zátěžových podmínek.
V návaznosti na předchozí projekty, které byly řešeny v minulých letech, je tento rok zaměřen na návrh a realizaci platformy chytrého domu a také další rozpracování již navrhovaných algoritmů a jejich aplikace v masivnějším měřítku. Další práce bude věnování také sjednocení algoritmů a jejich návrhu pro kombinovanou platformu, která bude současně využívat jako MIC architekturu tak i standartní procesory a pokud možno také grafické akcelerátory. Tento rok také bude zahrnuta práce s DNA daty ve větším měřítku než v roce předchozím.
Členové řešitelského týmu
prof. Ing. Jan Platoš, Ph.D.
prof. Ing. Pavel Krömer, Ph.D.
doc. Ing. Petr Gajdoš, Ph.D.
prof. RNDr. Václav Snášel, CSc.
RNDr. Eliška Ochodková, Ph.D.
doc. Mgr. Miloš Kudělka, Ph.D.
Ajith Abraham Padath, PhD.
Mgr. Hussein Khaled Hussein Soori
Ing. Michal Prílepok, Ph.D.
Ing. Michal Vašinek, Ph.D.
RNDr. Ing. Martin Radvanský, Ph.D.
Ing. Lukáš Zaorálek
Ing. Petr Berek
Mgr. Šárka Zehnalová
Ing. Jonáš Krutil
Ing. Pavel Dohnálek, Ph.D.
Mgr. Martin Kopka, Ph.D. MBA
Ing. Vojtěch Uher, Ph.D.
Ing. Jan Janoušek
Ing. Tomáš Buriánek
Ing. Tomáš Ježowicz
Ing. Daniel Robenek
Ing. David Pešek
Specifikace výstupů projektu (cíl projektu)
Cílem projektu je pokračovat ve výzkumu v oblasti efektivních metod pro zpracování velkých dat za pomocí klasických procesorů, grafických akcelerátoru i nové výpočetní platformy s architekturou many-integrated-cores. Hlavním cílem bude zpracování velkých dat generovaných různými systémy, například měření senzory inteligentního domu, měření EEG dat, zpracování DNA dat ze sekvencerů, zpracování rozsáhlých grafů a sociálních sítí a dalších. Součásti projekt bude i spolupráce na vytvoření platformy pro inteligentní dům většího rozsahu v nové budově FEI. Velký důraz bude kladen na návrh algoritmů pro masivně paralelní zpracování ve spolupráci všech zmíněných technologií. Při řešení bude využit i nově pořízený výpočetní server obsahující všechny technologie.
V projektu bude pracovat několik týmu na jednotlivých aspektech problematiky. Velký zřetel bude kladen na práci s reálnými daty a řešení problémů z praxe, tedy zejména na aplikovaný výzkum. Studenti doktorského i magisterského studia naleznou v tomto projektu velké uplatnění, neboť práce nad reálnými daty a řešení reálných problému je bude kromě poznání motivovat také aplikací výsledků v reálném životě. To jim umožní zapojit se do výzkumu a vývoje i v dlouhodobém horizontu. Projekt navazuje na projekt z roku 2012 i 2013 a na tento rok si klade následující cíle:
• Předzpracování rozsáhlých dat a jejich příprava na experimenty.
• Vybudování platformy inteligentního domu v budově FEI.
• Implementace dalších metod pro analýzu rozsáhlých dat s podporou paralelních CPU, GPU a MIC platformy.
• Provádění experimentu s daty z oblastí energetiky, sociálních sítí, DNA sekvencování a jiných.
• Publikování výsledku na konferencích indexovaných v ISI a příprava a publikací článků v časopisech s impaktním faktorem.
• Navázání a prohloubení spolupráce se zahraničními pracovišti