Název projektu
Zpracování a analýza rozsáhlých dat s využitím GPU 2
Kód
SP2013/70
Řešitel
Období řešení projektu
01. 01. 2013 - 31. 12. 2013
Předmět výzkumu
Dnešní doba generuje velké množství dat, které je většinou jen ukládáno případně rovnou zahazováno bez většího využití. Jedná se zejména o data z technologických celků, jež jsou vybavovány množství sensorů a čidel, dále pak o data o produkci energie pomocí obnovitelných zdrojů, které pak svojí těžkou předvídatelností komplikují jejich zapojení do energetické sítě, snímání bio signálů lidského těla, které může sloužit pro možnost prevence nemocí, dat ze sociálních sítí, které umožňují analyzovat vazby mezi jednotlivými aktéry, anebo dat vzniklých sekvencovánim genomu lidé nebo jiných organizmů. Ve všech případech se jedná o data velmi rozsáhlá, jež je velmi těžké analyzovat pomocí sekvenčního přístupu, případně vizualizovat dosažené výsledky v přehledné formě.
Vzhledem k dnešnímu trendu, který místo masivního výkonu pro sekvenční operace upřednostňuje paralelizaci pomocí více jader, ubírá se i náš výzkum tímto směrem. Velmi moderní přístupy spočívají ve využití paralelních výpočtu. Předmětem výzkumu bude návrh a implementace metod redukce dimenze, shlukové analýzy, hledání vzorů, komprese dat a dalších pomocí paralelizace a to tak, abychom využili maximálně jednotlivé platformy pro paralellizaci. Uvedené algoritmy budou využity při řešení problémů z oblastí: predikce hodnot na základě historických dat v průmyslových celcích, analýza sociálních sítí a komunit a predikce jejich chování, detekce zájmových oblastí v obrazových datech, podobnost obrázků a dokumentů, zpracování signálů mozku a jejich využití v rozhraní člověk-stroj, zpracování DNA dat získaných jejich sekvencováním a dalších.
V návaznosti na předchozí projekt, který byl řešen v minulém roce, bude tento rok přistoupeno k návrhu práci s algoritmy, které zatím nebyly řešeny, návrhům kombinace výpočetních platforem tak, aby bylo dosaženo co nejlepších výsledků, sjednocování postupů a algoritmů pro jejich pozdější snadné nasazení atd. Úplně novým řešeným tématem je pak práce s DNA daty, která bude spočívat v jejich uspořádávání, hledání odchylek a vzorů, kompresi atd.
Členové řešitelského týmu
prof. Ing. Jan Platoš, Ph.D.
prof. Ing. Pavel Krömer, Ph.D.
doc. Ing. Petr Gajdoš, Ph.D.
prof. RNDr. Václav Snášel, CSc.
RNDr. Eliška Ochodková, Ph.D.
doc. Mgr. Miloš Kudělka, Ph.D.
Ajith Abraham Padath, PhD.
Mgr. Hussein Khaled Hussein Soori
Ing. Michal Prílepok, Ph.D.
Mgr. Tomáš Novosád, Ph.D.
RNDr. Ing. Martin Radvanský, Ph.D.
Ing. Lukáš Zaorálek
Ing. Petr Berek
Mgr. Šárka Zehnalová
Ing. Jonáš Krutil
Ing. Pavel Dohnálek, Ph.D.
Ing. Jan Janoušek
Ing. Tomáš Buriánek
Ing. Tomáš Ježowicz
Ing. Daniel Robenek
Specifikace výstupů projektu (cíl projektu)
Cílem projektu je pokračovat ve výzkumu v oblasti efektivních metod pro zpracování rozsáhlých dat za pomocí klasických procesorů a grafických akcelerátorů. Oproti minulému roku je plánována podpora pro nové typy akcelerátorů ve formě platformy many-integrated cores a také využití novinek na platformě CUDA souvisejících s možností rekurzivního volání metod. Dále bude doplněna knihovna algoritmů a funkcí pro zjednodušení experimentů a analýzy dat. V projektu bude pracovat několik týmů na jednotlivých aspektech problematiky. Velký zřetel bude kladen na práci s reálnými daty a řešení problémů z praxe, tedy zejména na aplikovaný výzkum. Studenti doktorského i magisterského studia naleznou v tomto projektu velké uplatnění, neboť práce nad reálnými daty a řešení reálných problémů je bude kromě poznání motivovat také aplikací výsledků v reálném životě. To jim umožní zapojit se do výzkumu a vývoje i v dlouhodobém horizontu. Projekt navazuje na projekt z roku 2012 a na tento rok si klade následující cíle:
- Předzpracování rozsáhlých dat a jejich příprava na experimenty.
- Implementace dalších metod pro analýzu rozsáhlých dat s podporou paralelních CPU, GPU a MIC platformy.
- Provádění experimentů s daty z oblastí energetiky, sociálních sítí, DNA sekvencování a jiných.
- Publikování výsledku na konferencích indexovaných v ISI a příprava a publikace článků v časopisech s impaktním faktorem.
- Navázání a prohloubení spolupráce se zahraničními pracovišti.