Název projektu
Zpracování a pokročilá analýza bio-medicínských dat
Kód
SP2016/68
Řešitel
Školitel řešitele projektu
prof. Dr. Ing. Miroslav Pokorný
Období řešení projektu
01. 01. 2016 - 31. 12. 2016
Předmět výzkumu
Dnešní svět je doslova přehlcen daty, ať už jde o data ze sociálních sítí, měřících zařízení, DNA, biologických signálů a mnoha dalších zdrojů. Tato data sama o sobě často nemají dostatečnou vypovídací hodnotu. Důležité informace jsou v nich často skryté, na první pohled neviditelné. Pro nalezení a získání takto skrytých informací je však zpravidla potřeba využít pokročilých metod zpracování dat. K samotnému zpracování může být využito klasických statistických metod, ale také nových, nekonvenčních metod, které jsou stále ve vývoji a poskytují ve spojení s klasickými metodami silné nástroje pro dolování z dat. Bio-medicínská data, která mají specifické vlastnosti a formáty, jsou pak také předmětem nasazení mnoha doménově specifických (bio-informatických) algoritmů, např. pro alignování DNA sekvencí. Bio-medicínská data zahrnují jak velmi rozsáhlé datové soubory (sekvence DNA), jejichž zpracování stávajícími algoritmy a postupy vyžaduje masivně paralelní a distribuované přístupy, tak sice objemem menší, ale velmi komplexní datové soubory (sérové profily pacientů, EEG a EMG měření). Pokročilé metody získání informací z dat jsou aplikovatelné a přínosné pro všechny oblasti lidské činnosti (ekonomka, průmysl, bankovnictví). V rámci řešení tohoto projektu bude pozornost věnována analýze bio-medicínských dat, tj. biologických signálů jako EEG, EMG, DNA řetězců, medicínských dat jako takových (anamnézy, klinická měření), ale i datům získaných z průmyslových technologií. Pro tyto účely budou aplikovány a prováděny experimenty s metodami pro fuzzy nelineární regresní analýzu, identifikaci expertních systémů s různým typem modelu, klasifikaci, ostré či překrývající se shlukování, lineární i nelineární redukci dimenze (SVD, NMF, PCA, kernel PCA, CUR decomposition) a dalšími.
Hlavním cílem projektu je aplikovat, modifikovat a vyvíjet moderní algoritmy pro dolování z dat založené na rodině metod z oblasti výpočetní inteligence (bio-inspirované výpočty, fuzzy systémy, soft-computing, syntéza metod) pro využití ke zpracování bio-medicínských datových kolekcí. Tyto metody budou konfrontovány s výsledky tradičních, statistických, přístupů a vztah výsledků obou typů analýz bude podrobně vyhodnocen. Vznikne tak spolupráce s Katedrou aplikované matematiky a bude tak rozvíjena disciplína, která by mohla být chápana jako mezioborová. Zvláštní pozornost bude věnována datům z oblasti biomedicínského inženýrství (spolupráce s FN Olomouc). V rámci aktivity budou zkoumány jak nové algoritmy a kombinace algoritmů, tak možnosti využít nových (embedded) platforem pro energeticky a ekonomicky efektivní nasazení v praktických podmínkách (orientační analýzy vzorků v klinické praxi, detekce událostí v biologických signálech). Zejména budou zkoumány nové a vznikající platformy pro masivně paralelní a distribuované výpočty, které mají potenciál nasazení v klinických a laboratorních podmínkách.
Projekt bude navazovat na předcházející projekty řešené na Katedře informatiky a Katedře aplikované matematiky, které se již obdobné tématice věnovaly, a bude využívat poznatků, které byly v rámci těchto projektů získány.
Třemi hlavními tematickými celky, na které se projekt zaměří, jsou:
Analýza biologických signálů
Analýza EEG signálů je důležitým oborem pro pomoc lidem s tělesným postižením (paraplegie různého stupně) nebo lidem po úrazu v rámci rehabilitace při návratu do běžného života a používání různých nástrojů. V tomto roce řešení projektu se bude práce na analýze EEG signálu ubírat směrem ke zlepšení kvality detekce a klasifikace signálů. Výhledově bude zlepšené detekce využito pro ovládání robotické paže a další aplikace z oblasti robotické protetiky.
Analýza klinických dat
Velká část projektu bude věnována analýze a zpracování klinických dat, která byla získána v rámci rozličných studií lékařských pracovišť. Klasickou úlohou je v tomto směru statistické zpracování získaných dat. Trendem posledních let jsou v této oblasti pokročilé analýzy moderními nekonvenčními metodami založenými např. na bio-inspirovaných výpočtech. Tyto metody umožňují netriviální analýzy a hledání skrytých souvislostí mezi klinickými daty (před- a po-operační parametry pacientů) a např. rizikem vzniku pooperačních komplikací.
Zpracování DNA
DNA je hlavním zdrojem informací o životě, ale i o náchylnosti lidí k různým nemocem nebo komplikacím při léčení různých onemocnění. Analýza DNA jako takové, stejně jako analýza klinických dat získaných analýzou částí DNA, bude dalším oborem, kterým se budeme zabývat.
Mimo jiné se v rámci řešení projektu budeme věnovat sekvenování RNA a DNA lidského genomu, pomocí kterého je možné identifikovat nemoci u pacientů s různými genetickými vadami. Tyto genetické vady mohou způsobovat vážná onemocnění zhoubného (např. leukémie a rakovina obecně) i nezhoubného charakteru. Stejně tak lze pomocí těchto metod například zkoumat různé odmítání endoprotéz kolenního nebo kyčelního kloubu nebo vrozené vady u sportovců a tím předcházet dalším vážným komplikacím, které by mohly nastat. Jedná se o tzv. genové exprese lidských tkání – exomové sekvenování. Interpretace výsledků, stejně jako zdroj dat, je garantována tím, že máme společnou laboratoř s Fakultní nemocnicí Olomouc.
Členové řešitelského týmu
prof. Ing. Pavel Krömer, Ph.D.
prof. RNDr. Václav Snášel, CSc.
Mgr. Pavla Dráždilová, Ph.D.
doc. Mgr. Jiří Dvorský, Ph.D.
Ing. Michal Prílepok, Ph.D.
Ing. Hussam Abdulla, Ph.D.
Ajith Abraham Padath, PhD.
Ing. Jaroslav Hořejší
Ing. Michal Vašinek, Ph.D.
Ing. Jana Nowaková, Ph.D.
Ing. Michal Běloch
Ing. Lukáš Zaorálek
Ing. Petr Berek
Ing. Alisa Babskova
Mgr. Šárka Zehnalová
Ing. Pavel Dohnálek, Ph.D.
Ing. Hamoud Mubarak Aldosari
Mgr. Martin Kopka, Ph.D. MBA
Ing. Vojtěch Uher, Ph.D.
Ing. Jan Janoušek
Ing. Tomáš Buriánek
Ing. Tomáš Ježowicz
Ing. Martin Prokeš
Ing. Nour Easa Oweis
Ing. Tomáš Vantuch, Ph.D.
Hong Vu Nguyen, M.Sc.
Nguyen Huy Phuong Pham
Quoc Bao Huynh, M.Sc.
Thanh Long Nguyen
Thi Bich Ngan Nguyen
Trung Tin Tran
Ing. Van Sim Anh Pham
Van Vang Le
Ing. Varun Kumar Ojha
Ing. Lumír Balhar
Adel Hossni Mahmoud Soliman
Ing. Marie Bachratá
Ing. Žaneta Vaníčková
Ing. Jan Czopik
Ing. Klára Schenková
Ing. Josef Hrabal
Ing. Michal Čerbák
Ing. Jiří Ševčík
Ing. Michal Béreš, Ph.D.
Ing. Simona Bérešová, Ph.D.
Ing. Filip Osadník
Ing. Daniel Krpelík
Ing. Jana Nowaková, Ph.D.
prof. Dr. Ing. Miroslav Pokorný
Specifikace výstupů projektu (cíl projektu)
Cílem projektu je navázat na předcházející projekty a pokračovat tak ve výzkumu a rozvoji metod pro získávání skrytých informací z dat. Cílem tedy bude modifikovat, vyvíjet a aplikovat moderní algoritmy pro dolování z dat. Tyto algoritmy jsou založeny na skupině metod z oblasti výpočetní inteligence (bio-inspirované výpočty, fuzzy systémy, soft-computing, syntéza metod) a využívají se ke zpracování komplexních dat.
Zvláštní pozornost bude věnována datům z oblasti biomedicínského inženýrství (spolupráce s FN Olomouc) a monitorování prostředí. V rámci aktivity budou zkoumány jak nové algoritmy a kombinace algoritmů, tak možnosti využít nových (embedded) platforem pro energeticky a ekonomicky efektivní nasazení v praktických podmínkách (orientační analýzy vzorků v klinické praxi, detekce událostí v monitorovacích sítích). Zejména budou zkoumány nové a vznikající platformy pro masivně paralelní a distribuované výpočty.
V rámci projektu se bude profilovat několik týmů, které se budou věnovat zadané problematice a reálným problémům z medicínské, technologické a monitorovací praxe. V rámci řešení projektu najdou uplatnění a budou rozvíjet své znalosti a dovednosti studenti doktorského, ale i magisterského studia. Možnost zpracovávání reálných dat je totiž stále velkým lákadlem, které přináší velké množství nepředvídatelných, ale o to zajímavějších problémů. Neopomenutelným cílem je také zapojení studentů do odborné komunity v rámci možnosti publikování výsledků na konferencích a vědeckých fórech.
Projekt navazuje na projekty z roku 2012, 2013, 2014 a 2015 a v rámci řešení projektu jsou stanoveny a předpokládány tyto cíle:
• Zpracovávat reálná data získána ze spolupracujících pracovišť (FN Olomouc), biologických signálů, monitorovacích sítí a technologických procesů.
• Rozvoj nekonvenčních metod z oblasti bio-inspirovaných výpočtů, fuzzy systémů, soft-computingu, syntézy metod.
• Rozvoj statistických metod pro zpracování rozsáhlých dat.
• Rozvoj interdisciplinární spolupráce s katedrou Aplikované matematiky, ústavem OLGEN, FN Olomouc.
• Publikování výsledku na konferencích indexovaných v databázích Scopus a WoS, příprava publikace článků v časopisech s impaktním faktorem.
• Zapojování studentů do odborné komunity, navazování kontaktů se zahraničními pracovišti, prohlubování a rozšiřování spolupráce s těmito pracovišti.
• Vybudovat na Fakultě elektrotechniky a informatiky silnou kompetenci pro moderní bioinformatiku (prostřednictvím zapojených a podpořených studentů).
• Příprava a realizace speciální sekce/workshopu na mezinárodní konferenci.
• Příprava projektových záměrů a přihlášek.