Data science v prostředí Apache Spark

Repozitář DSpace/Manakin

Jazyk: English čeština 

Data science v prostředí Apache Spark

Zobrazit celý záznam

Není dostupný náhled
Název: Data science v prostředí Apache Spark
Autor: Hanzlík, Roman
Vedoucí: Šenkeřík, Roman
Abstrakt: Tato diplomová práce představuje téma Data Science jako nový fenomén v oblasti počítačového zpracování dat. Hlavním cílem této práce je poskytnout prvotní náhled do problematiky Data Science a v krátkosti představit její dílčí oblasti se zaměřením na Big Data a Machine Learning jako dva pilíře, které hrají v posledních letech primární úlohu v rychle se měnící době, zejména v oblasti informačních technologií, což je odvětví, které zásadním způsobem zasahuje snad už do všech oblastí lidské činnosti. Teoretická část nejprve podává přehled historie zpracování dat a informací a představuje faktory, které vedly k potřebě nového přístupu ve zpracování dat. Značná část je věnována představení metodik v oblasti zpracování dat. Neodmyslitelnou součástí je samotná definice Data Science a jejich základních komponent, Big Data včetně datového inženýrství a přehled možností a typů analýz dat. Praktická část popisuje základní koncepty Apache Spark vč. několika možností instalací jako jsou on-premise či in-cloud. Dále se zaměřuje na představení možnosti Apache Spark v rámci jeho základních komponent přímo na reálných případech použití s využitím některých veřejně dostupných datových sad. Součástí práce je sada ukázkových příkladů s funkčními řádky kódů, které demonstrují využití dané technologie.
URI: http://hdl.handle.net/10563/49953
Datum: 2021-01-15
Dostupnost: Bez omezení
Ústav: Ústav informatiky a umělé inteligence
Studijní obor: Informační technologie
Klasifikace závěřečné práce a její obhajoby: A 57488


Citace závěřečné práce

Soubory tohoto záznamu

Soubory Velikost Formát Zobrazit Popis
hanzlík_2021_dp.pdf 6.721Mb PDF Zobrazit/otevřít None
hanzlík_2021_op.pdf 132.9Kb PDF Zobrazit/otevřít None
hanzlík_2021_vp.pdf 349.1Kb PDF Zobrazit/otevřít None

Tento záznam se objevuje v následujících kolekcích

Zobrazit celý záznam

Find fulltext

Prohledat DSpace


Procházet

Můj účet