Extrakce dat z webových serverů

DSpace Repository

Language: English čeština 

Extrakce dat z webových serverů

Show simple item record

dc.contributor.advisor Šilhavý, Petr
dc.contributor.author Loutocký, Jaroslav
dc.date.accessioned 2015-07-24T12:49:28Z
dc.date.available 2015-07-24T12:49:28Z
dc.date.issued 2015-02-06
dc.identifier Elektronický archiv Knihovny UTB
dc.identifier.uri http://hdl.handle.net/10563/34115
dc.description.abstract Cílem diplomové práce je vytvoření aplikace včetně uživatelského rozhraní pro demonstraci extrakce dat z webových serverů. Počátek teoretické části se zabývá vysvětlením základních pojmů, principem samotného sběru dat a popisem dostupných nástrojů pro tzv. harvest. Následně je vhodně vybrán jeden z nástrojů, na kterém jsou principy sběru dat realizovány. Práce také obsahuje výhody a nevýhody této realizace. Posledním bodem části teoretické je výběr vhodného databázového systému pro uchování extrahovaných dat a základní popis grafického uživatelského rozhraní. V praktické části je pomocí programovacího jazyka Java vytvořena demonstrační aplikace včetně uživatelského rozhraní.
dc.format 76 s. (99 661 znaků)
dc.format.extent 113443178
dc.language.iso cs
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject extrakce dat cs
dc.subject sběr dat cs
dc.subject XPath cs
dc.subject XML cs
dc.subject web cs
dc.subject databáze cs
dc.subject web harvest en
dc.subject web scraping en
dc.subject XPath en
dc.subject XML en
dc.subject web en
dc.subject database en
dc.title Extrakce dat z webových serverů
dc.title.alternative Web Scraping
dc.type diplomová práce cs
dc.contributor.referee Toth, Dalibor
dc.date.accepted 2015-06-01
dc.description.abstract-translated The aim of this thesis is to create an application including the user interface for a demonstration of the web data extraction (web harvest or web scraping). The beginning of the theoretical part deals with explaining the basic terms, the principles of data extraction and the description of available tools, for a so-called harvest. Subsequently one of the tools is selected and the data collection principles are implemented on it. The thesis also includes advantages and disadvantages of this implementation. The last point of the theoretical part is the selection of a suitable database system for storing extracted data and basic description of the grafical user interface. In the practical part a demo application, including the user interface, is created by Java programming language.
dc.description.department Ústav informatiky a umělé inteligence
dc.thesis.degree-discipline Informační technologie cs
dc.thesis.degree-discipline Information Technologies en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Applied Informatics en
dc.thesis.degree-name Ing.
dc.thesis.degree-program Inženýrská informatika cs
dc.thesis.degree-program Engineering Informatics en
dc.identifier.stag 40133
utb.result.grade A
dc.date.submitted 2015-05-13
local.subject sběr dat cs
local.subject webové servery cs
local.subject data collection en
local.subject web scraping en
local.subject web servers en


Files in this item

Files Size Format View
loutocký_2015_dp.zip 108.1Mb Unknown View/Open
loutocký_2015_vp.pdf 179.1Kb PDF View/Open
loutocký_2015_op.pdf 169.3Kb PDF View/Open

This item appears in the following Collection(s)

Show simple item record

Find fulltext

Search DSpace


Browse

My Account