Automatické klasifikace souborů na základě rozpoznávání textových bloků

DSpace Repository

Language: English čeština 

Automatické klasifikace souborů na základě rozpoznávání textových bloků

Show simple item record

dc.contributor.advisor Král, Erik
dc.contributor.author Holík, Radovan
dc.date.accessioned 2013-10-09T00:31:34Z
dc.date.available 2013-10-09T00:31:34Z
dc.date.issued 2012-02-24
dc.identifier Elektronický archiv Knihovny UTB cs
dc.identifier.uri http://hdl.handle.net/10563/22774
dc.description.abstract Tato práce spočívá ve studiu typů souborů obsahující textová data za účelem vývoje systému, který je schopen automaticky klasifikovat soubory. Hlavním cílem práce je automatické třídění souborů obsahující textová data bez podpory informací poskytnutých od souborového systému. V teoretické části je vysvětleno, jak obvykle pracují nástroje pro obnovu dat a Computer Forensics, dále je diskutován problém ohledně stanovení typu fragmentované části souboru. To je často hlavním tématem pro aplikace Computer Forensics. Mimo jiné, vyhledávání řetězců je obzvláště důležité, protože velmi často je důkaz hledán uvnitř textových dokumentů. Dále je v této části také popsána vnitřní struktura souborů PDF a Office XML. Praktická část obsahuje informace o implementaci softwarového nástroje, který je schopen z poskytnutého bloku dat získat informace, které mohou být použity pro automatickou klasifikaci dokumentu. cs
dc.format 76 cs
dc.format.extent 1588562 bytes cs
dc.format.mimetype application/zip cs
dc.language.iso en
dc.publisher Univerzita Tomáše Bati ve Zlíně
dc.rights Bez omezení
dc.subject Computer Forensics cs
dc.subject klasifikace fragmentovaných souborů cs
dc.subject PDF cs
dc.subject Office XML cs
dc.subject Computer Forensics en
dc.subject File-fragment Classification en
dc.subject PDF en
dc.subject Office XML en
dc.title Automatické klasifikace souborů na základě rozpoznávání textových bloků cs
dc.title.alternative Automatic File Classification Based on Text-data Blocks Recognition<br> en
dc.type bakalářská práce cs
dc.contributor.referee Vařacha, Pavel
dc.date.accepted 2012-06-20
dc.description.abstract-translated The thesis consists in the study of file types containing textual data for the purpose of developing an automatic file classification system. The main goal of the thesis is the automatic classification of files containing textual data without the support of the information provided by the file system. In the first part is explained how data recovery tools typically work and is discussed the problem of determining the encoding type of a file fragment. This is an important issue for Computer Forensics applications. Among these, string search is particularly relevant since very often crime evidence is searched within textual documents. In addition is described the internal structure of PDF and Office XML-based files. The analysis contains information about implementation of a software tool able to extract from a block of data the features that can be used for automatic classification of the document. en
dc.description.department Ústav automatizace a řídicí techniky cs
dc.description.result obhájeno cs
dc.parent.uri http://hdl.handle.net/10563/90 cs
dc.parent.uri http://hdl.handle.net/10563/220 cs
dc.thesis.degree-discipline Informační a řídicí technologie cs
dc.thesis.degree-discipline Information and Control Technologies en
dc.thesis.degree-grantor Univerzita Tomáše Bati ve Zlíně. Fakulta aplikované informatiky cs
dc.thesis.degree-grantor Tomas Bata University in Zlín. Faculty of Applied Informatics en
dc.thesis.degree-name Bc. cs
dc.thesis.degree-program Inženýrská informatika cs
dc.thesis.degree-program Engineering Informatics en
dc.identifier.stag 26665
utb.result.grade A
dc.date.submitted 2012-06-08
local.subject textová analýza cs
local.subject kontextuální analýza cs
local.subject klasifikace cs
local.subject texty cs
local.subject plagiáty cs
local.subject textual criticism en
local.subject contextual analysis en
local.subject classification en
local.subject texts en
local.subject plagiarism en


Files in this item

Files Size Format View
holík_2012_bp.zip 1.514Mb Unknown View/Open
holík_2012_vp.doc 289Kb Microsoft Word View/Open
holík_2012_op.doc 288.5Kb Microsoft Word View/Open

This item appears in the following Collection(s)

Show simple item record

Find fulltext

Search DSpace


Browse

My Account