Přejít k hlavnímu obsahu

Přihlášení pro studenty

Přihlášení pro zaměstnance

Publikace detail

Využití genetických algoritmů pro pěstování rozhodovacích stromů
Rok: 2008
Druh publikace: článek ve sborníku
Název zdroje: Sborník příspěvků z VIII. mezinárodní konference studentů doktorských studijních programů IMEA 2008
Název nakladatele: Technická univerzita v Liberci
Místo vydání: Liberec
Strana od-do: 816-823
Tituly:
Jazyk Název Abstrakt Klíčová slova
cze Využití genetických algoritmů pro pěstování rozhodovacích stromů Data mining (DM) je pojem, který zastřešuje pestrou paletu nejrůznějších metod používaných v celé řadě odvětví. Nejčastěji se chápe jako součást "dobývání znalostí z databází" (Knowledge Discovery in Databases, KDD) a to jako aplikaci vybrané analytické metody (často kombinaci metod různých) pro objevení zajímavých vztahů, struktur či vazeb v datech. Obvyklým problémem v dataminingu je najít odpovídající klasifikační model pro daný datový soubor, nebo-li model, který dokáže rozdělit objekty souboru do několika předem daných tříd. Oblíbeným typem klasifikátoru je klasifikační strom - rozhodovací strom (decision tree - DT), definující klasifikační funkci. Genetické algoritmy (GA) jsou stochastické optimalizační algoritmy, které vycházejí z principů genetiky a přirozeného výběru. Populace se skládá z chromozomů, které reprezentují jednotlivá řešení problému. Na základě fitness funkce jsou náhodně vybráni jedinci a z nich je pomocí základních genetických operátorů tvořena populace nová, ve které tak v dalších generacích postupně krystalizuje optimální řešení. Tato práce se zabývá využitím genetických algoritmů pro pěstování rozhodovacích stromů. Jsou zde ukázány hlavní způsoby pěstování rozhodovacích stromů a nastíněny některé algoritmy pro jejich konstrukci evolučním přístupem popsané v literatuře. Výsledné klasifikátory vypěstované pomocí zmíněných genetických algoritmů pro pěstování rozhodovacích stromů jsou z hlediska přesnosti a velikosti porovnány mezi sebou i s klasifikátory vytvořenými tradičními algoritmy jako C4.5, OC1 nebo CART. data mining, klasifikace, rozhodovací stromy, genetické algoritmy
eng Usage of Genetic Algorithms in Creating of Decision Trees Data mining (DM) is a term, which cover a wide range of all sorts of methods used in a number of segments. It is most often understand as a part of knowledge discovery in databases (KDD), as an application of chosen analytical method (often combination of several different methods) by reason of discovery of interesting relations or structures in data. The usual problem in data mining is to find corresponding classification model for given data file, or a model, which can separate objects of file into a few predefined classes. Popular type of classifier is a classification tree - a decision tree (DT), which defines classification function. Genetic algorithms (GA) are stochastic optimization algorithms, which results from axioms of genetics and natural selection. Population consists of chromosomes, which represents single solutions of a problem. The individuals are randomly selected based on a fitness function and the new generation is created from them using basic genetic operators. The optimal solution is step by step developed in following generations. This paper describes usage of genetic algorithms in creating of decision trees. The main methods for creating of decision trees and genetic algorithms for creating of DT described in literature are shown. Resulting classifiers created by genetic approach are compared in light of accuracy and size with each other and with classifiers created by traditional algorithms like C4.5, OC1 or CART. data mining, classification, decision trees, genetic algorithms