Häufige Muster Bergbau, auch als häufige Itemsets Bergbau bekannt ist, ist eine Technik, die für die Entdeckung Gruppen von Elementen , die häufig gemeinsam auftreten, in einer Datenbank. Laut Dr. Christian Borgelt , leitende Wissenschaftler am Europäischen Zentrum für Soft Computing , hat häufige Muster Bergbau einer der aktivsten recherchierte Themen in Data Mining seit den frühen 1990er Jahren und zahlreiche mathematische Algorithmen entwickelt worden. Frequent Pattern Mining
Häufige Muster Bergbau ist ein elementares Problem in vielen Anwendungen. Ein typisches transaktionale Datenbank - z. B. einer Datenbank , die das Verhalten der Käufer auf der Main Street beschreibt , im Versandhandel oder Online - enthält eine große Anzahl von Itemsets und stellt eine Herausforderung in Bezug auf die Entwicklung von effizienten , skalierbaren Algorithmen. Häufige Muster Mining-Algorithmen wie Apriori, Eclat und FP- Wachstum bekannt sind unter den bekanntesten .
Apriori Algorithmus
Die Apriori -Algorithmus , die zuerst von Rakesh Agrawal vorgeschlagen und Ramkrishnan Srikant des IBM Almaden Research Center im Jahr 1994 , arbeitet nach dem Prinzip , dass Itemsets gezählt werden , wenn sie in Transaktionen auftreten . Die Datenbank wird durchsucht , um häufige 1- itemsets werden die 1- itemsets verwendet, um 2- itemsets erzeugen und so weiter bis zu k- itemsets . A k- Artikelmenge wird gesagt, dass häufig , wenn und nur wenn alle ihre subitemsets häufig sind. Da es zum ersten Mal vorgeschlagen wurde , wurden zahlreiche Verbesserungen an der Apriori -Algorithmus vorgeschlagen worden
FP -growth -Algorithmus
Die FP -growth -Algorithmus - . FP steht für " Frequent Pattern" - beschäftigt eine Technik bekannt als der Algorithmus durchsucht die Datenbank, um eine Liste der häufigsten Elemente in absteigender Reihenfolge , die es verwendet , um die Datenbank in einen FP -tree komprimieren erstellen "Teile und Herrsche ". . Die FP- Baum selbst abgebaut wird , beginnend mit jedem häufige length-1 -Muster - auch als Suffix -Muster bekannt - zu einer bedingten FP- Baum, der Präfixe entsprechend Gegenstände, die mit dem ursprünglichen Muster Suffix Zusammenarbeit auftreten enthält. Die anfängliche Suffix Muster wird mit den häufigen Mustern in der bedingten FP- Baum gefunden, um Muster wachsen verkettet.
Eclat -Algorithmus
Das Apriori und FP- Wachstum Algorithmen Mine häufigen Muster aus einer Reihe von Transaktionen , die horizontal . Die Gleichwertigkeit Klasse Transformation ( Eclat -Algorithmus) - von Mohammed J. Zaki , Professor für Informatik an der Rensselaer Polytechnic Institute im Jahr 2000 vorgeschlagen - auf der anderen Seite , angeordnet Minen häufige Muster in einer Reihe von Transaktionen vertikal . Das Eclat -Algorithmus beginnt mit einem einzelnen Artikel und nutzt eine Schnittmenge zu häufigen Itemsets und Wiederholungen bestimmen , bis keine weiteren häufigen Itemsets gefunden werden kann.