What is Data Mining ?
“Proses mengidentifikasi pola yang valid, baru, berpotensi berguna, dan pada akhirnya dapat dipahami dari data yang tersimpan dalam database terstruktur” (Fayyad, 1996).
“Proses Menemukan korelasi baru, pola dan tren dengan memilah-milah sejumlah besar Data yang disimpan di repositori, menggunakan teknologi pengenalan pola serta teknik statistik dan matematis.” (Hamm, 2007)
Data Mining dapat membantu dalam hal :
- Memprediksi perilaku pelanggan (Classification)
- Memprediksi atau memperkirakan nilai (Regression)
- Segmen populasi (Clustering)
- Mengidentifikasi faktor yang lebih berhubungan dengan masalah bisnis (Attribute Importance)
- Menemukan profil orang atau item yang ditargetkan (Decision Trees)
- Menentukan hubungan penting dan ” market baskets ” di dalam populasi (Associations)
- Menemukan kecurangan atau “rare events” (Anomaly Detection)
Simple Taxonomy Data Mining
Simple Taxonomy Data Mining (Learning Method)
Supervised vs. Unsupervised Learning
- Supervised learning (classification)
- Supervision: Data training (observasi, pengukuran, dll.) Disertai label yang menunjukkan kelas pengamatan
- Data baru dikelompokkan berdasarkan data set training
- Unsupervised learning (clustering)
- Label kelas data training tidak diketahui
- Menggunakan seperangkat pengukuran, observasi, dll dengan tujuan membangun keberadaan kelas atau cluster dalam data.
Oracle Data Mining Algorithms
Oracle SQL Developer Data Miner GUI
Data Exploration
Workflow
Generate Multiple Model
Model Evaluation
Graphical Representation
Oracle Data Miner Nodes (Partial List)
ODM Data Dictionary
- ALL_DATA_MINING_MODELS
Describes the high level information about the data mining models in the database - ALL_MINING_MODELS_ATTRIBUTES
Describes the attributes of the data mining models - ALL_MINING_MODELS_SETTINGS
Describes the setting of the data mining models
Using the Model
- Bulk Processing
- Real Time Use
Prediction SQL Function
Misal Model klasifikasi XYZ, memiliki parameter A,B,C untuk memprediksi apakah akan ‘Y’ atau ‘N’
Command :select prediction_probability(<NAMA_MODEL>, <NILAI_PREDIKSI> USING <KOLOM_PARAMETER>) from <NAMA_TABEL>;
Contoh :
select prediction_probability(XYZ, ‘Y’ USING A,B,C) from tabel_target;
atau
select prediction_probability(XYZ, ‘Y’ USING ‘nilai-1’ as A, ‘nilai-2’ as B, ‘nilai-3’ as C) from dual;
Output -> Nilai prediksi misal 0,8909888
0 Comments