What is Data Mining ?

“Proses mengidentifikasi pola yang valid, baru, berpotensi berguna, dan pada akhirnya dapat dipahami dari data yang tersimpan dalam database terstruktur” (Fayyad, 1996).

“Proses Menemukan korelasi baru, pola dan tren dengan memilah-milah sejumlah besar Data yang disimpan di repositori, menggunakan teknologi pengenalan pola serta teknik statistik dan matematis.” (Hamm, 2007)

Data Mining dapat membantu dalam hal :

  • Memprediksi perilaku pelanggan (Classification)
  • Memprediksi atau memperkirakan nilai (Regression)
  • Segmen populasi (Clustering)
  • Mengidentifikasi faktor yang lebih berhubungan dengan masalah bisnis (Attribute Importance)
  • Menemukan profil orang atau item yang ditargetkan (Decision Trees)
  • Menentukan hubungan penting dan ” market baskets ” di dalam populasi (Associations)
  • Menemukan kecurangan atau “rare events” (Anomaly Detection)

Simple Taxonomy Data Mining

Simple Taxonomy Data Mining (Learning Method)

Supervised vs. Unsupervised Learning

  • Supervised learning (classification)
    • Supervision: Data training (observasi, pengukuran, dll.) Disertai label yang menunjukkan kelas pengamatan
    • Data baru dikelompokkan berdasarkan data set training
  • Unsupervised learning (clustering)
    • Label kelas data training tidak diketahui
    • Menggunakan seperangkat pengukuran, observasi, dll dengan tujuan membangun keberadaan kelas atau cluster dalam data.

Oracle Data Mining Algorithms

Oracle SQL Developer Data Miner GUI

Data Exploration

Workflow

Generate Multiple Model

Model Evaluation

Graphical Representation

Oracle Data Miner Nodes (Partial List)

ODM Data Dictionary

  1. ALL_DATA_MINING_MODELS
    Describes the high level information about the data mining models in the database
  2. ALL_MINING_MODELS_ATTRIBUTES
    Describes the attributes of the data mining models
  3. ALL_MINING_MODELS_SETTINGS
    Describes the setting of the data mining models

Using the Model

  1. Bulk Processing
  2. Real Time Use
    Prediction SQL Function
    Misal Model klasifikasi XYZ, memiliki parameter A,B,C untuk memprediksi apakah akan ‘Y’ atau ‘N’
    Command :
    select prediction_probability(<NAMA_MODEL>, <NILAI_PREDIKSI> USING <KOLOM_PARAMETER>) from <NAMA_TABEL>;
    Contoh :
    select prediction_probability(XYZ, ‘Y’ USING A,B,C) from tabel_target;
    atau
    select prediction_probability(XYZ, ‘Y’ USING ‘nilai-1’ as A, ‘nilai-2’ as B, ‘nilai-3’ as C) from dual;
    Output -> Nilai prediksi misal 0,8909888

Categories: Data Mining

0 Comments

Leave a Reply

Avatar placeholder

Your email address will not be published. Required fields are marked *