Machine Learning
Machine Learning Process
Data collection>>Data Cleansing>>Fitur Extraction dan selection>>Model Training>>Model Evaluation>>Model Deployment dan Intergration
Basic Machine Learning Concept-Dataset
- Data Set: Keseluruhan data.
- Training set: Proses dalam membuat model, dan merupakan bagian dari data set.
- Test set: Evaluasi sebuah model. Data testing didapat dari data set.
Importance of Data Processing
(Data Cleansing)>>(Data prepocessing)>>(Data Normalization)
- Data Cleansing
- Sebagian besar data yang dikumpulkan, maka harus melewati data cleansing terlebih dahulu melalui:
- Data filtering
- Processing of lost data
- Processing of Possible execptions error
- Combination data
- Collecting data
- Dirty data
- Data asli biasanya memiliki beberapa masalah didalamnya.
- Data Conversion
- Data di encode dan dikonversi, agar komputer mengerti dan memahami maksud dari kalimat yang diberikan
- Necessary of Feature Selection
- Melakukan seleksi, ketika mau menyederhanakan sebuah model
- jika fitur yang dimiliki banyak, maka training yang dilakukan dengan menurunkan waktu training.
Feature Selection Methods-Filter
- Dengan memberikan sebuah filter dalam menyeleksi fitur.
Overall Procedure of Building a Model
- Data splitting
- Model training
- Model Verification
Classification
- Akurasi dan tingkat rekognasi: TP+TN/P+N
- Tingkat error dan missclassification rate: FP+FN/P+N
- Sensitivitas, true positive rate and recall: TP/P
- Specificity and true negative rate: TN/N
- Precision: TP/TP+FP
Komentar
Posting Komentar