Saya mencoba analisis statistika bisnis, dari data opensource di kaggle.com:
https://www.kaggle.com/datasets/shivamb/machine-predictive-maintenance-classification
1. Dataset
Data kali ini berisi 10.000 baris dan 14 kolom. highlight sebagai berikut
| index | UDI | Product ID | Type | Air temperature [K] | Process temperature [K] | Kecepatan Rotasi [rpm] | Torsi [Nm] | Kerusakan Tool [min] | Target Failure | Failure Type |
|---|---|---|---|---|---|---|---|---|---|---|
secara garis besar data diketahui, berupa :
- UDI adalah data yang berisi nomor urut dari 1 s/d 10.000
- Product ID adalah ID number dari product
- Type : adalah penggambaran kualitas produk Low (L), Medium (M), High (H)
- Air Temperature (K) : adalah gambaran dari temperature udara sekitar
- Process Temperature (K) : adalah gambaran dari temperature di dalam sistem mesin
- Rotational Speed (Rpm) : adalah kecepatan putar pada daya 2860 W
- Torque (Nm) : adalah nilai torsi dari equipment yang berputar
- Tool Wear (Min) : Adalah nilai keausan dalam satuan menit
- Target : berisi data biner dimana 1 gagal, 0 tidak
- Failure Type : Jika target menunjukkan 1 maka failure type akan muncul jenis kerusakannya
2. Melakukan inspeksi pada keseluruhan data
Data columns (total 10 columns): # Column Non-Null Count Dtype --- ------ -------------- ----- 0 UDI 10000 non-null int64 1 Product ID 10000 non-null object 2 Type 10000 non-null object 3 Air temperature [K] 10000 non-null float64 4 Process temperature [K] 10000 non-null float64 5 Rotational speed [rpm] 10000 non-null int64 6 Torque [Nm] 10000 non-null float64 7 Tool wear [min] 10000 non-null int64 8 Target 10000 non-null int64 9 Failure Type 10000 non-null object dtypes: float64(3), int64(4), object(3) memory usage: 781.4+ KB Missing values per column: UDI 0 Product ID 0 Type 0 Air temperature [K] 0 Process temperature [K] 0 Rotational speed [rpm] 0 Torque [Nm] 0 Tool wear [min] 0 Target 0 Failure Type 0 dtype: int64
Maksud dari hasil inspeksi data di atas adalah:
- Data disimpan dalam format DataFrame atau tabel besar seperti di Excel.
- Tabel memiliki total 10.000 baris .
- Data memiliki total 10 kolom .
Non-Null Count(Hitungan Non-Kosong):
Dtype(Tipe Data):
int64:
float64:
object:
dtypessummary (Ringkasan di akhir):
float64, 4 kolom dengan tipe data int64, dan 3 kolom dengan tipe data object
3. Review Statistik Deskriptif
Dengan melihat statistik ini, dapat disimpulkan bahwa:
- Suhu Operasi (Udara & Proses):
Suhu Udara dan Proses sangat stabil karena nilai std (Simpangan Baku)
sangat kecil (sekitar 2.0 dan 1.4).- Kecepatan Rotasi & Torsi:
Kecepatan Rotasi memiliki rata-rata 1538,778 rpm. Rentang Kecepatan
(Max - Min) adalah 2886 - 1168 = 1718 rpm, yang menunjukkan variasi yang
cukup luas dalam Kecepatan.- Tool Wear (Keausan Alat):
Rata-rata keausan alat adalah 108 menit. Rentang Keausan adalah 0 s/d 253 menit.- Target (Variabel Penting):
Nilai mean adalah 0.0339. Karena nilai Target hanya 0 atau 1
(kemungkinan menunjukkan kegagalan), rata-rata 0.0339 berarti hanya sekitar
3.39% dari total observasi yang mengalami kegagalan (Target = 1). Ini
menunjukkan bahwa kegagalan adalah peristiwa yang relatif jarang.
4. Analisis Frekuensi Kegagalan5. Korelasi antara Fitur dan Kegagalan6. Visualisasi dari setiap fitur
Tidak ada komentar:
Posting Komentar