Rabu, 19 November 2025

1. Dataset : Machine Predictive Maintenance Classification (Business Statistics)

Saya mencoba analisis statistika bisnis, dari data opensource di kaggle.com:

https://www.kaggle.com/datasets/shivamb/machine-predictive-maintenance-classification

1. Dataset 

Data kali ini berisi 10.000 baris dan 14 kolom. highlight sebagai berikut

indexUDIProduct IDTypeAir temperature [K]Process temperature [K]Kecepatan Rotasi [rpm]Torsi [Nm]Kerusakan Tool [min]Target FailureFailure Type
01M14860M298.1308.6155142.800No Failure
12L47181L298.2308.7140846.330No Failure
23L47182L298.1308.5149849.450No Failure
34L47183L298.2308.6143339.570No Failure
45L47184L298.2308.7140840.090No Failure








secara garis besar data diketahui, berupa :
  • UDI adalah data yang berisi nomor urut dari 1 s/d 10.000
  • Product ID adalah ID number dari product
  • Type : adalah penggambaran kualitas produk Low (L), Medium  (M), High (H)
  • Air Temperature (K) : adalah gambaran dari temperature udara sekitar
  • Process Temperature (K) : adalah gambaran dari temperature di dalam sistem mesin
  • Rotational Speed (Rpm) : adalah kecepatan putar pada daya 2860 W
  • Torque (Nm) : adalah nilai torsi dari equipment yang berputar
  • Tool Wear (Min) : Adalah nilai keausan dalam satuan menit
  • Target : berisi data biner dimana 1 gagal, 0 tidak 
  • Failure Type : Jika target menunjukkan 1 maka failure type akan muncul jenis kerusakannya
2. Melakukan inspeksi pada keseluruhan data
Data columns (total 10 columns):
 #   Column                   Non-Null Count  Dtype  
---  ------                   --------------  -----  
 0   UDI                      10000 non-null  int64  
 1   Product ID               10000 non-null  object 
 2   Type                     10000 non-null  object 
 3   Air temperature [K]      10000 non-null  float64
 4   Process temperature [K]  10000 non-null  float64
 5   Rotational speed [rpm]   10000 non-null  int64  
 6   Torque [Nm]              10000 non-null  float64
 7   Tool wear [min]          10000 non-null  int64  
 8   Target                   10000 non-null  int64  
 9   Failure Type             10000 non-null  object 
dtypes: float64(3), int64(4), object(3)
memory usage: 781.4+ KB

Missing values per column:
UDI                        0
Product ID                 0
Type                       0
Air temperature [K]        0
Process temperature [K]    0
Rotational speed [rpm]     0
Torque [Nm]                0
Tool wear [min]            0
Target                     0
Failure Type               0
dtype: int64
Maksud dari hasil inspeksi data di atas adalah:

  • Data disimpan dalam format DataFrame atau tabel besar seperti di Excel.
  • Tabel memiliki total 10.000 baris .
  • Data  memiliki total 10 kolom .
  • Non-Null Count (Hitungan Non-Kosong):
Untuk semua kolom, angkanya adalah 10000.Karena total baris juga 10000, ini berarti semua kolom terisi penuh. Tidak ada data yang hilang di sini! (Lihat bagian Missing Value di bawah).
  • Dtype (Tipe Data):
Ini mendefinisikan jenis data di kolom:
  • int64
Bilangan bulat (contoh: 1, 50, 1000). Digunakan untuk UDI, Kecepatan, Keausan Alat, dan Target.
  • float64
Angka desimal (contoh: 300.2, 5.5). Digunakan untuk Suhu Udara, Suhu Proses, dan Torsi.
  • object
Umumnya berarti teks (String). Digunakan untuk ID Produk, Tipe, dan Tipe Kegagalan.
  • dtypes summary (Ringkasan di akhir):
Artinya: Secara total ada 3 kolom dengan tipe data float64, 4 kolom dengan tipe data int64, dan 3 kolom dengan tipe data object

3. Review Statistik Deskriptif

Dengan melihat statistik ini, dapat disimpulkan bahwa:

  • Suhu Operasi (Udara & Proses):
Suhu Udara dan Proses sangat stabil karena nilai std (Simpangan Baku) sangat kecil (sekitar 2.0 dan 1.4).
  • Kecepatan Rotasi & Torsi:
Kecepatan Rotasi memiliki rata-rata 1538,778 rpm. Rentang Kecepatan (Max - Min) adalah 2886 - 1168 = 1718 rpm, yang menunjukkan variasi yang cukup luas dalam Kecepatan.
  • Tool Wear (Keausan Alat):
Rata-rata keausan alat adalah 108 menit. Rentang Keausan adalah 0 s/d 253 menit.
  • Target (Variabel Penting):
Nilai mean adalah 0.0339. Karena nilai Target hanya 0 atau 1 (kemungkinan menunjukkan kegagalan), rata-rata 0.0339 berarti hanya sekitar 3.39% dari total observasi yang mengalami kegagalan (Target = 1). Ini menunjukkan bahwa kegagalan adalah peristiwa yang relatif jarang.

4. Analisis Frekuensi Kegagalan
5. Korelasi antara Fitur dan Kegagalan
6. Visualisasi dari setiap fitur


6. Summary Business Statistic Analysis

Dari analisis data diperoleh informasi sebagai berikut:

A. Korelasi antara type dan target
Dari visualisasi data tersebut menunjukkan bahwa tool dengan kualitas Low (L),
Medium (M), atau pun High (H) tidak memiliki korelasi yang sangat signifikan

B. Dominasi Kegagalan
Dari data menunjukkan bahwa, dominasi kegagalan bukan berasal dari mekanis,
tetapi dari Heat Dissipation Failure, Power Failure, dan Overstrain Failure.
Sedangkan dari sisi mekanis seperti Tool Wear Failure dan Random Failures bisa
dikatakan jarang terjadi. Hal ini menunjukkan bahwa untuk menjaga performance
Mesin yang harus dilakukan adalah lebih berfokus pada problem non mekanis.

C.Korelasi setiap kolom terhadap target (failure)
Dari Matriks korelasi menunjukkan hal berikut:

•Kecepatan Rotasi VS Torsi
Kecepatan rotasi VS Torsi menunjukkan nilai negatif, hal ini sangat logis
karena ciri suatu equipment rotating ketika mendapatkan load/beban/torsi tinggi
maka kecepatan berputar akan turun, dan hal itu berlaku sebaliknya. Sehingga
Hal bisa dimasukkan sebagai limit alarm untuk proses otomasi (limit alarm tripped),
dimana pada rotasi speed diberikan limit alarm batas bawah dan pada
torsi diberikan limit alarm batas atas

•Suhu Udara VS Suhu Proses
Kedua suhu berkorelasi positif kuat satu sama lain. Namun,
korelasi mereka dengan 'Target' sangat rendah, menunjukkan
bahwa variasi normal dalam suhu ini mungkin bukan pemicu utama
kegagalan mesin.


7. Rekomendasi Hasil Analisis Statisitika Bisnis
Pengambilan keputusan yang didasarkan pada data sebagai berikut:
- Prediktif Maintenance dan Setup limit alarm didasarkan pada 2 parameter
(Rotasi Speed & Torsi)
- Rotasi Speed diberikan limit alarm batas bawah, jadi dimana mesin tiba-tiba
lebih lambat maka akan terjadi tripped, atau otomatis stop. Hal ini menunjukkan
terjadinya peningkatan torsi secara signifikan
- Torsi diberikan limit alarm batas atas, jadi dimana mesin tiba-tiba
torsi meningkat maka akan terjadi tripped, atau otomatis stop. Hal ini menunjukkan
terjadinya peningkatan beban mesin secara signifikan
- Hasil kedua data akan dijadikan sebagai bahan untuk forecasting (predictive maintenance)



Tidak ada komentar:

Posting Komentar