LAPORAN KLASIFIKASI
Nama Kelompok:
- Hendriyanto 14.01.53.0117
- Ahmad Fuad 14.01.53.0118
- Rahmad Bayu Sejati 14.01.53.0133
UNIVERSITAS STIKUBANK (UNISBANK)
SEMARANG
2018
BAB I
PENDAHULUAN
- Deskripsi Permasalahan
Badan Kepegawaian Daerah merupakan Badan Pemerintah yang berperan sebagai Penyelenggaraan Pengadaan dan Seleksi Calon Pegawai serta penempatan pegawai di lingkungan Pemerintah Kabupaten Banjarnegara. Salah satu tugas dan wewenang BKD atas pelaksaan tugas kedinasan yang diberikan oleh Pemerintah Kabupaten Banjarnegara untuk melahirkan pegawai yang memiliki kemampuan baik dan kompeten di bidangnya yaitu dengan cara menyelenggarakan pelayanan umum bidang pengembangan pegawai, mutasi, pengangkatan dan kepangkatan, dalam rangka pelaksanaan urusan pemerintah bidang kepegawaian yang ditentukan dalam menjalankan tugas pengadaan dan manajemen kepegawaian sesuai formasi yang dibutuhkan setiap unit/organisasi badan.
Melihat jumlah penduduk yang cukup padat (rasio beban kerja) dan pelamar luar daerah yang melamar, Pemerintah belum bisa memberi kepastian tentang jumlah Pegawai Negeri Sipil yang dibutuhkan dan yang harus direkrut kemudian diangkat setiap tahunnya masih belum dapat dihitung secara baik.Oleh sebab itu, alasan mengapa Pelaksanaan Pengadaan Pegawai, Mutasi dan Penempatan Pegawai di Lingkungan Pemerintah Kabupaten Banjarnegara diadakan.Salah satunya, berita dari tahun ke tahun dan opini yang beredar di kalangan masyarakat, penerimaan pegawai masih diwarnai kegiatan daerahisme, nepotisme, kolusi, spoil, sehingga kualitas SDM-PNS yang diterima sebagi pegawai masih rendah. Sebagai langkah dan solusi yang diajukan sebagai penyelesaian terhadap uraian diatas maka penulis tertarik untuk mengklasifikasi suatu permasalahan sistem data mining yang mudah digunakan dan dapat menyajikan informasi relevan dan akurat yaitu mengklasifikasi data mining untuk menampilkan informasi penerimaan seleksi calon pegawai negeri sipil 2014 pada Badan Kepegawaian Daerah Kabupaten Banjarnegara menggunakan algoritma Decision tree C4.5. Sehingga pelaksanaan pengadaan CPNS dapat berjalan sesuai prosedur yang ditetapkan oleh pemerintah. Sertadapat diketahui kriteria kriteria apa saja yang dibutuhkan dalam Pelaksanaan Pegadaan dan Seleksi Calon Pegawai Negeri Sipil di Lingkungan Pemerintah Kabupaten Banjarnegara sebagai bahan klasifikasi.
Data Mining sendiri memiliki beberapa algoritma, salah satunya yaitu Decission Tree yang merupakan metode klasifikasi yang paling terkenal, mudah dan banyak diimplementasi di berbagai bidang karena sederhana, serta memiliki kemampuan akurasi yang baik untuk mengklasifikasi gundukan data yang teramat banyak. Klasifikasi merupakan proses menemukan kumpulan pola atau fungsi-fungsi yang mendeskripsikan dan memisahkan kelas data satu dengan lainnya, untuk dapat digunakan untuk memprediksi data yang belum memiliki kelas data tertentu. Jadi secara singkat, klasifikasi adalah proses untuk membedakan/memisahkan kelas.
- Rumusan masalah
- Bagaimana tingkat akurasi teknik klasifikasi data mining dengan algoritma C4.5 dalam pengimplementasian metode decision tree terhadap data penerimaan CPNS 2014?
- Bagaimana hasil data akurasi dari hasil peneltian?
BAB II
TINJAUAN PUSTAKA
- Klasifikasi
Klasifikasi adalah salah satu bentuk dari teknik atau metode data mining yang termasuk dalam kategori predictive mining yaitu suatu teknik yang dapat digunakan untuk meramalkan atau memprediksi kecenderungan data di masa depan. Proses yang terjadi dalam klasifikasi adalah proses penggolongan data ke dalam variabel target atau variabel tujuan dengan membangun sebuah model penyelesaian dengan memperhatikan atribut yang paling berpengaruh.
Klasifikasi masuk ke dalam supervised induction, dimana pengujian yang memanfaatkan kumpulan pengujian dari record dan atribut yang terklasifikasi untuk menentukan output dan kelas tambahan. Salah satu contoh algoritmanya adalah decision tree yang terkenal dan mudah dalam implementasinya ke dalam bentuk grafik.
- Metode Klasifikasi
Metode Algoritma Klasifikasi Penelitian ini menyebutkan 4 (empat) metode algoritma klasifikasi yang cenderung digunakan dalam pengembangan DM, yaitu: 1) C45, metode ini menjadi pilihan pertama yang sering digunakan dalam pengembangan DM karena kecepatan dalam pengklasifikasian pohon keputusan disamping dapat mengkonstruksi pengklasifikasian dengan aturan-aturan yang lain. 2) k-NN, beberapa hal yang menjadi perhatian dalam penggunaan algoritma ini adalah penggunaan pilihan k, jika k sangat kecil maka akan mengakibatkan noise. Sebaliknya jika terlalu besar dapat meyebabkan N dengan banyak kelas yang harus diklasifikasikan. Tetapi kesederhanaan metode menjadi nilai lebih sehingga menjadi pilihan banyak developer DM selain itu, algoritma ini mudah untuk dipahami dan diimplementasikan dalam tekniknya. Penelitian ini menyatakan bahwa banyak peneliti berpendapat bahwa algoritma ini lebih baik dari SVM berdasarkan skema pengklasifikasiannya. 3) Naive Bayes, penelitian tersebut menyimpulkan bahwa metode algoritma Naive Bayes memiliki keunggulan untuk pengembangan DM, yaitu kemudahan konstruksinya dan tidak membutuhkan parameter skema pengulangan yang kompleks sehingga mudah dalam membaca data dalam jumlah yang besar. Hal ini terjadi karena desain rancangan penuntunan klasifikasi terhadap data. Selain itu, metode ini dinyatakan sebagai algoritma yang mempunyai sifat simplicity, elegance dan robustness. 4) CART, penerapan metode algoritma ini banyak digunakan dalam berbagai bidang yang membutuhkan pengolahan data yang komprehensif. Hanya saja mekanismenya terdiri dari beberapa tahap yang bertingkat meliputi automatic class balancing, automatic missing, value handling dan allows for cost-sensitive learning, dynamic feature construction dan probability tree estimation sehingga tingkat kompleksitas menjadi pertimbangan para peneliti pemula. Hasil akhirnya adalah gambaran atribut berdasarkan prioritas kebutuhan proses.
- Komponen Klasifikasi
Komponen-komponen utama dari proses klasifikasi antara lain :
- Kelas, merupakan variable tidak bebas yang merupakan label dari hasil klasifikasi.
- Prediktor, merupakan variable bebas suatu model berdasarkan dari karakteristik atribut data yang diklasifikasi,
- Set data pelatihan, merupakan sekumpulan data lengkap yang berisi kelas dan predictor untuk dilatih agar model dapat mengelompokan ke dalam kelas yang tepat. Contohnya adalah grup pasien yang telah di-test terhadap serangan jantung, grup pelanggan di suatu supermarket, dan sebagainya.
Set data uji, berisi data-data baru yang akan dikelompokan oleh model guna mengetahui akurasi dari model yang telah dibuat.
BAB III
METODE PENELITIAN
- Objek penelitian
Data CPNS 2014
- Metode pengumpulan Data
- Data primer
data yang dikumpulkan dan diolah sendiri oleh peneliti langsung dari subjek atau objek penelitian.
- Data sekunder
data yang didapatkan tidak secara langsung dari objek atau subjek penelitian.
- Alur Penelitian
BAB IV
HASIL DAN PEMBAHASAN
- Table Data Pelamar CPNS 2014
- Konversi Data
Proses konversi data asli pelamar menjadi sebuah bilangan bulat untuk mempermudah matlab untuk melakukan proses klasifikasi.
Konversi data ini merupakan proses penting dalam perhitungan dalam sistem yang dibangun agar memudahkan pengkodean dalam pembuatan sistem.
- Table Keterangan table konversi data
- Implementasi Antarmuka
Tampilan pada gambar merupakan tampilan utama yang menampilkan menu-menu yang dapat diakses oleh user. Desain sistem yang digunakan yaitu menggunakan aplikasi Matlab yang mendukung pengoperasian data mining.
- Proses Data Training dan Data Testing
Dalam proses data mining terdapat tahap yang harus dilakukan untuk pengolahan suatu data, yaitu tahap data training dan data testing. Training set digunakan oleh algoritma klassifikasi sebagai bentuk model classifier dalam bentuk pohon keputusan.
Testing set digunakan untuk mengukur classifier sejauh mana akurat melakukan klasifikasi dengan tepat. Algoritma C4.5 akan menghasilkan pola data yang diproses guna memberikan informasi dan trend dari data tersebut. Sedangkan data testing digunakan untuk mengukur sejauh mana pohon keputusan yang dibentuk berhasil melakukan klasifikasi dengan benar.
- Pengujian Rules Terhadap Data Calon Siswa
Pengujian terhadap validitas sistem bertujuan untuk mengetahui apakah solusi yang dihasilkan oleh pohon keputusan tersebut valid atau tidak. Rules tersebut dikatakan valid jika jumlah dan nama pelamar yang dinyatakan lulus BKD dengan data set.
Pembagian data set ke dalam dua bagian , yaitu data training dan data testing. Pengujian dilakukan tiga kali dengan jumlah data training dan data testing yang berbeda. Uraiannya sebagai berikut :
- Data training 90% dan data testing 10%
- Data training 80% dan data testing 20%
- Data training 70% dan data testing 30%
Pengujian
Gambar : Hasil Data Testing 10%
Pada tabel berikut, data dengan perbandingan 90% : 10% memiliki nilai
akurasi sebesar 0.75, precision sebesar 0.375, recall sebesar 0.75 dan f-measure 0.5.
Tabel Evaluasi dan Validasi
Gambar Pohon Keputusan uji
BAB V
KESIMPULAN DAN REKOMENDASI
- Kesimpulan
Hasil penelitian yang didapat dari permasalahan yang dikembangkan disimpulkan bahwa pengimplementasian metode decision tree terhadap data penerimaan CPNS 2014 memiliki tingkat akurasi yang baik dalam menyelesaikan solusi klasifikasi dengan memanfaatkan teknik klasifikasi data mining dengan algoritma C4.5.
Hasil dari pengujian , didapatkan akurasi dari pengujian sebanyak 75% dari dataset. Sebanyak 250 pelamar yang dibagi menjadi 225 pelamar / 90% menjadi data training dan 25 pelamar / 10% menjadi data testing. Kemudian dibuatlah pohon keputusan dengan sistem yang dibangun, hubungannya untuk lebih memastikan dan mengetahui aturan atau rules yang diperoleh dari perhitungan metode yang digunakan. Jadi dengan demikian metode decision tree merupakan metode yang sesuai dalam hal penyelesaian studi kasus penerimaan calon pegawai negeri sipil 2014.
- Rekomendasi
Adapun saran yang dapat penulis sampaikan kepada kita semua yaitu agar selalu mencari tahu apa yang belum kita tahu. Dengan kata lain mencari ilmu sebagai bekal dimasa depan.
Daftar Pustaka
- Jurnal : KLASIFIKASI DATA MINING UNTUK PENERIMAAN SELEKSI CALON PEGAWAI NEGERI SIPIL 2014 MENGGUNAKAN ALGORITMA DECISION TREE C4.5.Rendragraha Kumara. Catur Supriyanto.
Tidak ada komentar:
Posting Komentar