DATA MINING UNTUK MENDIAGNOSA PENYAKIT INFEKSI SALURAN .

3y ago
36 Views
2 Downloads
433.94 KB
9 Pages
Last View : 11d ago
Last Download : 3m ago
Upload by : Mollie Blount
Transcription

DATA MINING UNTUK MENDIAGNOSA PENYAKIT INFEKSISALURAN PERNAFASAN (ISPA)MENGGUNAKAN METODE NAIVE BAYESPindan Jati Kusuma A12.2009.03424Program Studi Sistem Informasi – S1 , Fakultas Ilmu KomputerUniversitas Dian Nuswantoro, Jl.Nakula I No.5-11 Semarang 50131Pindanjati01@gmail.comABSTRAKKemajuan peradaban manusia berkembang pesat di segala bidang kehidupan sehingga ilmupengetahuan dan teknologi menjadi bagian yang tidak terpisahkan. Dampak penggunaanteknologi dan modernisasi melahirkan industri yang berpengaruh besar terhadap penyebabpenyakit Infeksi Saluran Pernafasan (ISPA). Berdasarkan data UNICEF/WHO pada tahun2009 ISPA merupakan pembunuh balita pertama di dunia. Penelitian dibidang kesehatanuntuk memprediksi pasien penderita ISPA, berdasarkan gejala-gejala penyakit, perludilakukan untuk pengobatan lebih dini, guna mencegah kematian akibat terlambatnyapenanganan. Beberapa penelitian terkait prediksi penyakit menggunakan teknik data miningklasifikasi sudah secara luas digunakan. Penelitian ini menggunakan algoritma Naïve BayesClassifier sebagai salah satu algoritma klasifikasi data mining. Algoritma naïve bayesditerapkan untuk menghitung probabilitas kemungkinan seseorang pasien dengan gejalagejala tertentu apakah mengidap penyakit ISPA atau tidak. Obyek penelitan dilakukan padaPuskesmas Toroh 1 Kabupaten Grobogan untuk mengambil dataset pasien. Dataset memuat39 atribut, 32 diantaranya merupakan atribut gejala-gejala penyakit, dengan total databerjumlah 1010 baris data. Hasil pemodelan diukur menggunakan table confusion matrixuntuk menghitung akurasi. Pada penelitian ini terbukti naïve bayes classifier mampumenghasilkan akurasi yang tepat. Hasil dari penelitan ini dapat digunakan untuk memberikanreferensi kepada pihak petugas kesehatan dan bagi pasien dalam penyimpulan hasil analisapenyakit ISPA.Kata Kunci : Data mining, Klasifikasi, Naive Bayes, ISPA, Analisa

ABSTRACTThe progress of human civilization grew in all areas of life, that science and technologybecome the inseparable part. The impact from using of technology and modernizing createsindustry that could greatly result in the cause of the disease Infection of lower RespiratoryTract (ISPA). Based on the data UNICEF/WHO in the year 2009 ISPA is the first murderer'schildren under five years in the world. Research in health to predict patients with ISPA, basedon any symptoms of disease, needs to be done for the earlier treatment to prevent deaths fromlate handling. Some researches related to the prediction disease using technical data miningclassification has been used widely. This research uses Naïve Bayes Classifier algorithm asone of the algorithm types of data mining. Naïve Bayes Algorithm applied to calculateprobability likely whether a patient has certain symptoms of ISPA disease or not. Objects oflaboratory will be done in a health clinic at Toroh – Grobogan Regency to take data-setpatients. It has 39 attributes, including 32 symptoms of the disease attributes, with a total1010s data lines. Modeling result was measured by using table confusion matrix to calculateaccuracy. In this research has proven that Naïve Bayes Classifier is capable of producing highaccuracy in the right direction. Results of laboratory can be used to give references to thehealth officials and for patients in result a logical deduction analysis of ISPA disease.Key words : Analysis,Data mining, Classification, Naïve Bayes, ISPA1. Pendahuluanlebih dari saluran pernafasan, mulai1.1 Latar BelakangKemajuandari hidung (saluran atas) hinggaperadabanmanusiasudah semakin berkembang pesat disegalabidangkehidupan.Ilmupengetahuan dan teknologi imodern.tidakkehidupanTidakbisadipungkiri bahwa hasil modernisasimelahirkanindustriyangberpengaruhbesar terhadap penyebabpenyakit Infeksi Saluran Pernafasan(ISPA). . ISPA adalah penyakit yangmenyerang salah satu bagian ataualveoli (saluran bawah) termasukjaringan adneksanya seperti sinus,rongga telinga tengah, dan pleura,BerikutadalahperkembanganAngkaBalita atau AKABA1991 – 2007 :gambaranKematianpada tahun

Secaraanatomik,ISPAyang terjangkitpenyakitInfeksidikelompokkan menjadi ISPA atasSaluran Pernafasan (ISPA) belummisalnya batuk, pilek, faringitis, , pnemonia. ISPA adakematianjauhISPAlebihbawah.Menurut data di United NationsInternational Children's EmergencyFund (UNICEF) dan World HealthOrganization (WHO) pada tahun2009 ISPA merupakan pembunuhbalita pertama di dunia, lebih banyakdibandingkan dengan penyakit lainseperti AIDS, malaria dan campak.Di dunia setiap tahun diperkirakanlebih dari 2 juta meninggal karenaISPA (1 balita/15 detik) dari 9 jutatotal kematian balita. Di antara 5kematian balita, 1 diantaranya disebabkan oleh pneumonia. Bahkankarena besarnya kematian ISPA akanforgettenpandemic.atauBerdasarkanlatar belakang di atas maka penelititertarik untuk melakukan penelitiandi Puskesmas Toroh 1 KabupatenGrobogan dimana pada Puskesmastersebut jumlah data untuk pasienUntuk melakukan analisa datadalam jumlah besar yang tersimpanpada database, menggunakan teknikdata mining. Potensi data miningdalam bidang kesehatan sudah diakuisecara luas. Banyak studi yangdilakukan menggunakan teknik dataminingmodern,antaralainclassification dan predictive yangditerapkanpadarekammediselektronis. Dalam hal ini penulismenggunakannaïve bayesmetodeuntukalgoritmamendiagnosapenyakit ISPA. Kelebihanmetodenaïve bayes sendiri adalah mudah diimplementasi serta memberikan hasilyang baik untuk banyak kasus.Teorema Bayes adalahteoremayang digunakan dalam statistikauntuk menghitung peluang untuksuatuhipotesis,BayesOptimalClassifier menghitung peluang darisuatukelasdarimasing-masingkelompok atribut yang ada, danmenentukan kelas mana yang palingoptimal.

1.2 Rumusan MasalahBerdasarkan2.2 Langkah-langkah Data MininglatarbelakangUntukmelakukanpenggalianmasalah diatas dapat dirumuskandata, ada beberapa tahapan. Tahap-suatu masalahnya adalah bagaimanatahap tersebut bersifat interaktif diprediksi klasifikasi gejala penyakitmana pemakai terlibat langsung atauISPA dan bagaimana akurasi teknikdengan perantaraan knowledge base.klasifikasiLangkah-langkah data mining adalahdataminingmenggunakan algoritma naive bayes.:1. Data1.3 Tujuan PenelitianTujuandalampenelitianiniadalah untuk memprediksi gejalapenyakit ISPA dan mendapatkanakurasi yang tepat untuk prediksigejala penyakit ISPA g tidak konsisten) Dataintegration (di mana sumberdatayangterpecahdapatdisatukan).2. Data selection (di mana datametode naive bayes.yang relevan dengan tugasanalisis2. Tinjauan PustakaTurbadataminingadalah suatu istilah yang digunakanuntukmenguraikanpenemuanpengetahuan di dalam database. ik,matematika, kecerdasan buatan dentifikasiyangpengetahuankedalam database).2.1 Data agai database besar.dandari3. Data transformation (di manadata berubah atau bersatumenjadi bentuk yang asi agresi).4. Data mining (proses esensialdi mana metode yang intelejendigunakan untuk mengekstrakpola data).5. Patternevolution(untukmengidentifikasi pola yangbenar-benarmenarikyang

mewakilipengetahuanberdasarkanatasH:hipotesis data X merupakanbeberapatindakan yang menarik).suatu class spesifikP(H X) :probabilitas6. Knowledge presentation (dimanagambaranberdasarteknikvisualisasi dan pengetahuanyangtelahkondisiHX(posteriori probability)P(H)digunakan untuk isH(prior probabilty)P(X H) :probabilitasdiberikan kepada user).Xberdasarkondisi pada hipotesis HP(X): probabilitas dari X2.3 Algoritma Teorema BayesBayesianclassificationadalahpengklasifikasian statistik yang dapatdigunakanuntukmemprediksi2.4 Cross ValidationCross validation adalah teknikpengambilan sampel secara randomprobabilitas keanggotaan suatu class.yangBayesian classification didasarkankemunculan data yang diamati samapada teorema bayes yang memilikidengan jumlah data training dankemampuanhanya sekali pada data n decision tree dan neutralnetwor . Bayesian dantinggisaat2.5 PemodellanMetode yang digunakan yaitualgoritmaNaïveBayes.Untukdiaplikasikan ke dalam databasemenghitung data dalam penelitian inidengan data yang besar.akanTeorema Bayes memiliki bentukumum sebagai berikut :P(H X) P(X\H ) * P(H )P(X)Dalam hal ini :X: data dengan class yang belumdiketahuimenggunakanframeworkRapidMiner versi 5.3 sehingga akanditemukan nilai akurat. Di bawah inimodel yang diusulkan :

type data “Integer”2. UmurDataset.xls3. Jenis KelaminPrepocessingNew- Atribut ClassDataSettype data“Binominal”4. Gejala Penyakittype data“Binominal”ModelTraining5.Kode Penyakit- Naive bayes Datatype data“Integer”HasilAkurasi3.1 Penyeleksian Data3. Analisa Data MiningAdapun sumber data utama yangdigunakandalampenelitianiniPada data pasien selama 3 bulanterdapat beraneka ragam kategoriadalah dataset pasien dari bulanpenyakitJanuari-Maret 2013. Data tersebutpenelitian ini, penulis mengambil 15terdiri dari beberapa tabel (class)kategoriantara lain tabel register pendaftaranpenelitian, antara lain : Myalgia,dan tabel jenis penyakit. TabelHerpes,register pendaftaran berisi tentangDispepsia,informasi pendaftaran pasien yangDiabetes Mellitus, Typus, TBC,terdiri dari 5 atribut antara lain namaDiare ,pasien, umur, jenis kelamin, alamatInfluenza, Alergi.dan kode penyakit sedangkan anKatarak,Hipertensi,Bronkhitis,ISPA,Anemia,3.2 Processing / Cleaningjenis penyakit terdiri dari 2 atributantara lain kode penyakit dan gejalagejala penyakit. Dari kedua tributPada tabel registrasi pasien dantabel jenis penyakit terdapat banyakatribut, atribut-atribut tersebut tidaksemuadiperlukanpembersihanNama Pasien“Polynominal”prosesmining, maka dari itu perlu dilakukanantara lain :1.dalamtype dataataucleaningyangbertujuan memilih atribut data yangmenjadifocuspenelitiandan

menghapus atribut yang tidak dipakai.Dari kedua tabel tersebut kemudian2. Menghitung jumlah kasus yangsama dari kelas yang samadirelasikan dan atribut yang nantiakan dipakai dalam penelitian yaituUmur,Jenis Kelamin,Gejala Penyakit.Dataset hasil relasi dari kedua tabelkemudian di ubah menjadi nrapidminer.3.3 Perhitungan Data MiningBerikut perhitungan manual naïvebayes dengan menggunakan data setpada tabel 4.5 jika data terakhir di P(umur ”40” Class ISPA “yes”) ¼ 0,25 P(umur ”40” Class ISPA “no”) 1/6 0.167jadikan data training :3. Kalikan semua hasil variable Untuk semua atribut ClassISPA ”yes” P (X Class ISPA “yes”) 0,25 x 0,5 x 0 0 Untuk semua atribut ClassISPA “no”1. Menghitung jumlah kelas dariklasifikasi yang terbentuk (priorprobability) : C1 (Class ISPA “yes”) jumlah “yes” pada kolom AMclass ISPA 4/10 0.4 C2 (Class ISPA “no”) jumlah ‘no” pada kolom AMclass ISPA 6/10 0.6 P ( X Class ISPA “no”) 0,167 x 1 x 0,333 0,0556 Perkalian prior probabilitydengan semua atribut yangClass ISPA ”yes”

P (X Class ISPA “yes”)P(X Class ISPA “yes”)beberapa algoritma lain seperti neuralnetwork yang membutuhkan waktu 0,4 x 0berjam-jam 0 Perkalian prior probabilitydengan semua atribut yangClass ISPA ”no” kelebihan naïve bayes dibandingkanuntukmelakukankomputasi data.P (X Class ISPA “no”)P(X Class ISPA “no”) 0,6 x 0,0556 0,033364. Bandingkan hasil kelas P (X Class ISPA “yes”)P(X Class ISPA “yes”) P(X Class ISPA “no”) P(X Class ISPA “no”)bayesKesimpulan prediksi penyakit ISPA dengan tinyanaïvetingkatmodelbayes terbukti baik hal ini dilihat dariClass ISPA “NO”tingkat akurasinya yang mencapai( Perhitungan antara perkalianclass ISPA “yes” dengan classISPA ”no” menunjukkan bahwanilai lebih besar class ISPA “no”)100% akan tetapi hal ini perlu ditinjau ulang dari sudut pandangkompleksitas datasetnya.4. Kesimpulan dan Saran3.4Hasil Percobaan dan esdiperolehdenganditoolswaktukomputasi adalah 0 second. 0 seconddisiniartinyakomputasimenggunakan naïve bayes berjalancukup cepat. Hal ini sesuai dengan4.1 KesimpulanDari analisa data dapat di tarikkesimpulan bahwa pasien yangmempunyai gejala penyakit sesakNafas, nafas lemah, sakit kepala,hidung tersumbat, batuk, panasmemiliki potensi tinggi mengidap

faatkan metode klasifikasilainnyasepertimetodeC.4.5Puskesmas Toroh 1 yang diambil,metode nearest neighbor gunadari bulan Januari-Maret 2013 kanyangtelahsehinggadenganBayes dengan atribut yang telahmenggunakandijelaskandapat lebih mengetahui kelebihandipembahasanbanyakmetodesebelumnya, didapatkan sebuahmasing-masinghasil bahwa nilai akurasi terhadapmetode mana yang menghasilkanpenyakit ISPA mencapai 100%.nilaiDimanabaik.Metode Naïve Bayes ayangISPAmengakibatkanmodeldapatdalam hasil perhitungan PA,datayang digunakan kurang kompleks4.2 SaranDiharapkan, maka saran untuk penelitiandalampenelitianselanjutnya dapat dibandingkanselanjutnya data yang digunakanlebih kompleks dan lebih detail.

prediksi klasifikasi gejala penyakit ISPA dan bagaimana akurasi teknik klasifikasi data mining menggunakan algoritma naive bayes. 1.3 Tujuan Penelitian Tujuan dalam penelitian ini adalah untuk memprediksi gejala penyakit ISPA dan mendapatkan akurasi yang tepat untuk prediksi gejala penyakit ISPA menggunakan metode naive bayes. 2.

Related Documents:

program sistempakar yang mampu mendiagnosis penyakit pada tanaman padi organik. Disini penulis akan membuat Sistem Pakar Mendiagnosa Penyakit Dan Hama Tanaman Padi Organik Varietas IR 64 Dengan Metode Certainty Factor yang berguna untuk membantu dalam proses mendeteksi tanaman Padi.

pendeteksian Penyakit Dalam pun mahal harganya sehingga tiap rumah sakit belum pasti memiliki alat canggih dalam pendeteksian Penyakit Dalam yang serius. . yang digunakan pada pembuatan sistem pakar ini adalah Penyakit Dalam pada manusia, dengan tambahan jumlah Penyakit Dalam dari kajian terdahulu. Metode penelusuran

penyakit (Gbr. 1), dimana konsep ini menjelaskan timbulnya penyakit biotik (penyakit yang disebabkan oleh pathogen) yang di dukung oleh kondisi lingkungan dan tanaman inang. Gambar 1. Segitiga Penyakit -Komponen Untuk timbulnya suatu penyakit paling sedikit diperlukan tiga faktor yang mendukung, yaitu tanama

A. Penyakit Akibat Kerja . 1. Pengertian Penyakit Akibat Kerja Menurut Suma’mur (1985) penyakit akibat kerja adalah setiap penyakit yang disebabkan oleh pekerjaan atau lingkungan kerja. Penyakit ini artefisial oleh karena timbulnya di sebabkan oleh adanya pekerjaan. Kepadanya sering diberikan nama

Kerugian karena penyakit lahan basah Penyakit layu bakteri pisang Penyakit blas padi Penyakit CPVD Pada tahun1983, penyakit CVPD menyebabkan kerugian senilai Rp 26,4 milyar. Sementara itu direktorat jenderal pertanian tanaman pangan (1984) melaporkan bahw

mendiagnosa hama penyakit pada tanaman padi berbasis web”.Penelitian ini membahas pembuatan program aplikasi untuk mengidentifikasi hama dan penyakit tanaman padi menggunakan metode bayes, dan menggunakan bahasa pemrograman PHP dan MySQL digunakan sebagai dasar pembentukan basis pengetahuan program aplikasi ini. 2.2 Landasan Teori 1.

penyakit pada kucing, cara diagnosis dan cara penanganan penyakit yang sifatnya hanya untuk memberikan pertolongan pertama yang harus diberikan kepada kucing yang sakit. 2. Aplikasi ini hanya berlaku untuk penyakit kulit pada kucing. 3. Metode yang digunakan dalam

the risks of adventure travel. Adventure travel is supposed to be challenging. But regardless of your age, destination or chosen activity, your safety should be of paramount importance. BS 8848 sets standards to minimize the risks of adventure travel. Knowledge of the standard is important to anyone organizing, or taking part in, an overseas venture. 2 Hundreds of thousands of people take part .