Pada pengujian kimia
sering kali kita melakukan pengulangan
pengujian sebagai langkah untuk penjaminan mutu terhadap keabsahan hasil. Pengulangan
pengujian ini juga kita gunakan ketika kita
melakukan validasi terhadap metode yang akan kita gunakan, misalkan
dalam penantuan keberterimaan presisi metode, penentuan limit deteksi, maupun
keperluan-keperluan lain yang memerlukan pengolahan data secara statistika.
Pada ISO 17025:2017 klausul
7.7.3, dinyatakan bahwa data dari kegiatan pemantauan harus dianalisis,
digunakan untuk mengendalikan dan, jika dapat diterapkan, meningkatkan kegiatan
laboratorium. Jika hasil analisis data dari kegiatan
pemantauan ditemukan berada di luar kriteria yang telah ditetapkan sebelumnya, tindakan
yang tepat harus diambil untuk mencegah hasil yang salah dilaporkan. Sesuai
dengan klausul 7.7.3 di atas, maka dalam pengulangan pengukuran/pengujian
(reprodusibel), analisis data sangat diperlukan untuk mengetahui apakah sekumpulan
data tersebut seragam atau terdapat outlier yang mempengaruhi hasil.
Terdapat berbagai macam
metode yang dapat digunakan untuk mengidentifikasi outlier dalam sekumpulan
data hasil pengulangan. Beberapa metode tersebut diantaranya metode Dixon, Grubb’s, IQR (interquartile
range), dan algoritma A.
1. Identifikasi Outlier Metode
Dixon
Salah satu cara untuk
menguji nilai pengukuran yang dicurigai kebenarannya adalah dengan menghitung
nilai D dari Dixon. Identifikasi outlier ini disebut uji Dixon, mula-mula data disusun mulai dari yang terendah
hingga tertinggi, kemudian nilai D dihitung dengan persamaan berikut.
(Miller, J.C. & Miller, J.N., 1991)
Nilai D hasil perhitungan tersebut kemudian dibandingkan dengan nilai D
dalam tabel. Nilai diterima apabila nilai D hasil perhitungan kurang dari nilai
D tabel.
Berdasarkan rumus 1 di atas, terlihat bahwa uji outlier dengan
menggunakan cara ini hanya cocok digunakan untuk uji satu data outlier, apabila
terdapat dua data outlier, maka cara ini tidak dapat digunakan.
2. Identifikasi Outlier Metode
Grubb’s
Berbeda
dengan Identifikasi outlier metode Dixon di atas, identifikasi outlier metode Grubbs ini dapat digunakan untuk identifikasi dua data sekaligus yang dicurigai outlier. Langkah awal
sebelum mengevaluasi data pencilan adalah mengurutkan sekumpulan data dari
nilai yang terendah hingga nilai yang tertinggi. Kemudian dihitung nilai G
dengan menggunakan persamaan yang sesuai dengan tipe sebaran data. Nilai G yang
didapat tersebut dibandingkan dengan nilai G dalam tabel. Apabila nilai G hasil
perhitungan lebih besar dari nilai dalam tabel, maka nilai tersebut dinyatakan
outlier. Terdapat tiga tipe sebaran data yang dapat dievaluasi outliernya
menggunakan metode Grubbs.
Tiga
metode uji untuk identifikasi outlier di dalam distribusi normal telah
dikembangkan dan diperluas oleh Grubbs. Semua menggunakan uji statistik yang
didasarkan pada standar deviasi. Yang pertama dari hal ini adalah uji untuk
nilai outlier tunggal. Uji kedua untuk pasangan dari nilai outlier yang
masing-masing terletak pada nilai terendah dan tertinggi dari set data.
Sedangkan uji yang ketiga untuk pasangan dari nilai outlier pada sisi yang sama
dari set data.
Uji Grubbs 1:
Identifikasi outlier dengan uji Grubbs ini digunakan apabila terdapat satu nilai yang diduga outlier
berada pada nilai terendah atau tertinggi dalam kumpulan data pengulangan. Perhitungan
menggunakan persamaan berikut ini. Pada tipe ini, nilai G’ hasil perhitungan
dibandingkan dengan kritis. Jika nilai perhitungan melebihi nilai kritis, nilai
yang diuji diidentifikasi sebagai outlier.
Keterangan:
G’low = Uji Grubbs tipe 1 untuk data terendah
yang diduga pencilan
G’high = Uji Grubbs tipe 1 untuk data tertinggi
yang diduga pencilan
=
nilai rata-rata
x1 = nilai terendah yang diduga outlier
xn = nilai tertinggi yang diduga outlier
s = standar deviasi
Uji Grubbs 2:
Identifikasi outlier dengan uji Grubbs 2 ini digunakan apabila terdapat dua nilai yang diduga
outlier yang berada pada nilai terendah dan tertinggi secara bersamaan dalam
kumpulan data pengulangan. Perhitungan menggunakan persamaan berikut ini. Pada
tipe ini, nilai G’ hasil perhitungan dibandingkan dengan kritis. Jika nilai
perhitungan melebihi nilai kritis, nilai yang diuji diidentifikasi sebagai
outlier.
Keterangan:
G” = Uji Grubbs tipe 2 untuk data terendah
dan tertinggi secara bersamaan yang diduga outlier
x1 = nilai terendah yang diduga outlier
xn = nilai tertinggi yang diduga outlier
s =
standar deviasi
Uji Grubbs 3
Identifikasi outlier dengan uji Grubbs 3 ini digunakan apabila terdapat dua nilai yang diduga
outlier yang mana keduanya berada pada nilai terendah atau keduanya pada nilai
tertinggi dalam kumpulan data pengulangan. Perhitungan menggunakan persamaan
berikut ini. Untuk G”’ ini ada pengecualian terhadap interpretasi yang umum,
jika nilai perhitungan kurang dari nilai kritis, hasil uji adalah signifikan
dan nilai diidentifikasi sebagai outlier.
Farrant, Tj., Practical Statistics for The Analytical Scientist A Bench
Guide, The Royal Society of Chemistry
3. Identifikasi Outlier Metode
Interquartile Range/IQR
Metode identifikasi outlier dengan IQR ini didasarkan pada
kurva distribusi normal. Umumnya suatu data pengulangan yang ideal memiliki
penyebaran data berbentuk kurva distribusi normal. Ketika penyebaran data
memenuhi pola kurva distribusi normal, maka nilai mean (rata-rata), median
(nilai tengah), dan modus (nilai yang sering muncul) adalah identik dan
berada pada tengah kurva. Inlier
dapat diidentifikasi sebagai daerah di dalam IQR±(1,5*IQR), dimana IQR = Q3-Q1.
Gambar
kurva distribusi normal.
4. Identifikasi Outlier Algoritma A
Identifikasi outlier
dapat juga dilakukan dengan menggunakan analisis robust: algoritma A sebagaimana yang digunakan dalam penentuan
z-score dalam uji banding (ISO
13528:2015). Algoritma ini menghasilkan estimasi robust dari rata-rata dan standar deviasi dari data yang
diaplikasikan. Sejumlah p data hasil uji banding diurutkan dari yang terkecil
ke terbesar.
x{1}, x{2}, … , x{p}
Nyatakan rata-rata robust dan standar deviasi robust dari data ini masing-masing
sebagai x* dan s*. Hitung nilai awal untuk x* dan s* sebagai:
x* = median dari xi
(i = 1, 2, … p)
s* = 1,483 median dari |xi
– x*| dengan I = 1, 2, …, p
Perbaharui nilai dari x* dan
s* sebagai berikut.
Hitung δ = 1,5s* (A.1)
Untuk masing-masing xi
(i=1, 2, …, p), hitung:
(A.2)
Hitung nilai baru dari x* dan
s* dari persamaan berikut:
(A.4)
Estimasi robust x*
dan s* dapat diturunkan dengan perhitungan berulang/iterasi, yaitu dengan
memperbaharui nilai x* dan s* beberapa kali dengan menggunakan data yang
dimodifikasi di dalam persamaan A.1 sampai dengan A.4, sampai proses konvergen.
Konvergen dapat diasumsikan ketika tidak ada perubahan dari satu iterasi ke
iterasi berikutnya sampai angka signifikan ketiga dari rata-rata dan standar
deviasi robust (x* dan s*). Ketika
proses sudah konvergen, maka nilai yang berada diluar s* ± δ diidentifikasi sebagai outlier.
5. Referensi
1.
Farrant,
Tj., Practical Statistics for The Analytical Scientist A Bench Guide,
The Royal Society of Chemistry
2.
Hadi,
Anwar dan Asiah. 2018. Statistika
Pengendalian Mutu Internal. IPB Press.: Bandung.
4.
ISO
13528:2015 (Statistical methods for use
in proficiency testing by interlaboratory comparison)
5.
JC
& JN Miller. 1991. Statistika untuk
Kimia Analitik. ITB: Bandung