Nielsen, Jakob, and Landauer, Thomas K.: “A mathematical model of the finding of usability problems,” Proceedings of ACM INTERCHI’93 Conference (Amsterdam, The Netherlands, 24-29 April 1993), pp. 206-213.

 

Ya, cukup 5 user saja untuk melakukan usability testing. Beberapa orang berpikir bahwa usability testing akan menghabiskan banyak waktu dan biaya. INI TIDAK BENAR! Hasil terbaik dari pengujian tidak lebih dari 5 user pada pengujian kecil sebanyak yang anda mampu.

Pada penelitian yang dilakukan Tom Landauer dan Nielsen, terlihat bahwa jumlah persoalan usability ditemukan pada n user adalah

(1-(1- )

Dimana

N = jumlah total masalah kegunaan dalam desain  

L = proporsi masalah kegunaan yang ditemukan saat menguji satu pengguna.

Nilai  L adalah 31%, dirata-ratakan di sejumlah besar proyek yang telah diteliti oleh Nielsen. Kurva untuk L = 31% memberikan hasil sebagai berikut:

 

Grafik diatas menggambarkan :

  • Kebenaran yang paling mencolok dari kurva adalah bahwa jumlah user nol memberi hasil nol (tidak menunjukkan usability problem sama sekali).

 

  • Ketika kita menguji usability dengan 1 user saja, sudah menunjukkan hampir sepertiga dari semua yang perlu diketahui tentang usability problem pada desain. Perbedaan antara nol dan bahkan sedikit data pun mencengangkan.
  • Ketika kita menambah user menjadi 2, kita akan menemukan bahwa orang ini melakukan beberapa hal yang sama dengan pengguna pertama, jadi ada beberapa tumpang tindih dengan apa yang telah kita pelajari dari user pertama. Meskipun demikian, setiap orang adalah unik, sehingga akan ada juga sesuatu yang baru yang pengguna kedua lakukan yang tidak kita amati dengan user pertama. Jadi user kedua menambahkan sejumlah wawasan baru, namun tidak sebanyak user pertama.

 

  • User ketiga akan melakukan banyak hal yang sudah kita amati dengan user pertama dan atau user kedua dan bahkan beberapa hal yang sudah kita lihat dua kali. Plus, tentu saja, user ketiga akan menghasilkan sejumlah kecil data baru, meski tidak sebanyak user pertama dan user kedua.
  • Saat kita menambahkan lebih banyak pengguna, kita belajar lebih sedikit dan kurang karena kita akan terus melihat hal yang sama berulang-ulang. Tidak ada kebutuhan nyata untuk terus mengamati hal yang sama beberapa kali, dan kita akan sangat termotivasi untuk kembali ke papan gambar dan merancang ulang situs untuk menghilangkan masalah usability.

  • Setelah user kelima, kita akan membuang-buang waktu dengan mengamati temuan yang sama berulang kali namun tidak banyak belajar hal-hal baru mengenai usability problem.

Meskipun grafik diatas menunjukkan, setidaknya ada 15 user yang dilibatkan dalam pengujian, akan tetapi, hal ini tidak dianjurkan. Mengapa? lebih baik kita mendistribusikan anggaran untuk tes-tes kecil pada 3-5 user saja. Terlalu banyak user yang dilibatkan tidak akan menghasilkan studi yang signifikan terhadap permasalahan usability. Yang lebih penting adalah iterative design! Uji-perbaiki-uji lagi-perbaiki lagi, sampai benar2 fix tanpa problem lagi.

Jadi, mengapa tidak pakai satu user saja untuk pengujian? hal ini terlalu beresiko, kita perlu meneliti pendapat orang lain juga untuk memberikan masukan terkait desain. Lagipula, dari hasil pengujian menggunakan analisis cost benefit menunjukkan rasio optimal sekitar 3 atau 5 pengguna, bergantung pada gaya pengujian.

Nah, begitulah kira2 mengapa hanya perlu 5 pengguna saja dalam pengujian usability!

Yogyakarta, 23 Agustus 2017

 

 

Analogi sup yang dimodifikasi

Ketika koki lain mencicicipi sup : exploratory

Ketika koki menilai untuk resep tertentu : predictive

Ketika koki mencicipi sup saat memasaknya : formative

Ketika tamu mencicipi sup : summative

Beberapa definisi usability :

Shackel 1991  : efektifitas, kemudahan dipelajari, fleksibilitas, dan sikap

Jordan 1998 : kemampuan menebak, kemampuan dipelajari, performansi pengalaman pengguna, potensial sistem (secara teori, seberapa efisien  tugas yang diberikan dapat dilengkapi oleh sistem yang bersangkutan), dan kegunaan kembali.

ISO/DIS 9241-11 : efektifitas, efisiensi , kepuasan.

Efektifitas : akurasi dan kelengkapan dengan yang dispesifikasikan user dapat dicapai tujuan spesifik dalam lingkungan tertentu.

Efisiensi : jumlah sumber daya yang dikeluarkan dibangingkan dengan akurasi dan kelengkapan tujuan yang dicapai.

Kepuasan : kenyamanan dan penerimaan sistem untuk pengguna dan orang lain yang di sebabkan dari penggunaan

 

Ada 4 buah tipe evaluasi, berdasarkan tujuan evaluasi

  1. Exploratory – bagaimana penggunaannya?

Dilakukan sebelum pembangunan interface

Mempelajari bagaimana s/w digunakan, seberapa sering dan untuk apa

Mengumpulkan data yang digunakan – catatan statistik dan observasi dari penggunaan

  1. Predictive – memprediksi (akan) seberapa baik ?

Memperkirakan seluruh kualitas dari interface (seperti summative evaluation, tapi prediksi dilakukan di muka

Dilakukan sekali saat desain selesai dibuat, tapi sebelum proses implementasi

  1. Formative – bagaimana dapat menjadi lebih baik ?

Memberitahukan proses desain dan membantu meningkatkan interface selama desain

Dilakukan selama pembangunan interface

Mempelajari mengapa sesuatu menjadi salah , tidak hanya pada saat terjadi kesalahan

Mengumpulkan data proses-pengamatan kualitatif dari apa yang terjadi dan bagaimana

  1. Summative – seberapa baik?

Penilaian dari semua kualitas dari interface

Dilakukan satu kali pada interface (kurang lebih) telah selesai

Membandingkan desain alternatif, atau menguji kebutuhan performansi yang telah di definisikan

Method category Name of method Described in (among others)

Empirical methods

Usability test (also called thinking aloud method)(Lewis, 1982)

User performance test(Nielsen, 1993)

Remote usability test(Hilbert & Redmiles, 1998)

Beta test(Smilowitz et al., 1993)

Forum test(Smilowitz et al., 1993)

Cooperative evaluation(Wright & Monk, 1991b)

Coaching method(Nielsen, 1993)

Inspection method

Expert review(Hammond et al., 1984)

Heuristic evaluation(Nielsen & Molich, 1990)

Cognitive walkthrough (CW)(Lewis et al., 1990)

Pluralistic walkthrough(Bias, 1994)

Structured heuristic evaluation(Kurosu et al., 1999)

Perspective-based inspection(Zhang et al., 1998)

Inquiry methods

User satisfaction questionnaire(Kirakowski & Dillon, 1988)

Field observation(Gould, 1988)

Focus group(Zirkler & Ballman, 1994)

Interviews(Gould, 1988)

 

Thesis User Evaluation Methods, Nielsen, 1999

 

 

Title : Comparing University Ranking

Author : Isidro F. Aguillo • Judit Bar-Ilan • Mark Levene • Jose ´ Luis Ortega

Journal : Scientometrics (2010) 85:243–256, DOI 10.1007/s11192-010-0190-z

REVIEW RESULT

Dalam penelitian ini, Isidro, dkk membandingkan sejumlah hasil pemeringkatan universitas di dunia. Terdaoat setidaknya 5 jenis pemeringkatan perguruan tinggi yang digunakan sebagai perbandingan. Hasil perbandingan metode pemeringkatan dapat dilihat pada tabel berikut ini :

Dari hasil perhitungan similaritas, maka berdasarkan sample dari perguruan tinggi di Eropa, dapat disimpulkann bahwa perbedaan terbesar metode perangkingan terdapat pada  QS-THE dan WR. Sedangkan kesamaan tertinggi terdapat pada perangkingan HEEACT dan CWTS. Secara keseluruhan kemiripannya akan meningkat jika perbandingan dilakukan terbatas pada universitas-universitas di Eropa.

 

Kelemahan peringkat2 diatas antara lain :

  1. THE-QS didasarkan pada jumlah perguruan tinggi yang sedikit, dan survey yang dianggap kurang representatif, terutama terdapat representasi yang berlebihan pada universitas di UK dan Australia.
  2. Webometrics merupakan perangkingan yang paling berbeda, hal ini dimungkinkan karena praktik buruk dalam penamaan web universitas, memiliki 2 atau lebih domain, perubahan url web universitas, dan aktivitas lain.

Dari segi metodologi, hendaknya diperhatikan beberapa aspek yaitu :

  1. Teknik similaritas tidak diimbangi dengan uji korelasi, di duga terdapat kemungkinan dapat menggambarkan nilai yang lebih tinggi jika menggunakan korelasi peringkat.
  2. Dengan cara yang berbeda, nilai2 ini di normalisasi. Hal ini menjelaskan mengapa tes tersebut tidak memberikan hasil yang serupa.
  3. Terkait dengan kriteria inklusi, yaitu daftar universitas yang digunakan dalam metode peringkat yang digunakan dalam penelitian ini tidak sama. Misalkan , CWTS memiliki kebijakan untuk menggabungkan universitas2 maju, sedangkan organisasi dengan publikasi yang rendah tidak dimasukkan dalam perankingan.

Purwokerto, 5 Agustus 2017