16 July 2010

Penggunaan Rantai Markov Pada Prediksi Link Suatu Website

SV. Aris Gunawan, S.Pd
Modul Seminar Matematika|Universitas Sebelas Maret Surakarta - 2008
Internet (interconnected network) bukanlah sesuatu yang asing lagi bagi setiap orang sekarang ini. Dengan internet berbagai kebutuhan manusia bisa dipenuhi dengan lebih mudah. Sebagai ilustrasi, kebutuhan manusia seperti transaksi, komunikasi, informasi dan lain-lain dapat dilakukan dengan mudah lewat komputer yang telah tersambung dengan jaringan internet. Internet merupakan jaringan global yang terbentuk dari ribuan bahkan jutaan lebih komputer yang biasa disebut network of networks. Di dalam internet sendiri terdapat fasilitas-fasilitas atau layanan yang cukup banyak, seperti electronic mail (e-mail), internet relay chat (IRC), file transfer protocol (FTP), telnet, dan world wide web (www).




World wide web atau yang lebih dikenal dengan web dapat didefinisikan sebagai kumpulan sumber atau informasi yang dihubungkan dengan hyperlink melalui server Hypertext Transfer protocol (HTTP). Web adalah ruang informasi yang cukup popular dalam internet. Pemakai web dituntun untuk menemukan informasi melalui penggunaan teknologi hypertext. Hypertext adalah teks yang mempunyai kaitan dengan dokumen yang lain. Penggunaan teknologi hypertext memungkinkan pemakai menemukan informasi dengan mengikuti link yang disediakan dalam dokumen web yang ditampilkan web browser. Secara teknis, web terdiri dari dua bagian utama, yaitu:
1. web browser
web browser atau yang sering disebut browser, merupakan program aplikasi atau software yang beroperasi di setiap komputer yang menyediakan fasilitas untuk membaca halaman web.
2. Web server
Web server adalah suatu program (dan juga mesin yang menjalankan program) yang mengerti protocol HTTP dan dapat menanggapi permintaan-permintaan dari web browser.


Suatu browser mengambil sebuah halaman web dari server dengan sebuah protocol HTTP yang berisi alamat halaman, misalnya http://www.yahoo.com. Browser seperti mozilla firefox dan internet explorer berkomunikasi melalui jaringan dengan sebuah server. Browser akan meminta dokumen tertentu atau layanan lain yang disediakan oleh server. Kemudian server memberikan dokumen atau layanannya jika tersedia.

Menurut Olston dan Chi (http://citeseer.ist.psu.edu/zhu02using.html, 17 April 2008) terdapat dua prinsip dalam pencarian informasi dalam web, yaitu penelusuran dan pencarian dengan kata kunci. Pencarian dengan kata kunci sangat popular untuk mencari secara cepat halaman yang memuat informasi yang lebih spesifik. Sebaliknya, penelusuran sangat berguna ketika pencarian dengan kata kunci sulit diterapkan. Hal ini karena berbagai macam alasan seperti, pemakai mungkin masih kurang paham akan apa yang dipilihnya, dan beberapa kompleksitas tugas pencarian yang sukar diformulasikan dengan kata kunci. Penelusuran sendiri tidak efisien untuk mencari lokasi yang lebih spesifik karena pemakai secara seksama menuntun dirinya sendiri. Sebaliknya, pencarian dengan kata kunci seringkali mengembalikan halaman yang tidak tepat dan menghilangkan konteks yang tampil pada hasil pencariannya. Dengan menggabungkan penelusuran dan pencarian dengan kata kunci serta memudahkan transisi di antara keduanya maka pemakai dapat menemukan informasi yang diinginkan secara lebih efektif dan efisien.

Masalah yang sering dialami pemakai adalah efektifitas dan efisiensi dalam pencarian informasi yang termuat dalam halaman-halaman web. Terlebih lagi sebagian besar web mempunyai jumlah halaman yang sangat banyak. Hal ini mengakibatkan pemakai harus lebih teliti untuk memilih halaman yang memuat informasi yang dibutuhkan. Informasi tentang pemakai web seperti ketertarikannya yang diindikasikan dengan halaman-halaman yang telah dikunjungi dapat digunakan untuk memprediksi halaman-halaman yang mungkin diminatinya. Kumpulan dari kunjungan atau permintaan pemakai terhadap suatu dokumen dalam server terekam dalam web log files.

Web log files biasanya memuat alamat Internet Protocol (IP) komputer yang meminta dokumen, identifikasi pemakai, tanggal dan waktu permintaan, Universal Resource Locator (URL dari dokumen yang diminta, status yang mengindikasikan sukses tidaknya suatu permintaan yang diakses oleh pemakai, ukuran dokumen yang ditransfer, URL yang berkaitan, nama dan versi browser dan sistem operasi yang digunakan.

Di dalam web terdapat halaman-halaman yang dihubungkan dengan suatu link. Saat seorang pemakai mengunjungi suatu halaman dan menekan link untuk menghubungkan halaman berikutnya tersebut hanya bergantung pada halaman dimana link berada. Sifat tersebut dalam statistika sama dengan rantai markov dimana barisan distribusi bersyarat dari X(tn) untuk nilai X(t1), X(t2),…,X(tn-1). Dengan kata lain, sifat rantai markov pada suatu n tergantung hanya pada sifat waktu n-1. jadi hanya web yang terdapat link yang menghubungkan antar halaman saja yang dapat diaplikasikan dengan rantai markov.

Dengan meninjau kebiasaan kunjungan pemakai web sebagai rantai Markov maka dapat dibangun suatu model Markov yang terekam dalam web log files. Rantai Markov adalah proses Markov yang mempunyai ruang state (state space) diskrit (Parzen, 1962: 189) selanjutnya model Markov digunakan sebagai prediksi link untuk menentukan halaman most probably to-be-visited (MPT) dalam m langkah berikutnya yang kemudian direkomendasikan kepada pemakai dalam menelusuri web dan mencari informasi yang dibutuhkan secara lebih efektif dan efisien.
DOWNLOAD ARTIKEL

0 kesan:

Post a Comment