Hampir semua search
engine bekerja dengan tiga point.
1. Web Crawling, dimana dikenal juga dengan
sebutan spider. Pertama kali search engine harus mencari file dari databasenya
sebelum menampilkan alamatnya, dibantu dengan sebuah software khusus yaitu
spider yang dapat memilih informasi yang ada baik dalam memilih informasi yang
ada baik dalam ratusan juta halaman web sekalipun serta membuat daftar
kata-kata didalam database, proses inilah yang disebut dengan Web Crawling.
2. Indexing, dimana point ini bekerja
menyimpan index dari tiap-tiap file yang ditemukan beserta alamatnya. Selain
itu dengan proses index dapat juga mempercepat kerja sistem spidering untuk
mencari file dalam website yang paling banyak digunakan.
3. Searching, yang lebih kearah penyediaan fasilitas
bagi pengguna untuk mencari kata-kata atau kombinasi kata paling relevan yang
ditemukan dalam index tersebut.Biasanya data tentang halaman web disimpan
didalam suatu index database untuk digunakan di query kemudiannya. Beberapa
search engine, seperti google, menyimpan semua atau sebagian dari halaman
sumber (yang disebut dengan cache) begitu juga dengan informasi mengenai
halaman web. Halaman yang cached ini selalu memegang pencarian teks karena
halaman tersebut yang terindex, sehingga dapat bermanfaat manakala isi dari
halaman tersebut telah diperbaharui dan halaman tersebut tidak lagi digunakan.
Tidak ada komentar:
Posting Komentar