Rabu, 05 Februari 2014

Pembuatan Korpus dan Indeks – Temu Kembali Informasi


Oke masuk ke tahap selanjutnya dari artikel sebelumnya, ketika kita melakukan suatu pencarian informasi maka tentu pasti ada batasan/ruang lingkup informasi yang akan kita peroleh. Semisal Google, ruang lingkup pencarian kita adalah seluruh web yang ada di jagat internet ini, WAW. Ruang lingkup pencarian ini selanjutnya akan kita sebut korpus atau koleksi dokumen (teks/suara/citra). Nah, sesuai dengan ilmu yang saya pahami kita akan mempelajari tentang dokumen berbentuk teks.

Sebagai contoh bentuk korpus itu seperti apa, bisa teman-teman lihat pada artikel yang ini. Ya bentuknya tentu saja sebuah teks yang terdapat pada sebuah file atau lebih. Kebetulan model korpus yang saya buat pada artikel tersebut adalah file berformat XML. Inilah yang disebut tahap pembuatan korpus (processing). 

Selasa, 04 Februari 2014

Apa Itu Temu Kembali Informasi


Temu Kembali Informasi atau bahasa kerennya Information Retrieval adalah salah satu cabang ilmu pengetahuan di dunia IT. Gw ga akan jelasin dengan panjang lebar, teman-teman akan mengerti sendiri dengan melihat contoh aplikatif di dunia nyata yang mungkin sudah biasa kalian lakukan. Penjelasan secara ilmiah juga sudah banyak di wikipedia dan blog lainnya.

Sesuai namanya, Temu Kembali Informasi bertujuan untuk menemukembalikan/memperoleh informasi, contoh paling mudah adalah mencari informasi menggunakan mesin pencari (search engine) seperti Google, Yahoo, dan Bing (semuanya merupakan Sistem Temu Kembali Informasi). Siapa yang gak pernah pake? Gw yakin 99.99% yang menggunakan internet pernah melakukan hal ini, iya kan iya dong bener kan bener dong? :p