Rabu, 19 Desember 2012

Peringkasan Teks Otomatis Berbahasa Indonesia : Part 2


Oke lanjut, di Part 2 ini kita akan membuat file summarize.php untuk melakukan peringkasan terhadap dokumen yang akan kita pilih nantinya. Tanpa basa-basi nih :
Kalau indexer.php digunakan untuk mengindeks seluruh kata dari dokumen yang ada, summarize.php hanya mengindeks dokumen yang dipilih. Nah dimana letak peringkasannya? (dari tadi indeks mulu indeks).
Peringkasan dilakukan dengan cara menghitung setiap bobot kalimat dalam dokumen yang dipilih.
  1. Hitung bobot setiap kata (tf.idf) dalam kalimat (nilai idf berasal dari indexer.php - Part 1).
  2. Jumlahkan bobot tiap kata sehingga menjadi bobot kalimat.
  3. Kalimat-kalimat dengan bobot tertinggi akan terpilih.
  4. Batasi jumlah maksimum kalimat hasil ringkasan dengan compression rate.
  5. Ringkasan diperoleh.
Jika tidak ada yang error, langsung menuju Part 3.

Tidak ada komentar:

Posting Komentar