Rabu, 19 Desember 2012

Peringkasan Teks Otomatis Berbahasa Indonesia : Part 3


Ini dia bagian terakhir dari rangkaian tugas yang bikin pusing. Langsung saja, pada bagian ini kita hanya membuat file index.php yang bertugas untuk menampilkan hasil dari summarize.php.  Jadi sebenarnya Part 1 dan Part 2 yang paling penting. Liat aja nih isi dari file index.php :
Nah luar biasa simpel kan, nah tutorial sampai disini, tinggal olah antarmuka-nya sesuka kalian. Hasilnya juga luar biasa sederhana :p

Simple AuTexSum
Oh iya satu lagi, masih banyak kelemahan dari program yang saya buat :
  1. Kode program tidak menjamin efisien (acakadut), apalagi kalau mau ribuan dokumen yang di-indeks. Kalau ribuan biasanya menggunakan database atau file untuk menyimpan hasil indexing (agar lebih cepat). Nah karena project ini dokumennya cuma sedikit, jadi indexing dilakukan setiap kali kita mau meringkas dokumen  (tapi masih cepet kok).
  2. Tokenisasi yang belum sempurna (regular expression yang saya pakai masih sederhana, masih berdasarkan simbol titik dan spasi).
  3. Karena regular expression yang sederhana itu, jadi ada kendala pada saat pemisahan kalimat (ada kasus munculnya gelar seperti : Dr. Ir. M.Si). Sehingga saya modifikasi saja dokumennya biar ga puyeng (gelar jadi tanpa titik) jadi mirip format baru IPB. :p
Nah saya juga tidak tahu kalau program peringkasan yang sebenarnya baik itu seperti apa, jadi program ini hanya dari konsep yang saya pahami saja kemudian diterjemahkan dalam kode program.

Modifikasi ya antarmuka-nya, kalau punya saya seperti ini :

AutTexSum Project

Gimana? Lumayan kan jadinya, berhubung Windows 8 lagi nge-trend jadi temanya kotak2 gitu.. :p
Terima kasih telah membaca seluruh Part-nya.
Berhubung banyak yang minta yang udah dimodifikasi antarmukanya, download disini (jangan males ya hehe) :D

25 komentar:

  1. ih wow, (*nah gw udah komen kan? sesuai yg dminta wkwkwkw)

    BalasHapus
    Balasan
    1. mas, saya boleh mintak projek lengkapnya?
      kalo boleh kirim ke hamdi.faizul@gmail.com
      makasi ya mas..

      Hapus
    2. itu udah ada link-nya kok mas di atas.

      Hapus
  2. gan boleh tanya maksud "set compression rate" fungsinya untuk apa yah? tolong dijelasin gan... thanks :D

    BalasHapus
    Balasan
    1. compression rate maksudnya batas kompresi kalimat gan..
      misalnya kalau ada 10 kalimat lalu compression rate kita set nilainya 50 (dalam persentase) maka jumlah kalimat hasil ringkasannya ada 5 buah gan..

      coba ja liat baris ke-9 dari kode di atas gan..

      Hapus
  3. gan, boleh minta project yg udah dimodifikasi interface nya ? terima kasih sebelumnya

    BalasHapus
  4. gan, boleh minta project yg udah dimodifikasi interface nya ? terima kasih
    email : andimas92@gmail.com

    BalasHapus
  5. gan, mau minta project yang udah dimodifikasi interfacenya boleh ? makasih sebelumnya..
    email : jerrie1612@gmail.com

    BalasHapus
  6. Guriiiiiiih gan, sangat bermanfaat....
    Boleh minta project yg udah dimodifikasi interface nya ? terima kasih
    email : rohmatullah03@gmail.com

    BalasHapus
  7. maaf gan ...boleh liat project lengkpanya...terima kasih gan sebelumnya..
    kebetulan saya pernah membuat juga search engine menggunakan swish-e yg menggunakan indes corpus juga..dan saya ingin mempelajari bagaimana membuat ringkasannya seperti punya google
    email:cengcanales87@gmail.com

    BalasHapus
  8. gan, kalau proses peringkasannya dimasukkan didatabase dibagian mana ya gan??

    BalasHapus
  9. gan boleh minta project yg udah dimodifikasi interface nya ? terima kasih sebelumnya.
    email : wilfridus.laki@yahoo.com

    BalasHapus
  10. Mantap gan, sangat membantu...

    BalasHapus
  11. gan boleh minta project yg udah dimodifikasi interface nya ? terima kasih sebelumnya.
    Ferryk.mk@gmail.com

    BalasHapus
  12. Gan, metode dan algoritma yang di gunakan dalam pembuatan program ini apa ya..? thanks sebelumnya..
    Please reply as soon as possible

    BalasHapus
    Balasan
    1. pakai tf.idf gan, cek pembahasannya di part 2 (http://andrefadila.blogspot.co.id/2012/12/peringkasan-teks-otomatis-berbahasa_18.html)

      Hapus
  13. gan gak bisa didownload filenya

    BalasHapus
  14. sori gan mau tanya pakah peringkasannya menggunakan databases..or tidak yah???

    BalasHapus
  15. Misi Kang Andre, mau konsultasi bisa gak? saya ada tugas kuliah membuat aplikasi text summary nih.. email saya fais.stmik@gmail.com atau kontak ig aja id nya fj_sidiq .. kalaupun harus bayar saya bayar, karna ilmu emang sesuatu banget.. :D
    Mohon segera balas..

    BalasHapus
  16. halo gan, saya mau tanya, apakah jika text yang di masukkan tidak ada tanda baca seperti titik, koma dll, apakah bisa di ambil kesimpulannya? namun text yang di masukkan 3 paragraft lebih.. terima kasih

    BalasHapus
  17. sangat bermanfaat banget gan, mau tanya kalau tf-idf di compare sama k-means clustering bisa kah? kalo bisa mohon request tutorialnya gan

    BalasHapus