Cerita TA [5]
Bismillah...
Aloha,
Eh, Assalamualaikum warahmatullah maksudnya (salamnya ahli surga-Amin ya Rabb)
Apa kabar penggemar setia(?). Kembali dengan sejuta kehangatan & keceriaan bersama saya, Mentari Pagi
B-) huehehehe
Well, back to normal (Emang sebelumnya ngga normal? Mungkin...bisa dibilang gitu! Haha)
Kali ini saya ingin bercerita tentang proses pengerjaan tugas akhir saya. Yep, hanya ingin bercerita panjang tinggi(?) mengenai apa yang telah saya kerjakan, bagaimana prosesnya, kesan subjektif saya dan rencana ke depan sebagai dokumentasi kecil-kecilan untuk mengingatkan kembali jika suatu hari nanti saya lupa. Tapi, semoga saja tidak.
Jadi apa yang saya kerjakan adalah mencoba memodelkan bacaan Quran. Berpegang pada motivasi "Khairukum man ta'allama Al-Quran wa 'allamah", saya membulatkan niat untuk fokus ke bidang Speech Recognition. Sebagai realisasi imaginasi masa kecil kala duduk di selasar putih sambil menatap langit biru.
Pemodelan Bacaan Quran yang sedang saya lakukan memanfaatkan transliterasi buckwalter untuk merepresentasikan tulisan asli seluruh ayat Al-Quran dalam format ASCII agar lebih mudah diproses oleh mesin. Transliterasi Buckwalter ini pertama kali saya ketahui setelah melakukan eksplorasi lanjut terhadap project Corpus Quran oleh Kais Dukes (silakan cek situs http://corpus.quran.com/). Semoga jadi amal jariyah bagi Mr. Dukes & rekan-rekannya atas kontribusi yang berharga ini. Semoga suatu hari saya diberi kesempatan bekerja bersama beliau & orang2 alim lainnya untuk mengembangkan corpus quran atau hal-hal sejenisnya yang penuh manfaat dunia dan akhirat :-)
Transliterasi Buckwalter Quran tidak bulat-bulat saya gunakan. Saya terlebih dahulu mempelajari lebih dalam pola notasi Buckwalter. Kemudian, saya melakukan modifikasi sesuai kebutuhan fonem yang digunakan untuk pemodelan. Setelah melakukan modifikasi secara otomatis berdasarkan pola Buckwalter, untuk memastikan transkripsi fonem yang akan saya gunakan benar, saya melakukan manual checking seluruh transkripsi. Saya menemukan kesulitan terutama pada penanganan waqaf. Contohnya saja, ta marbuthoh yang pada dasarnya dibaca dengan bunyi "t", akan tetapi ketika diwaqafkan bacaannya menjadi bunyi "h". Ada delimiter di akhir ayat, namun bagaimana jika reciter dengan "bebas" menghentikan bacaannya di tengah ayat dan mengganti bunyi ta marbuthoh yang ditemukan menjadi h? Tentu ini tidak salah. Tak ada guru talaqqi & tahsin yang akan menyalahkan muridnya jika membaca demikian. Tapi jika transkripsi yang aku sediakan tidak mampu "memaklumi" kasus ini, sistem bisa saja mengatakannya salah. Setelah konsultasi dengan Dosen Pembimbing saya yang super duper baik, mendukung, mendengarkan kosa kata aneh karangan saya, serta rajin mengingatkan TA hingga semangat terus ter-upgrade otomatis setiap kali bimbingan, pemeriksaan waqaf menjadi batasan pada tugas akhir saya ini. Insyaallah diberikan kesempatan untuk melanjutkan dan menjadikannya penelitian yang lebih baik.
Setelah subjektifitas saya menyatakan transkripsi ini cukup baik, saya melakukan penghitungan statistik kemunculan seluruh fonem dalam Al-Quran memanfaatkan program kecil. Statistik ini saya jadikan acuan yang akan dibandingkan dengan statistik ayat-ayat pilihan dengan kriteria & batasan tertentu sehingga cukup untuk dijadikan model yang merepresentasikan seluruh bunyi yang keluar ketika Al-Quran dibacakan.
Guna memenuhi kebutuhan corpus saya memilih setidaknya 500 ayat Al-Quran. Seratus sembilan ayat di antaranya adalah ayat-ayat gharibah yang memiliki pengucapan yang khas dan benar-benar harus diperhatikan ketika membacanya. Saya ingin agar sistem yang dikembangkan lebih sensitif terhadap ayat-ayat ini. Sisanya, 391 ayat dipilih dengan konsep phonetically rich balance memanfaatkan algoritma greedy. Saya membuat program kecil untuk ini, tapi baru sampai mendapatkan jumlah kata dan kandungan fonem dalam ayat. Akan tetapi sorting ayat yang mengandung fonem paling "kaya" masih saya lakukan secara manual. Penghapusan ayat yang redundan juga masih manual. Seharusnya algoritma greedy bisa memecahkan masalah ini. Ide sudah ada, tapi implementasi (aduh sengaja dilewat ngetiknya). Sementara ini manual dulu, saya penasaran bagaimana statistik ayat-ayat pilihan ini. Jika komposisi fonemnya tidak terlalu timpang, saya bisa maju untuk mempersiapkan corpus suara. Saya tahu, manual itu tidak baik untuk mahasiswa jurusan informatika, dan saya sedang kuliah di jurusan informatika. Sebisa mungkin 'segalanya' dilakukan otomatis & benar. Hikz (da aku mah apa atuh, hanya...mulai~ mulai~). Hasil kerja "manual" saya (yang lebih cepat daripada menunggu hasil codingan), ternyata cukup baik. Komposisi fonem kumpulan ayat pilihan ternyata tidak terlalu timpang dengan komposisi fonem acuan. Untuk urusan ini Ibu Dosen membolehkan saya untuk lanjut mempersiapkan corpus dengan catatan juga memperbaiki program penyeleksian ayat. Bu Dosen bilang, saya bisa mencoba menggunakan bahasa Perl agar lebih mudah, sebelumnya saya memakai bahasa Java (memori~). Artinya saya butuh waktu adaptasi dengan Perl. Hai, Perl...(perl milk tea, haha). Ada yang udah pengalaman dengan Perl? C'mon Girl!
Saya perlu mendapatkan file suara 500 ayat pilihan (tadi) dengan kurang lebih 10 reciter berbeda. Ya, dalam speech recognition, penyediaan corpus adalah urusan yang "mahal". Nguli. Yep, yep. Kalau dipikir-pikir jadi "ehe he he (<< maksudnya apa?)" juga 500x10 sample suara, saya cut manual. Sebagian dijadikan data training dan sebagian lagi untuk data test. Ada ide untuk ini? Selain nguli? #Garuk2Dagu
Pertanyaan, "Ada cara simple ngga, ya?" muncul berkali-kali. Bikin guling-guling, ketawa sendiri, dan j
Progres TA baru sampai di sini. Setelah saya berhasil melakukan pengumpulan suara bacaan ayat Quran, kira-kira 2/3 reciter saya akan melakukan pemodelan akustiknya. Mungkin menggunakan HTK.
Shadaqallah.
Semoga tugas akhir ini bermanfaat :-)
Dibantu-bantu ya, dengan do'a yang baik, bukan tepuk tangan :))
Aloha,
Eh, Assalamualaikum warahmatullah maksudnya (salamnya ahli surga-Amin ya Rabb)
Apa kabar penggemar setia(?). Kembali dengan sejuta kehangatan & keceriaan bersama saya, Mentari Pagi
B-) huehehehe
Well, back to normal (Emang sebelumnya ngga normal? Mungkin...bisa dibilang gitu! Haha)
Kali ini saya ingin bercerita tentang proses pengerjaan tugas akhir saya. Yep, hanya ingin bercerita panjang tinggi(?) mengenai apa yang telah saya kerjakan, bagaimana prosesnya, kesan subjektif saya dan rencana ke depan sebagai dokumentasi kecil-kecilan untuk mengingatkan kembali jika suatu hari nanti saya lupa. Tapi, semoga saja tidak.
Jadi apa yang saya kerjakan adalah mencoba memodelkan bacaan Quran. Berpegang pada motivasi "Khairukum man ta'allama Al-Quran wa 'allamah", saya membulatkan niat untuk fokus ke bidang Speech Recognition. Sebagai realisasi imaginasi masa kecil kala duduk di selasar putih sambil menatap langit biru.
Pemodelan Bacaan Quran yang sedang saya lakukan memanfaatkan transliterasi buckwalter untuk merepresentasikan tulisan asli seluruh ayat Al-Quran dalam format ASCII agar lebih mudah diproses oleh mesin. Transliterasi Buckwalter ini pertama kali saya ketahui setelah melakukan eksplorasi lanjut terhadap project Corpus Quran oleh Kais Dukes (silakan cek situs http://corpus.quran.com/). Semoga jadi amal jariyah bagi Mr. Dukes & rekan-rekannya atas kontribusi yang berharga ini. Semoga suatu hari saya diberi kesempatan bekerja bersama beliau & orang2 alim lainnya untuk mengembangkan corpus quran atau hal-hal sejenisnya yang penuh manfaat dunia dan akhirat :-)
Transliterasi Buckwalter Quran tidak bulat-bulat saya gunakan. Saya terlebih dahulu mempelajari lebih dalam pola notasi Buckwalter. Kemudian, saya melakukan modifikasi sesuai kebutuhan fonem yang digunakan untuk pemodelan. Setelah melakukan modifikasi secara otomatis berdasarkan pola Buckwalter, untuk memastikan transkripsi fonem yang akan saya gunakan benar, saya melakukan manual checking seluruh transkripsi. Saya menemukan kesulitan terutama pada penanganan waqaf. Contohnya saja, ta marbuthoh yang pada dasarnya dibaca dengan bunyi "t", akan tetapi ketika diwaqafkan bacaannya menjadi bunyi "h". Ada delimiter di akhir ayat, namun bagaimana jika reciter dengan "bebas" menghentikan bacaannya di tengah ayat dan mengganti bunyi ta marbuthoh yang ditemukan menjadi h? Tentu ini tidak salah. Tak ada guru talaqqi & tahsin yang akan menyalahkan muridnya jika membaca demikian. Tapi jika transkripsi yang aku sediakan tidak mampu "memaklumi" kasus ini, sistem bisa saja mengatakannya salah. Setelah konsultasi dengan Dosen Pembimbing saya yang super duper baik, mendukung, mendengarkan kosa kata aneh karangan saya, serta rajin mengingatkan TA hingga semangat terus ter-upgrade otomatis setiap kali bimbingan, pemeriksaan waqaf menjadi batasan pada tugas akhir saya ini. Insyaallah diberikan kesempatan untuk melanjutkan dan menjadikannya penelitian yang lebih baik.
Setelah subjektifitas saya menyatakan transkripsi ini cukup baik, saya melakukan penghitungan statistik kemunculan seluruh fonem dalam Al-Quran memanfaatkan program kecil. Statistik ini saya jadikan acuan yang akan dibandingkan dengan statistik ayat-ayat pilihan dengan kriteria & batasan tertentu sehingga cukup untuk dijadikan model yang merepresentasikan seluruh bunyi yang keluar ketika Al-Quran dibacakan.
Guna memenuhi kebutuhan corpus saya memilih setidaknya 500 ayat Al-Quran. Seratus sembilan ayat di antaranya adalah ayat-ayat gharibah yang memiliki pengucapan yang khas dan benar-benar harus diperhatikan ketika membacanya. Saya ingin agar sistem yang dikembangkan lebih sensitif terhadap ayat-ayat ini. Sisanya, 391 ayat dipilih dengan konsep phonetically rich balance memanfaatkan algoritma greedy. Saya membuat program kecil untuk ini, tapi baru sampai mendapatkan jumlah kata dan kandungan fonem dalam ayat. Akan tetapi sorting ayat yang mengandung fonem paling "kaya" masih saya lakukan secara manual. Penghapusan ayat yang redundan juga masih manual. Seharusnya algoritma greedy bisa memecahkan masalah ini. Ide sudah ada, tapi implementasi (aduh sengaja dilewat ngetiknya). Sementara ini manual dulu, saya penasaran bagaimana statistik ayat-ayat pilihan ini. Jika komposisi fonemnya tidak terlalu timpang, saya bisa maju untuk mempersiapkan corpus suara. Saya tahu, manual itu tidak baik untuk mahasiswa jurusan informatika, dan saya sedang kuliah di jurusan informatika. Sebisa mungkin 'segalanya' dilakukan otomatis & benar. Hikz (da aku mah apa atuh, hanya...mulai~ mulai~). Hasil kerja "manual" saya (yang lebih cepat daripada menunggu hasil codingan), ternyata cukup baik. Komposisi fonem kumpulan ayat pilihan ternyata tidak terlalu timpang dengan komposisi fonem acuan. Untuk urusan ini Ibu Dosen membolehkan saya untuk lanjut mempersiapkan corpus dengan catatan juga memperbaiki program penyeleksian ayat. Bu Dosen bilang, saya bisa mencoba menggunakan bahasa Perl agar lebih mudah, sebelumnya saya memakai bahasa Java (memori~). Artinya saya butuh waktu adaptasi dengan Perl. Hai, Perl...(perl milk tea, haha). Ada yang udah pengalaman dengan Perl? C'mon Girl!
Saya perlu mendapatkan file suara 500 ayat pilihan (tadi) dengan kurang lebih 10 reciter berbeda. Ya, dalam speech recognition, penyediaan corpus adalah urusan yang "mahal". Nguli. Yep, yep. Kalau dipikir-pikir jadi "ehe he he (<< maksudnya apa?)" juga 500x10 sample suara, saya cut manual. Sebagian dijadikan data training dan sebagian lagi untuk data test. Ada ide untuk ini? Selain nguli? #Garuk2Dagu
Pertanyaan, "Ada cara simple ngga, ya?" muncul berkali-kali. Bikin guling-guling, ketawa sendiri, dan j
Progres TA baru sampai di sini. Setelah saya berhasil melakukan pengumpulan suara bacaan ayat Quran, kira-kira 2/3 reciter saya akan melakukan pemodelan akustiknya. Mungkin menggunakan HTK.
Shadaqallah.
Semoga tugas akhir ini bermanfaat :-)
Dibantu-bantu ya, dengan do'a yang baik, bukan tepuk tangan :))
Tidak ada komentar: