Cerita TA [10]

Bismillah,

I am back! Hahaha *gaya pahlawan bertopeng*

Hamdalah.
Sejujurnya, sejak Cerita TA [8] rilis, saya ingin langsung menulis Cerita TA [9]  dan Cerita TA [10] secara berurutan tanpa diselingi oleh tulisan lain. Tapi apalah daya, dengan berbagai alasan dan kondisi hal ini tidak memungkinkan. Hamdalah, yang penting akhirnya tertulis juga.
Seperti pada cerita-cerita TA sebelumnya, pada tulisan ini saya juga ingin menceritakan progres TA saya sampai saat ini. Akhirnya setelah perjalanan panjang (padahal "hanya") berputar-putar pada satu paper, satu konsep, satu algoritma, yang entah kenapa menganalisis algoritma ini dan mengadaptasinya ke dalam permasalahan di tugas akhir saya cukup memakan banyak waktu dan menguras tenaga berpikir (ceileew).

Satu hal yang menarik dari tugas akhir saya adalah dari hasil studi literatur yang saya lakukan, sampai saat ini model akustik yang dibangun untuk sistem pengenal bacaan Quran masih terbatas pada sekelompok ayat tertentu, seperti pada surat Al-Ikhlas, surat-surat pendek pada juz 29 dan 30, dan 5 surat pertama dalam Al-Quran. Belum terdapat model yang dapat dikatakan "cukup" untuk meng-cover seluruh kejadian bunyi dan perubahan artikulasi yang mungkin terjadi ketika ayat Al-Quran dibaca. Nah, mencari solusi dari permasalahan ini adalah inti dari tugas akhir saya. Secara ringkas, di tugas akhir ini saya mengadaptasi dan memodifikasi suatu notasi yang digunakan untuk mengkonversi ortografi Quran ke dalam format UTF-8, dari format ini, saya mempelajari dan memahami polanya, kemudian memodifikasinya lagi menjadi simbol-simbol fonetis. Kumpulan simbol yang merepresentasikan 6236 ayat Quran ini menjadi transkripsi Quran yang kemudian akan diolah dan dipelajari statistik kemunculan setiap fonemnya. Statistik ini perlu saya peroleh untuk menganalisis rich and balanced antara corpus seluruh Quran dan model.

Untuk mendapatkan model, saya pernah menyinggung prosesnya di Cerita TA [9]. Metode yang pertama kali saya coba pemilihan dan skoring ayat untuk model hanya berdasarkan feeling dan tebak-tebak berhadiah, tapi ternyata hasilnya cukup baik terutama dari segi "rich". Sementara itu, hasil adaptasi dan modifikasi dari suatu algoritma yang saya singgung sebelumnya, memberikan hasil yang lebih baik dari segi "balance". Keduanya semacam trade-off. Tapi tentu saja dengan alasan yang logis dan lebih kuat, hasil dari algoritma tadi menjadi pilihan yang "aman" untuk dimodelkan, dengan beberapa catatan tambahan.

Kesimpulannya, saya bisa maju satu langkah :-)
Yieeaay! Hurray!
Selanjutnya yang perlu saya lakukan adalah pelabelan. Dan ini nguli-nya masyaallah.
Insyaallah, man jadda wa jada.
Btw asimilasi huruf nun ke jim yang dimasukkan dalam hukum tajwid "ikhfa" dimodelkan dengan satu fonem baru. Hehe

Oiya, saya mau bilang satu hal bahwa Quran itu memang subhanallah

Tidak ada komentar:

Diberdayakan oleh Blogger.