Beberapa bulan ini aku di chat sama orang-orang yang tidak aku kenal dan ingin tau lebih lanjut tentang sentimen analisis saat tugas akhir dulu.

So, biar teman-teman memiliki gambaran sepertinya kalian harus baca ini dulu yak!!! Budayakan Membaca!!!

1. Mencari sumber data seperti blog, twitter dan berbagai platform lainnya. Contoh: aku dulu pake twitter
Alasan menggunakan twitter: Soalnya gampang dan resources literature nya banyak di jurnal-jurnal

2. Kumpulkan data menggunakan API , crawler atau yang lainnya.
Oh iya guys crawling sama scraping bedaaaaaa.
Kalo ga percaya coba cari di google.
3. Stored data Datanya kalian simpan baik baik. Semakin banyak semakin baik. Nanti di post selanjutnya bakal aku bahas kenapa data banyak itu mempengaruhi akurasi.

4. Prepocessing
Prepocessing dibagi jadi 2
Pre 1 itu biasanya menghilangkan kaya @# tags dll bisa pake nltk atau regex (regular expression)
Pre 2 itu biasanya tokenizing, stemming part of speech stopword dll

Jangan tanya kenapa harus pake prepocessing karna jawabannya udah jelas. Kalo kita ga bersihin datanya soalnya kebersihan data mempengaruhi hasil.

5. Convert text kita menjadi number
Kalo pake python gambang banget tinggal ganti pake word to vec.

6. Build the model
Nah ini tinggal membangun model yg kalian inginkan. Banyak banget loh ya di google kalian bisa cari. Kalo aku dulu pake DBN
(Deep Belief Network). Nanti mungkin akan dibahas jila sempat 😂😂


0 Comments

Leave a Reply

Your email address will not be published. Required fields are marked *