Text Mining
adalah proses ekstraksi data dari suatu sumber data. Hal ini bertujuan untuk
mendapatkan suatu pengetahuan yang baru mengenai topik yang kita pilih.
Pada kesempatan ini saya melakukan text mining dengan query Cybertruck di Twitter, karena Beberapa hari yang lalu Elon Musk sebagai CEO Tesla menunjukkan produk mobil terbarunya, yaitu Cybertruck yang merupakan Truk Pickup Elektrik.
Langkah-langkah :
Pastikan anda sudah mempunyai Twitter API. Dalam melakukan text mining, saya memanfaatkan tools Orange, dan Twitter sebagai sumber data.
Sebelum melakukan text mining, pastikan Orange telah mempunyai add-ons Text, seperti gambar dibawah.
Gambar 1 : Add-Ons |
Setelah itu tinggal masukkan widget dengan proses seperti gambar dibawah.
Gambar 2 : Workflow Orange |
Lalu saya melakukan pencarian menggunakan widget Twitter dengan query Cybertruck, dan mengambil sebanyak 500 Tweets.
Gambar 3 : Twitter Widget |
Lalu selanjutnya saya memasukkan stopwords yang sudah dibuat menggunakan notepad pada widget Preprocess Text. contoh isi stopwords saya dapat dari website ranks.nl
Berikutnya buka widget wordcloud, dan jika masih terdapat kata-kata yang tidak berhubungan dengan topik, masukkan kata tersebut kedalam stopwords dan buka ulang wordcloud.
Gambar 4 : Jumlah Kata yang ada di Word Cloud |
Gambar 5: Word Cloud |
Pada wordcloud terlihat kata "cybertruck" memiliki intensitas paling tinggi dengan jumlah kata sebanyak 510, kemunculan ini paling banyak karena Cybertruck merupakan produk baru yang inovatif dan viral karena bentuknya yang dinilai tidak biasa. Kemudian "tesla" sebanyak 270, sebagai perusahaan yang membuat cybertruck. "elonmusk" sebanyak 144, sebagai CEO dari Tesla. dan diikuti dengan kata lainnya.