Cara Merintis Karier Sebagai "Data Scientist"
Belajar dari Advisor Data Science KoinWorks Rifan Kurnia di #SelasaStartup
Data Scientist termasuk salah satu profesi yang kini sangat dicari oleh perusahaan teknologi. Kebutuhan yang besar ini rupanya tidak sejalan dengan ketersediaan talenta di Indonesia. Ketersediaan talenta di profesi ini masih langka, lagipula tidak semua orang tertarik menggeluti bidang ini.
SelasaStartup edisi (12/12) mengundang Advisor Data ScienceKoinWorks Rifan Kurnia untuk berbagi seputar tips merintis karier sebagai Data Scientist, mulai dari sejarah profesi ini bermula, bagaimana deskripsi kerjanya, apa saja yang harus dikuasai, dan sebagainya.
Berikut rangkumannya:
1. Komponen dasar
Dalam bekerja, setidaknya data scientist membutuhkan tiga komponen dasar yang saling terkait satu sama lain. Komponen tersebut adalah ketersediaan data yang berlimpah, ketersediaan data scientist, dan terakhir ada riset, insight, dan rekomendasi.
Menurut Rifan, riset, insight, dan masukan adalah produk akhir yang dihasilkan sebagai value dari dua komponen sebelumnya.
Selanjutnya, data yang sudah dikumpulkan oleh data scientist digunakan untuk membangun machine learning. Ibaratnya, machine learning itu seperti bayi yang membutuhkan penyangga, ditopang oleh data sebagai dudukan agar bayi bisa duduk tegak.
"Machine learning itu pada awalnya seperti bayi yang belum bisa apa-apa. Bayi butuh penyangga untuk menopang berat badannya dengan data-data yang dikumpulkan. Lalu diajari perlahan-lahan agar bisa pintar."
2. Keahlian yang dibutuhkan
Untuk merintis karier sebagai data scientist setidaknya membutuhkan tiga keahlian. Menguasai ilmu matematika, setidaknya memiliki keahlian di bidang studi statistik. Selanjutnya menguasai keahlian programming, mulai dari computer science, software engineering, dan systems development. Terakhir, menguasai ilmu bisnis ekonomi/finansial/marketing/operasional/manajemen.
Seluruh keahlian ini harus dikuasai calon data scientist. Menurut Rifan, semua orang kini bisa menjadi data scientist, meski berasal dari bidang studi lainnya. Kini semua bahan-bahan bisa dipelajari lewat internet. Ada banyak situs yang menyediakan bahan materi tentang profesi data scientist.
"Teman-teman saya dari industri perbankan, dulunya bukanlah dari orang statistik. Tapi mereka bisa jadi data scientist karena belajar dari nol. Ada banyak situs yang bisa dikunjungi menyediakan materi berlimpah tentang data science. Jadi profesi ini tidak terbatas untuk orang statistik atau dari matematika saja," kata Rifan.
Saat ini ada banyak modul yang tersebar secara online dan bisa diakses siapapun. Berbagai situs seperti Coursera, Udacity, Kaggler menjadi rekomendasi utama sebagai referensi untuk mulai belajar dari nol.
3. Pahami perbedaan deskripsi kerja
Data scientist, business analyst, data analyst, developer, data engineer, atau developer operations adalah profesi yang berbeda, namun mereka saling berkaitan satu sama lainnya karena bekerja berdasarkan data.
Data scientist dan data analyst seringkali disamakan, padahal kalau dilihat dari deskripsi kerjanya, data scientist sedikit bersinggungan dengan business analyst. Menurut Rifan, data scientist tidak hanya menganalisis data tapi juga melakukan eksperimen untuk membuktikannya. Sementara data analyst tugasnya hanya menganalisis data.
Sementara deskripsi kerja developer adalah melakukan kolaborasi dengan business analyst dan data analyst, menganalisis apa yang mereka inginkan dalam bentuk coding. Selanjutnya analisis tersebut dikonversi menjadi desain piranti lunak.
4. Komponen software untuk bekerja
Setidaknya ada lima komponen software yang diperlukan untuk bekerja sebagai data scientist. Mulai dari data warehouse, data treatment, status model, art, dan teknologi. Untuk data warehouse (DWH), misalnya sebagai tempat seluruh data disimpan, ada beberapa software yang bisa dimanfaakan, seperti mongoDB dan MySQL.
Kedua, mentransformasikan data dengan memanfaatkan software Spark dan SQL. Selanjutnya Anda bisa menggunakan software untuk memvisualisasikan data dengan sentuhan seni, memanfaatkan ggplot2 dan sejenisnya.
5. Pahami bisnis perusahaan
Data scientist tidak hanya harus mengerti cara menganalisis data tapi juga harus paham dengan dunia bisnis perusahaan yang dianalisis. Dengan memahami bisnis, Anda bisa berkomunikasi ke manajemen perusahaan dan konsumen bagaimana strategi yang harus dilakukan perusahaan berdasarkan analisis data yang Anda telusuri.
Kebutuhan data scientist sebenarnya tidak hanya untuk dunia teknologi. Tenaga ini dibutuhkan perusahaan dari berbagai sektor industri, seperti perbankan, dunia olahraga dan edukasi, kesehatan, transportasi & logistik, travel, media, IT, dan sebagainya.
6. Mulai bekerja
Setelah semua poin di atas sudah dilakukan, langkah berikutnya adalah memecahkan masalah. Caranya dengan mengumpulkan data sebanyak-banyaknya, kemudian membuat solusi. Contoh yang dilakukan data scientist di industri p2p lending adalah membuat prediksi churn rate, memetakan segmentasi konsumen, underwriting-nya seperti apa, dan bagaimana cross-sell dan up-sell-nya.