PODCAST

Mengenal Ensemble Decision Tree, “Akar” Dari Sistem BRIBrain

Bantu atasi pelemahan kondisi ekonomi akibat pandemi, BRI melakukan terobosan dengan menelurkan BRIBRAIN, platform berbasis kecerdasan buatan dan machine learning

Tio Anta Wibawa

Tio Anta Wibawa

13 November 2020 • 2 mins reading

Mengenal Ensemble Decision Tree, “Akar” Dari Sistem BRIBrain

Menghadapi melemahnya perekonomian negeri akibat pandemi, BRI mengeluarkan inovasi dengan mengeluarkan platform digital berbasis kecerdasan buatan dan machine learning bernama BRIBrain. Platform ini bertujuan untuk membantu Pemulihan Ekonomi Nasional (PEN) dengan cara menggerakkan kegiatan ekonomi masyarakat khususnya pelaku usaha dengan skala ultra mikro lewat digital banking.


BRIBrain dibangun dengan digitalisasi Risk Management Framework lewat empat pilar yaitu BRILink Score, Credit Scoring, Customer Profiling dan Internal Fraud Score. Untuk mendigitalisasi empat hal tersebut, kami menggunakan metodologi Ensemble Decision Tree agar mesin bisa mempelajari kebiasaan nasabah secara optimal dan BRI dapat memberikan pinjaman yang sesuai dengan kemampuan masing-masing nasabah.


Analogi cara kerja sebuah Decision Tree sama seperti ketika kita ingin memutuskan melakukan sesuatu. Biasanya, saat memutuskan sesuatu kita telah melalui banyak pertimbangan keputusan-keputusan kecil sebelum akhirnya mencapai keputusan akhir itu sendiri. Contoh sederhananya adalah ketika kita ingin makan siang. Pilihan pertama yang harus kita tentukan adalah apakah menu makan siang yang ingin kita makan? Setelah Anda tahu menu makan siang apa yang ingin Anda makan, Anda harus melalui fase pilihan apakah kita akan memasak menu tersebut, atau pergi ke restoran, atau membeli menggunakan jasa pengantaran makanan. Jika Anda memutuskan memasak, Anda kemudian harus menentukan bahan-bahan apa saja yang Anda perlukan. Jika ternyata Anda tidak memiliki bahan-bahan tersebut, Anda harus memilih apakah akan tetap memasak menu tersebut namun Anda harus pergi ke pasar untuk membeli bahan, atau mengganti pilihan menu makan siang sesuai apa yang Anda miliki di dapur, atau mengganti keputusan untuk makan di restoran demi makan siang menu tersebut.


Setiap hari, kita dihadapkan dengan proses pengambilan keputusan dalam berbagai aspek kehidupan. Dalam dunia machine learning, proses pengambilan keputusan ini disebut dengan decision tree. Machine learning akan mulai dengan sebuah node atau simpul yang kemudian bercabang ke node lainnya hingga akhirnya mencapai “daun” yang merupakan sebuah keputusan. Masing-masing node akan memiliki sebuah pertanyaan yang bertujuan mengklasifikasikan masing-masing data. Cabang-cabang dari node tersebut akan mengalirkan data sesuai klasifikasi yang didapat dari hasil pertanyaan tersebut ke masing-masing node selanjutnya hingga akhirnya mencapai daun atau sebuah kesimpulan.


Sesuai namanya, Ensemble Decision Tree merupakan gabungan beberapa decision tree yang akan menghasilkan kesimpulan yang lebih akurat dari semua data yang ada. Semakin banyak parameter yang bisa terukur, semakin akurat pula hasil yang akan kita dapatkan. Secara teknis, Ensemble Decision Tree memiliki dua cara, yaitu bagging dan boosting. Bagging (bootstrap aggregating) dilakukan dengan membuat beberapa decision tree berdasarkan data yang kita miliki dan kemudian dilakukan vote untuk menentukan decision tree terbaik. Sedangkan boosting adalah proses sekuensial pembuatan decision tree dengan cara mengoreksi kesalahan prediksi atau kesimpulan pada decision tree sebelumnya hingga tercipta decision tree baru yang lebih akurat.


Pada platform BRIBrain, kami menggunakan teknik boosting terbaru yaitu Extreme Gradient Boosting dalam metode ensemble decision tree. Extreme Gradient Boosting atau xgBoost merupakan pengembangan dari teknik boosting yang sudah ada sebelumnya yaitu Adaptive Boosting dan Gradient Boosting Machine. Perbedaannya, proses komputasi xgBoost dapat berjalan lebih cepat karena optimasi penggunaan memori dan cache pada sistem dapat bekerja lebih efisien meskipun harus menghadapi data-data berukuran besar. Selain itu, xgboost juga dapat mengontrol Overfitting atau terlalu fokus pada set data tertentu, hingga tidak bisa memprediksi dengan tepat jika diberikan set datat lain yang serupa. Sehingga pada akhirnya, semua proses Risk Management Framework di atas dapat terdigitalisasi dengan baik dan calon nasabah dapat terseleksi secara optimal.


Tio Anta Wibawa

Assistant Manager Big Data Analyst - Digital Center Of Excellence Division