PENELITI yang risetnya berada pada pusat skandal Facebook-Cambridge Analytica soal analisis data untuk iklan politis telah mengungkapkan bahwa metode yang ia pakai mirip seperti yang digunakan Netflix untuk merekomendasikan film untuk penggunanya.

Dalam sebuah surat elektronik pada saya, peneliti Cambridge University Aleksandr Kogan menjelaskan bagaimana model statistika miliknya memproses data Facebook untuk Cambridge Analytica. Tingkat keakuratan yang ia klaim menunjukkan bahwa metodenya bekerja sebaik metode penyasaran pemilih berbasis demografi seperti ras, usia, dan gender.

Jika pengakuan Kogan benar, artinya pemodelan digital yang digunakan Cambridge Analytica jauh dari beberapa klaim yang menyebutnya sebagai sebuah bola kristal virtual. Meski demikian, angka yang Kogan berikan menunjukkan apa yang mungkin—dan tidak mungkin—terjadi jika sebuah entitas menggabungkan data pribadi dengan machine learning untuk tujuan politik.

Sebelum kita lanjut, ada satu isu kunci yang menyangkut kepentingan publik. Angka-angka yang Kogan berikan menunjukkan bahwa informasi mengenai kepribadian pengguna atau “psikografi” hanya bagian kecil dalam pemodelan untuk menyasar warga.

Model yang digunakan Kogan bukan berdasarkan pada kepribadian semata, namun model yang menggabungkan demografi, pengaruh sosial, kepribadian, dan banyak hal lain menjadi satu korelasi besar. Pendekatan gabungkan-semua-korelasi-dan-panggil-saja-ini-kepribadian menjadi alat kampanye yang berharga, meski produk yang dijual tidak sepenuhnya seperti apa yang digadangkan.

Facebook tahu jika seorang warga AS pemilih Partai Republik

Pada 2013, peneliti dari Cambridge University Michal Kosinski, David Stillwell, dan Thore Graepel menerbitkan sebuah artikel tentang kekuatan prediktif data Facebook, menggunakan informasi yang dikumpulkan melalui tes kepribadian online.

Analisis awal mereka hampir identik dengan yang digunakan Sayembara Netflix, menggunakan SVD untuk mengkategorisasi pengguna dan hal-hal yang mereka suka (“like”) ke dalam 100 faktor teratas.

Makalah mereka menunjukkan bahwa model faktor dengan menggunakan “like” Facebook saja 95% akurat dalam membedakan responden berkulit putih atau hitam, 93% akurat dalam membedakan laki-laki dari perempuan, dan 88% akurat membedakan orang yang mengidentifikasi dirinya sebagai laki-laki gay dari laki-laki heteroseksual.

Model ini bahkan dapat membedakan kelompok Republikan dari Demokrat dengan tingkat keakuratan 85%. Model ini juga dapat memprediksi, meski tidak sebegitu akurat, skor pengguna dalam tes kepribadian “Lima Besar”.

Menanggapi keluarnya hasil penelitian tersebut, publik protes; dan dalam beberapa minggu Facebook kemudian membuat “like” pengguna menjadi privat.

Kogan dan Chancellor, juga peneliti Cambridge University pada saat itu, mulai menggunakan data Facebook untuk penyasaran dalam pemilihan umum sebagai bagian dari sebuah kolaborasi dengan SCL, perusahaan induk Cambridge Analytica.

Kogan mengundang Kosinski dan Stillwell bergabung dalam proyek tersebut, tapi kolaborasi antara mereka tidak terwujud.

Kosinski dilaporkan mencurigai bahwa Kogan dan Chancellor telah melakukan rekayasa-terbalik model “like” Facebook untuk Cambridge Analytica. Kogan membantah ini. Ia mengatakan proyeknya “membangun semua model yang kami mereka punya, menggunakan data kami sendiri yang dikumpulkan menggunakan perangkat lunak kami sendiri.”

Apa yang sebenarnya dilakukan Kogan dan Chancellor?

Seiring perkembangan cerita ini, saya melihat bahwa jelas Kogan dan Chancellor memang mengumpulkan banyak data menggunakan aplikasi thisisyourdigitallife. Mereka jelas dapat membuat model prediktif SVD seperti yang ada dalam penelitian Kosinski dan Stillwell.

Maka saya mengirim surel pada Kogan bertanya jika itu yang dia lakukan. Saya kaget juga ketika ia membalas.

“Kami tidak betul-betul menggunakan SVD,” tulisnya.

Ia menggarisbawahi bahwa SVD dapat menemui masalah ketika sejumlah pengguna memiliki lebih banyak “like” daripada pengguna lain. Sebaliknya, Kogan menjelaskan, “Tekniknya sebetulnya sesuatu yang kami kembangkan sendiri… Ini bukan sesuatu yang ada di ranah publik.”

Tanpa menjelaskan secara mendetil, Kogan menjelaskan bahwa metode mereka adalah “pendekatan ko-okurensi multi langkah”.

Namun, jawaban dia mengkonfirmasi bahwa pendekatan yang ia gunakan memang mirip dengan SVD atau metode faktorisasi matriks lainnya, seperti yang digunakan Sayembara Netflix, dan model Facebook Kosinki-Stillwell-Graepel. Reduksi dimensionalitas merupakan inti dari modelnya.

Sumber: http://www.pikiran-rakyat.com/luar-negeri/2018/04/19/penjelasan-cambridge-analytica-yang-mengambil-data-pribadi-dari-facebook

LEAVE A REPLY

Please enter your comment!
Please enter your name here