Mengembangkan Ekologi Data untuk Praktik Kebijakan: Pengalaman PolicyCLOUD dan Penilaiannya

Dec 01 2022
Ofer Biran, Oshrit Feder, Yosef Moatti, Athanasios Kiourtis, Dimosthenis Kyriazis, George Manias, Argyro Mavrogiorgou, Nikitas M. Sgouros, Martim T.

Ofer Biran, Oshrit Feder, Yosef Moatti, Athanasios Kiourtis, Dimosthenis Kyriazis, George Manias, Argyro Mavrogiorgou, Nikitas M. Sgouros, Martim T. Barata, Isabella Oldani, María A. Sanguino, Pavlos Kranas, Samuele Baroni, Miquel Mila Prat, Sergio Salmerón dan Metodiyka Tarlyovska

Memecahkan masalah kebijakan praktis menuntut data yang biasanya terdiri dari berbagai jenis. Dengan demikian, pembuat kebijakan harus mengelola berbagai jenis sumber data dan berbagai metode dan metodologi ilmiah yang diperlukan untuk membersihkan, memfilter, menganalisis, memvalidasi, dan mungkin menambah kumpulan data saat diserap. Pemrosesan seperti itu wajib jika data ingin memberikan nilai.

PolicyCLOUD adalah proyek penelitian berkelanjutan yang didanai UE yang memberikan pendekatan data-sentris inovatif untuk praktik kebijakan. Tujuan ini dicapai melalui ekosistem berbasis cloud yang mendukung manajemen kebijakan berbasis data dengan cara yang efisien yang sehat secara hukum dan etis[2]. Ekosistem ini terdiri dari lingkungan berbasis cloud yang unik dan terintegrasi yang menargetkan penyerapan dan penggunaan data yang mudah dan efisien demi pembuatan, pemantauan, dan penilaian kebijakan.

Dalam artikel penelitian kami , yaitu akses terbuka di Data & Kebijakan [5], kami menjelaskan jenis sumber data yang digunakan oleh ekosistem, beberapa kemampuan analitik bawaan dari lingkungan ini, dan penggunaan awal PolicyCLOUD untuk memecahkan masalah kebijakan.

PolicyCLOUD menawarkan kotak alat kepada ilmuwan data untuk menyerap dan menyiapkan kumpulan data untuk analisis kebijakan. Secara khusus, PolicyCLOUD menawarkan cara yang efisien untuk:

  1. daftarkan kumpulan data dan fungsi analitik;
  2. menerapkan pipeline fungsi analitik secara langsung ke kumpulan data setelah penyerapan, baik untuk mengubah data (misalnya, menghapus informasi yang tidak relevan) atau untuk mengekstrak wawasan awal (misalnya, menambahkan wawasan analitik seperti analisis sentimen untuk memperkaya kumpulan data):
  3. menerapkan fungsi analitik ke kumpulan data setelah penyerapan untuk mengekstrak dan/atau memvisualisasikan informasi dari data yang disimpan dalam penyimpanan data PolicyCLOUD.

Dari sudut pandang arsitektural, PolicyCLOUD telah dibangun di atas penyedia cloud tanpa server sehingga setiap fungsi analitik yang dipanggil selama atau setelah penyerapan data dijalankan di lingkungannya sendiri yang terisolasi (yaitu, dalam wadah). Ini memungkinkan skalabilitas dan paralelisme tingkat tinggi. Selain itu, model bayar per penggunaan tanpa server sangat menarik bagi pemilik infrastruktur PolicyCLOUD dan pembuat kebijakan, karena keseluruhan penggunaan platform PolicyCLOUD mungkin akan mengalami fluktuasi yang besar.

Untuk memungkinkan pembuat kebijakan mengekstrak wawasan berharga dari kumpulan data dengan cara yang sah dan adil terhadap individu dan masyarakat pada umumnya, PolicyCLOUD telah dikembangkan di sekitar kerangka kerja komprehensif yang menggabungkan persyaratan teknis dan organisasi untuk mengatasi masalah hukum dan etika yang mungkin timbul di konteks pembuatan kebijakan berbasis bukti. Kerangka kerja ini terdiri dari beberapa kontrol legal dan etis, selain tindakan yang ditujukan untuk meminimalkan jumlah data pribadi yang dikumpulkan dari kumpulan data (sesuai dengan prinsip minimalisasi data) dan memastikan bahwa semua operasi data yang diperlukan dilakukan dengan cara yang memungkinkan data subjek untuk menggunakan hak mereka (misalnya, di bawah GDPR). Khususnya, parameter pendaftaran (baik untuk set data dan fungsi analitik) memungkinkan pendaftar untuk memberikan informasi tentang tindakan spesifik yang telah diambil untuk mengatasi risiko bias yang melekat pada fungsi/set data, atau kendala hukum/etis relevan lainnya yang mungkin ada (misalnya, keberadaan data pribadi dalam kumpulan data, pengelolaan trade-off yang relevan dalam pengembangan fungsi, dan/atau otorisasi dari pemegang hak yang relevan). Setelah pendaftaran selesai, informasi yang diberikan selama proses pendaftaran ini nantinya dapat diakses oleh pengguna PolicyCLOUD mana pun, sehingga dapat dipertimbangkan saat menilai kelayakan set data dan/atau penggunaan fungsi tertentu dalam konteks tertentu. g., keberadaan data pribadi dalam suatu kumpulan data, pengelolaan trade-off yang relevan dalam pengembangan fungsi, dan/atau otorisasi dari pemegang hak yang relevan). Setelah pendaftaran selesai, informasi yang diberikan selama proses pendaftaran ini nantinya dapat diakses oleh pengguna PolicyCLOUD mana pun, sehingga dapat dipertimbangkan saat menilai kelayakan set data dan/atau penggunaan fungsi tertentu dalam konteks tertentu. g., keberadaan data pribadi dalam suatu kumpulan data, pengelolaan trade-off yang relevan dalam pengembangan fungsi, dan/atau otorisasi dari pemegang hak yang relevan). Setelah pendaftaran selesai, informasi yang diberikan selama proses pendaftaran ini nantinya dapat diakses oleh pengguna PolicyCLOUD mana pun, sehingga dapat dipertimbangkan saat menilai kelayakan set data dan/atau penggunaan fungsi tertentu dalam konteks tertentu.

PolicyCLOUD juga dapat memanfaatkan kekuatan simulasi sebagai sumber wawasan, untuk memungkinkan keputusan kebijakan dirancang berdasarkan hasil simulasi dari solusi alternatif. Hal ini dicapai melalui Politika [4], sebuah kerangka kerja di luar lingkungan PolicyCLOUD yang diimplementasikan selama proyek yang menawarkan metodologi meta-simulasi baru untuk desain kebijakan. Metodologi ini memudahkan untuk mensimulasikan kebijakan yang diusulkan dan melakukan analisis komparatif dan evaluasi asumsi, mekanisme, dan hasil mereka. Politika terintegrasi dengan lingkungan PolicyCLOUD melalui antarmuka tujuan umum yang dapat digunakan untuk menambah platform dengan kerangka kerja eksternal lainnya juga, sehingga memfasilitasi perluasan platform proyek dengan alat analitik eksternal.

Tabel 1: Contoh hasil untuk kasus penggunaan radikalisasi.

Kami menerapkan PolicyCLOUD augmented with Politika untuk mensimulasikan kebijakan yang bertujuan membatasi penyebaran radikalisasi melalui media sosial. Kami berasumsi bahwa proses radikalisasi menampilkan adopsi progresif cita-cita politik, sosial, atau agama ekstrem dalam populasi melalui pengaruh sosial. Berdasarkan asumsi tersebut, kami mensimulasikan, membandingkan, dan mengevaluasi berbagai alternatif kebijakan untuk membatasi penyebaran radikalisasi dalam suatu populasi melalui pengaruh sosial. Alternatif-alternatif ini mengeksplorasi periode pembatasan yang berbeda untuk radikal berbahaya dan memperkirakan biayanya, bersama dengan efeknya terhadap persentase akhir radikal dalam populasi. Tabel 1, yang dihasilkan dari PolicyCLOUD melalui penggunaan Politika sebagai alat eksternal, memberikan beberapa contoh hasil yang kami terima untuk berbagai alternatif kebijakan. Setiap baris dalam tabel ini sesuai dengan alternatif yang berbeda. Dua kolom pertama menjelaskan nilai-nilai yang ditetapkan oleh pembuat kebijakan untuk parameter kebijakan batasan_ambang batas (perkiraan jumlah radikalisasi di atas batas mana radikal harus dibatasi) dan durasi_batasan (periode waktu untuk batasan radikal). Tiga kolom berikutnya menjelaskan persentase kaum radikal terbatas, persentase keseluruhan kaum radikal, dan biaya kebijakan pembatasan yang dihitung oleh Politika pada akhir simulasi setiap alternatif. Kolom terakhir menjelaskan jumlah maksimum koneksi yang dapat dimiliki seseorang dalam populasi, seperti yang ditetapkan oleh pembuat kebijakan, yang memberikan perkiraan tingkat inklusivitas dalam kelompok sosial. Secara umum,

Salah satu pengadopsi awal PolicyCLOUD adalah kotamadya Sofia, Bulgaria, yang menggunakan toolbox untuk beberapa kasus penggunaan. Dalam salah satu kasus penggunaan tersebut, pemerintah kota Sofia telah menggunakan PolicyCLOUD untuk meningkatkan infrastruktur jalan kota.

Fokus upaya pemerintah kota di bidang ini adalah untuk meningkatkan kebijakan terkait infrastruktur jalan daerah, melalui analisis data dan sinyal yang bergantung pada lokasi yang disediakan oleh warga. Berkat PolicyCLOUD, kotamadya Sofia telah mampu melakukan analisis terperinci tentang distribusi teritorial sinyal berdasarkan kategori/jenis, wilayah, distrik, rute transportasi utama, dan banyak lagi. Hal ini memungkinkan pemerintah kota dan daerah untuk mengidentifikasi masalah infrastruktur jalan dan lingkungan perkotaan sekitarnya dan kemudian mengadopsi atau mengubah keputusan kebijakan, termasuk perencanaan anggaran, untuk meningkatkan efektivitas anggaran dan sumber daya publik. Analisis terperinci ini juga dirancang untuk membantu pemerintah kota Sofia meningkatkan kontrol dan pemantauan, serta menciptakan sistem peringatan dini.

Kemampuan menarik lainnya dari PolicyCLOUD termasuk teknologi visualisasinya, yang dapat digunakan oleh pembuat kebijakan untuk mengidentifikasi tren, dan analitik prediktifnya, yang memproses data yang berkaitan dengan lokasi dan topik tertentu serta memprediksi intensitas dan jangkauan tindakan yang diperlukan.

Pada tahun 2022, anggaran pemerintah kota Sofia untuk perbaikan dan pemeliharaan jalan sangat besar. Kami percaya bahwa analisis prediktif yang diterapkan pada kecelakaan di jalan raya akan mengurangi anggaran ini dengan menunjukkan dengan tepat area yang membutuhkan perbaikan dan peningkatan terbesar. Kotamadya Sofia mengharapkan prediksi yang akurat tentang jenis dan kategori insiden sebagai fungsi distribusi geografis akan menjadi penting untuk perencanaan pengeluaran anggaran.

Untuk skenario infrastruktur jalan Sofia, alat analisis data eksplorasi PolicyCLOUD SKA-EDA digunakan. SKA-EDA memungkinkan eksplorasi kumpulan data berdasarkan analisis deskriptif yang dilakukan dengan visualisasi data. Lebih khusus lagi, SKA-EDA adalah alat analisis data eksplorasi yang mengumpulkan kumpulan data, menerapkan transformasi, melakukan beberapa perhitungan, dan menghasilkan distribusi yang berbeda (dalam format JSON) yang biasanya diplot menggunakan komponen visualisasi PolicyCLOUD. Beberapa distribusi variabel antara lain distribusi frekuensi uni/bi (frekuensi kejadian untuk satu/dua variabel); distribusi geografis (representasi grafis dari jumlah peristiwa yang terjadi pada posisi geografis tertentu); akumulasi distribusi (menjumlahkan nilai variabel numerik tertentu di beberapa kategori);

Distribusi ini memungkinkan pembuat kebijakan untuk melakukan analisis grafis dengan memperoleh, misalnya, distribusi “kabupaten” (Gambar 1) atau distribusi teritorial sinyal menurut kabupaten (Gambar 2) untuk kumpulan data infrastruktur jalan yang disediakan oleh proyek percontohan.

Gambar 1: Distribusi kabupaten Sofia untuk dataset infrastruktur jalan

Gambar 2: Distribusi teritorial sinyal menurut distrik Sofia untuk dataset infrastruktur jalan

Penerapan awal PolicyCLOUD juga mencakup kebijakan cerdas untuk pengembangan industri pertanian pangan, yang berfokus pada sektor anggur, dan analisis media sosial terkait pemasaran anggur Aragon (Spanyol). Dalam kasus ini, PolicyCLOUD digunakan dalam berbagai cara.

Pertama, Politika digunakan untuk evaluasi berbagai alternatif kebijakan penetapan harga dan periklanan yang dapat meningkatkan daya saing merek anggur terhadap persaingan mereka. Berdasarkan skenario ini, kami telah mengidentifikasi faktor-faktor penting dalam praktik digital untuk pembuatan kebijakan dan membagikan pelajaran yang dipetik dalam hal efisiensi, kemanjuran, kecukupan, dan kemudahan penggunaan untuk ekosistem yang dihasilkan.

Kedua, PolicyCLOUD memungkinkan pengguna akhir memiliki pemahaman yang lebih luas tentang pasar dan kebutuhan serta kepuasan pelanggan. Sasaran penting ini dicapai dengan menerapkan alat Analisis Tren dan Analisis Sentimen ke data media sosial (khususnya tweet). Alat-alat ini memungkinkan pengguna untuk memfilter konten media sosial menggunakan ontologi/taksonomi khusus yang dibuat langsung oleh pengguna untuk mengambil informasi berguna dan data berkualitas. Berdasarkan data yang difilter ini, Pembuat Kebijakan dapat mengakses ikhtisar terperinci tentang situasi tersebut. Memfilter output per lokasi geografis tidak hanya membantu memantau status wilayah tertentu, tetapi juga memahami apresiasi produk sebagai fungsi lokasi. Kemungkinan penyaringan sementara dari hasil memudahkan analisis dampak kebijakan atau peraturan tertentu yang diperkenalkan. Lewat sini,

Agar konten PolicyCLOUD tersedia untuk umum, kami juga mengembangkan Data Marketplace (https://marketplace.policycloud.eu/), di mana aset terkait PolicyCLOUD seperti kumpulan data yang dieksploitasi, alat yang dikembangkan, tutorial yang relevan, dan makalah penelitian dapat diakses secara terbuka.

Tentang Penulis

Ofer Biran, Oshrit Feder dan Yosef Moatti berbasis di IBM Research di Haifa, Israel. Athanasios Kiourtis, Dimosthenis Kyriazis, George Manias, Argyro Mavrogiorgou, Nikitas M. Sgouros berafiliasi dengan Departemen Sistem Digital di Universitas Piraeus di Yunani. Martim T. Barata dan Isabella Oldani berada di Konsultan Hukum ICT di Milan, Italia. Pavlos Kranas berbasis di LeanXcale Research and Development di Madrid, Spanyol. Samuele Baroni berbasis di Maggioli SpA Research and Innovation, Santarcangelo di Romagna, Italia. Miquel Mila Prat dan Sergio Salmerón berada di grup Riset & Inovasi Atos di Paris, Prancis. Metodiyka Tarlyovska adalah Penasehat Hukum Senior di Sofia Municipality, Bulgaria.

Referensi

[1] WN Dunn, Analisis Kebijakan Publik: Sebuah Pengantar, Routledge, 2017.

[2] D. Kyriazis dkk, “PolicyCLOUD: Analytics sebagai Layanan yang Memfasilitasi Manajemen Kebijakan Publik Berbasis Data yang Efisien. Dalam: Maglogiannis I., Iliadis L., Pimenidis E. (eds) Aplikasi dan Inovasi Kecerdasan Buatan. AIAI 2020. Kemajuan IFIP dalam Teknologi Informasi dan Komunikasi, vol 583. Springer, 2020.

[3] Hu, VC, Kuhn, DR, Ferraiolo, DF, & Voas, J., “Kontrol akses berbasis atribut”. Komputer , vol. 48 , tidak. 2, 85–88, 2015.

[4] Nikitas M. Sgouros. 2022. Politika: Menerapkan Metodologi Meta-Simulasi Baru untuk Desain Kebijakan Publik di Web. Pemerintahan Digital: Penelitian dan Praktik (Baru Diterima (Oktober 2022)).https://doi.org/10.1145/3568167

[5] Biran, O., dkk (2022). PolicyCLOUD: Prototipe ekosistem tanpa server cloud untuk analitik kebijakan. Data & Kebijakan, 4 , E44. doi:10.1017/dap.2022.32