Ubah dataframe pyspark menjadi daftar kamus python
Nov 29 2020
Hai, saya baru mengenal pyspark dan saya mencoba mengubah pyspark.sql.dataframe menjadi daftar kamus.
Di bawah ini adalah dataframe saya, tipenya adalah <class 'pyspark.sql.dataframe.DataFrame'>:
+------------------+----------+------------------------+
| title|imdb_score|Worldwide_Gross(dollars)|
+------------------+----------+------------------------+
| The Eight Hundred| 7.2| 460699653|
| Bad Boys for Life| 6.6| 426505244|
| Tenet| 7.8| 334000000|
|Sonic the Hedgehog| 6.5| 308439401|
| Dolittle| 5.6| 245229088|
+------------------+----------+------------------------+
Saya ingin mengubahnya menjadi:
[{"title":"The Eight Hundred", "imdb_score":7.2, "Worldwide_Gross(dollars)":460699653},
{"title":"Bad Boys for Life", "imdb_score":6.6, "Worldwide_Gross(dollars)":426505244},
{"title":"Tenet", "imdb_score":7.8, "Worldwide_Gross(dollars)":334000000},
{"title":"Sonic the Hedgehog", "imdb_score":6.5, "Worldwide_Gross(dollars)":308439401},
{"title":"Dolittle", "imdb_score":5.6, "Worldwide_Gross(dollars)":245229088}]
Bagaimana saya harus melakukan ini? Terima kasih sebelumnya!
Jawaban
1 mck Nov 29 2020 at 19:38
Anda dapat memetakan setiap baris ke dalam kamus dan mengumpulkan hasilnya:
df.rdd.map(lambda row: row.asDict()).collect()
Kiat Pemilik Anjing yang Bermanfaat: Mengapa Penting untuk Membiarkan Anjing Anda Mengendus di Jalan
Jana Duggar: Semua yang Dia Katakan Tentang Cinta dan Jendela 5 Tahunnya untuk Menemukan 'Yang Satu'