Ubah dataframe pyspark menjadi daftar kamus python

Nov 29 2020

Hai, saya baru mengenal pyspark dan saya mencoba mengubah pyspark.sql.dataframe menjadi daftar kamus.

Di bawah ini adalah dataframe saya, tipenya adalah <class 'pyspark.sql.dataframe.DataFrame'>:

+------------------+----------+------------------------+
|             title|imdb_score|Worldwide_Gross(dollars)|
+------------------+----------+------------------------+
| The Eight Hundred|       7.2|               460699653|
| Bad Boys for Life|       6.6|               426505244|
|             Tenet|       7.8|               334000000|
|Sonic the Hedgehog|       6.5|               308439401|
|          Dolittle|       5.6|               245229088|
+------------------+----------+------------------------+

Saya ingin mengubahnya menjadi:

[{"title":"The Eight Hundred", "imdb_score":7.2, "Worldwide_Gross(dollars)":460699653},
 {"title":"Bad Boys for Life", "imdb_score":6.6, "Worldwide_Gross(dollars)":426505244},
 {"title":"Tenet", "imdb_score":7.8, "Worldwide_Gross(dollars)":334000000},
 {"title":"Sonic the Hedgehog", "imdb_score":6.5, "Worldwide_Gross(dollars)":308439401},
 {"title":"Dolittle", "imdb_score":5.6, "Worldwide_Gross(dollars)":245229088}]

Bagaimana saya harus melakukan ini? Terima kasih sebelumnya!

Jawaban

1 mck Nov 29 2020 at 19:38

Anda dapat memetakan setiap baris ke dalam kamus dan mengumpulkan hasilnya:

df.rdd.map(lambda row: row.asDict()).collect()