Sparkのデータフレームの列にある英数字の値からアルファベットを削除する

Aug 18 2020

データフレームの2列は次のようになります。

SKU   | COMPSKU

PT25M | PT10M
PT3H  | PT20M
TH    | QR12
S18M  | JH

Scalaでスパーク

すべてのアルファベットを削除して数字だけを保持するにはどうすればよいですか。

期待される出力：

回答

Shu Aug 18 2020 at 20:40

regexp_replace関数を試してから、ケースwhen otherwise statementを使用して空の値を0に置き換えます。

Example:

df.show()
/*
+-----+-------+
|  SKU|COMPSKU|
+-----+-------+
|PT25M|  PT10M|
| PT3H|  PT20M|
|   TH|   QR12|
| S18M|     JH|
+-----+-------+
*/

df.withColumn("SKU",regexp_replace(col("SKU"),"[a-zA-Z]","")).
withColumn("COMPSKU",regexp_replace(col("COMPSKU"),"[a-zA-Z]","")).
withColumn("SKU",when(length(trim(col("SKU")))===0,lit(0)).otherwise(col("SKU"))).
withColumn("COMPSKU",when(length(trim(col("COMPSKU")))===0,lit(0)).otherwise(col("COMPSKU"))).
show()

/*
+---+-------+
|SKU|COMPSKU|
+---+-------+
| 25|     10|
|  3|     20|
|  0|     12|
| 18|      0|
+---+-------+
*/

1 jayrythium Aug 18 2020 at 21:15

この方法で行うこともできます。

df.withColumn(
    "SKU",
    when(regexp_replace(col("SKU"),"[a-zA-Z]","")==="",0
        ).otherwise(regexp_replace(col("SKU"),"[a-zA-Z]","")) 
).withColumn(
    "COMPSKU",
    when(regexp_replace(col("COMPSKU"),"[a-zA-Z]","")==="", 0
        ).otherwise(regexp_replace(col("COMPSKU"),"[a-zA-Z]",""))
).show()
/*
        +-----+-------+
        |  SKU|COMPSKU|
        +-----+-------+
        |  25 |  10   |
        |   3 |  20   |
        |   0 |  12   |
        |  18 |   0   |
        +-----+-------+
*/

「名前空間stdを使用する」のはなぜですか。悪い習慣だと思いますか？

PHPでHTML / XMLをどのように解析および処理しますか？

テンプレートをヘッダーファイルにのみ実装できるのはなぜですか？

jQueryまたはgetElementByIdなどのDOMメソッドが要素を見つけられないのはなぜですか？

mysqli_fetch_assoc（）は、パラメーター/メンバー関数bind_param（）の呼び出しエラーを予期しています。実際のmysqlエラーを取得して修正する方法は？

ループ条件内のiostream :: eof（つまり、 `while（！stream.eof（））`）が間違っていると見なされるのはなぜですか？

mysql_fetch_array（）/ mysql_fetch_assoc（）/ mysql_fetch_row（）/ mysql_num_rowsなど…パラメータ1がリソースであることが必要です

mysql_real_escape_string（）を回避するSQLインジェクション

クライアント側とサーバー側のプログラミングの違いは何ですか？

再現性の高いパンダの例を作成する方法

next（）またはnextFoo（）を使用した後、スキャナーがnextLine（）をスキップしていますか？

値に対して複数の変数をテストする方法は？