Spark BigQueryコネクタを使用したカスタムSQL
Nov 24 2020
BigQueryからデータを読み取るためのカスタムSQLがいくつかあります。どうすればそれを実行できますか?オプションをクエリとして使用しようとしましたが、機能しません。クエリオプションを無視し、テーブル全体を読み取ります。
Dataset<Row> testDS = session.read().format("bigquery")
//.option("table", <TABLE>)
.option("query",<QUERY>)
.option("project", <PROJECT_ID>)
.option("parentProject", <PROJECT_ID>)
.load();
回答
DavidRabinowitz Nov 26 2020 at 02:31
これquery
は、このオプションがコネクタで使用できないためです。見るhttps://github.com/GoogleCloudDataproc/spark-bigquery-connector/README.md オプションの完全なリストについては。
あなたが持っているいくつかのオプションがあります:
- カスタムSQLを使用してビューを作成し、ビューから読み取ります
- クエリの結果を使用して一時テーブルを作成し、それらを読み取ってから、テーブルを削除します。