Apache Flink - Tabellen-API und SQL

Die Tabellen-API ist eine relationale API mit einer SQL-ähnlichen Ausdruckssprache. Diese API kann sowohl Stapel- als auch Stream-Verarbeitung durchführen. Es kann in Java- und Scala-Dataset- und Datastream-APIs eingebettet werden. Sie können Tabellen aus vorhandenen Datensätzen und Datenströmen oder aus externen Datenquellen erstellen. Über diese relationale API können Sie Vorgänge wie Verbinden, Aggregieren, Auswählen und Filtern ausführen. Unabhängig davon, ob es sich um eine Stapel- oder eine Stream-Eingabe handelt, bleibt die Semantik der Abfrage unverändert.

Hier ist ein Beispiel für ein Tabellen-API-Programm -

// for batch programs use ExecutionEnvironment instead of StreamExecutionEnvironment
val env = StreamExecutionEnvironment.getExecutionEnvironment

// create a TableEnvironment
val tableEnv = TableEnvironment.getTableEnvironment(env)

// register a Table
tableEnv.registerTable("table1", ...) // or
tableEnv.registerTableSource("table2", ...) // or
tableEnv.registerExternalCatalog("extCat", ...)

// register an output Table
tableEnv.registerTableSink("outputTable", ...);
// create a Table from a Table API query
val tapiResult = tableEnv.scan("table1").select(...)
// Create a Table from a SQL query
val sqlResult = tableEnv.sqlQuery("SELECT ... FROM table2 ...")

// emit a Table API result Table to a TableSink, same for SQL result
tapiResult.insertInto("outputTable")

// execute
env.execute()