Apache Flink - API de tabela e SQL
A API de tabela é uma API relacional com linguagem de expressão semelhante a SQL. Esta API pode fazer processamento em lote e fluxo. Ele pode ser incorporado com APIs Java e Scala Dataset e Datastream. Você pode criar tabelas de conjuntos de dados e fluxos de dados existentes ou de fontes de dados externas. Por meio dessa API relacional, você pode realizar operações como juntar, agregar, selecionar e filtrar. Quer a entrada seja em lote ou fluxo, a semântica da consulta permanece a mesma.
Aqui está um programa de API de tabela de amostra -
// for batch programs use ExecutionEnvironment instead of StreamExecutionEnvironment
val env = StreamExecutionEnvironment.getExecutionEnvironment
// create a TableEnvironment
val tableEnv = TableEnvironment.getTableEnvironment(env)
// register a Table
tableEnv.registerTable("table1", ...) // or
tableEnv.registerTableSource("table2", ...) // or
tableEnv.registerExternalCatalog("extCat", ...)
// register an output Table
tableEnv.registerTableSink("outputTable", ...);
// create a Table from a Table API query
val tapiResult = tableEnv.scan("table1").select(...)
// Create a Table from a SQL query
val sqlResult = tableEnv.sqlQuery("SELECT ... FROM table2 ...")
// emit a Table API result Table to a TableSink, same for SQL result
tapiResult.insertInto("outputTable")
// execute
env.execute()