Apache Flink-테이블 API 및 SQL
Table API는 SQL과 같은 표현 언어를 사용하는 관계형 API입니다. 이 API는 일괄 처리와 스트림 처리를 모두 수행 할 수 있습니다. Java 및 Scala Dataset 및 Datastream API에 포함 할 수 있습니다. 기존 데이터 세트 및 데이터 스트림 또는 외부 데이터 소스에서 테이블을 만들 수 있습니다. 이 관계형 API를 통해 조인, 집계, 선택 및 필터링과 같은 작업을 수행 할 수 있습니다. 입력이 배치이든 스트림이든 쿼리의 의미는 동일하게 유지됩니다.
다음은 샘플 테이블 API 프로그램입니다.
// for batch programs use ExecutionEnvironment instead of StreamExecutionEnvironment
val env = StreamExecutionEnvironment.getExecutionEnvironment
// create a TableEnvironment
val tableEnv = TableEnvironment.getTableEnvironment(env)
// register a Table
tableEnv.registerTable("table1", ...) // or
tableEnv.registerTableSource("table2", ...) // or
tableEnv.registerExternalCatalog("extCat", ...)
// register an output Table
tableEnv.registerTableSink("outputTable", ...);
// create a Table from a Table API query
val tapiResult = tableEnv.scan("table1").select(...)
// Create a Table from a SQL query
val sqlResult = tableEnv.sqlQuery("SELECT ... FROM table2 ...")
// emit a Table API result Table to a TableSink, same for SQL result
tapiResult.insertInto("outputTable")
// execute
env.execute()