Apache Tajo-사용자 정의 함수

Apache Tajo는 사용자 정의 / 사용자 정의 함수 (UDF)를 지원합니다. 커스텀 함수는 파이썬으로 생성 할 수 있습니다.

커스텀 함수는 데코레이터가있는 평범한 파이썬 함수입니다. “@output_type(<tajo sql datatype>)” 다음과 같이-

@ouput_type(“integer”) 
def sum_py(a, b): 
   return a + b;

UDF가있는 Python 스크립트는 아래 구성을 추가하여 등록 할 수 있습니다. “tajosite.xml”.

<property> 
   <name>tajo.function.python.code-dir</name> 
   <value>file:///path/to/script1.py,file:///path/to/script2.py</value> 
</property>

스크립트가 등록되면 클러스터를 다시 시작하면 다음과 같이 SQL 쿼리에서 UDF를 바로 사용할 수 있습니다.

select sum_py(10, 10) as pyfn;

Apache Tajo는 사용자 정의 집계 함수도 지원하지만 사용자 정의 창 함수는 지원하지 않습니다.