Apache Pig - Đánh giá các chức năng
Apache Pig cung cấp các chức năng tích hợp khác nhau, cụ thể là eval, load, store, math, string, bag và tuple chức năng.
Đánh giá chức năng
Dưới đây là danh sách eval các chức năng do Apache Pig cung cấp.
SN | Mô tả chức năng |
---|---|
1 | AVG () Để tính giá trị trung bình của các giá trị số trong một túi. |
2 | BagToString () Để nối các phần tử của một túi thành một chuỗi. Trong khi nối, chúng ta có thể đặt dấu phân cách giữa các giá trị này (tùy chọn). |
3 | CONCAT () Để nối hai hoặc nhiều biểu thức cùng kiểu. |
4 | ĐẾM() Để lấy số phần tử trong một túi, đồng thời đếm số phần tử trong một túi. |
5 | COUNT_STAR () Nó tương tự như COUNT()chức năng. Nó được sử dụng để lấy số phần tử trong một túi. |
6 | DIFF () Để so sánh hai túi (trường) trong một bộ. |
7 | IsEmpty () Để kiểm tra xem túi hoặc bản đồ có trống không. |
số 8 | MAX () Để tính toán giá trị cao nhất cho một cột (giá trị số hoặc ký tự) trong túi một cột. |
9 | MIN () Để nhận giá trị tối thiểu (thấp nhất) (số hoặc ký tự) cho một cột nhất định trong túi một cột. |
10 | PluckTuple () Sử dụng tiếng Latin Pig PluckTuple() , chúng ta có thể xác định một Tiền tố chuỗi và lọc các cột trong một quan hệ bắt đầu bằng tiền tố đã cho. |
11 | KÍCH THƯỚC() Để tính số phần tử dựa trên bất kỳ kiểu dữ liệu Pig nào. |
12 | SUBTRACT () Để trừ hai túi. Nó lấy hai túi làm đầu vào và trả về một túi có chứa các bộ của túi thứ nhất mà không có trong túi thứ hai. |
13 | TỔNG() Để nhận tổng các giá trị số của một cột trong một túi cột đơn. |
14 | TOKENIZE () Để tách một chuỗi (chứa một nhóm từ) trong một bộ dữ liệu duy nhất và trả về một túi chứa đầu ra của hoạt động tách. |