Kho dữ liệu - Câu hỏi phỏng vấn
Kính gửi quý độc giả những Data Warehousing Interview Questions đã được thiết kế đặc biệt để giúp bạn làm quen với bản chất của các câu hỏi mà bạn có thể gặp phải trong cuộc phỏng vấn cho chủ đề Data Warehousing.
A : Kho dữ liệu là một bộ sưu tập dữ liệu theo định hướng chủ đề, tích hợp, biến thể theo thời gian và không thay đổi để hỗ trợ quá trình ra quyết định của ban quản lý.
A : Định hướng theo chủ đề biểu thị rằng kho dữ liệu lưu trữ thông tin về một chủ đề cụ thể như sản phẩm, khách hàng, doanh số bán hàng, v.v.
A : Một số ứng dụng bao gồm dịch vụ tài chính, dịch vụ ngân hàng, hàng hóa khách hàng, lĩnh vực bán lẻ, sản xuất có kiểm soát.
A : OLAP là từ viết tắt của Online Analytical Processing và OLTP là từ viết tắt của Xử lý Giao dịch Trực tuyến.
A : Kho dữ liệu chứa thông tin lịch sử sẵn có để phân tích hoạt động kinh doanh trong khi cơ sở dữ liệu hoạt động chứa thông tin hiện tại cần thiết để vận hành doanh nghiệp.
A : Kho dữ liệu có thể triển khai giản đồ sao, giản đồ bông tuyết và lược đồ chòm sao thực tế.
A : Data Warehousing là quá trình xây dựng và sử dụng kho dữ liệu.
A : Kho dữ liệu liên quan đến việc làm sạch dữ liệu, tích hợp dữ liệu và hợp nhất dữ liệu.
A : Các chức năng được thực hiện bởi công cụ Kho dữ liệu và các tiện ích là Trích xuất dữ liệu, Làm sạch dữ liệu, Chuyển đổi dữ liệu, Tải và làm mới dữ liệu.
A : Khai thác dữ liệu có nghĩa là thu thập dữ liệu từ nhiều nguồn không đồng nhất.
A: Siêu dữ liệu được định nghĩa đơn giản là dữ liệu về dữ liệu. Nói cách khác, chúng ta có thể nói rằng siêu dữ liệu là dữ liệu tóm tắt dẫn chúng ta đến dữ liệu chi tiết.
A : Siêu dữ liệu hô hấp chứa định nghĩa về kho dữ liệu, siêu dữ liệu kinh doanh, siêu dữ liệu hoạt động, dữ liệu để ánh xạ từ môi trường hoạt động đến kho dữ liệu và các thuật toán để tóm tắt.
A: Khối dữ liệu giúp chúng ta biểu diễn dữ liệu theo nhiều chiều. Khối dữ liệu được xác định bởi các kích thước và dữ kiện.
A : Kích thước là các thực thể liên quan đến việc doanh nghiệp lưu giữ hồ sơ.
A: Data mart chứa tập hợp con của dữ liệu trong toàn tổ chức. Tập hợp con dữ liệu này có giá trị đối với các nhóm cụ thể của một tổ chức. Nói cách khác, chúng ta có thể nói rằng data mart chứa dữ liệu cụ thể cho một nhóm cụ thể.
A : Chế độ xem trên một kho dữ liệu hoạt động được gọi là kho ảo.
A : Các giai đoạn là chiến lược CNTT, Giáo dục, Phân tích tình huống kinh doanh, Kế hoạch chi tiết kỹ thuật, Xây dựng phiên bản, Tải lịch sử, Truy vấn đặc biệt, Tiến hóa yêu cầu, Tự động hóa và Phạm vi mở rộng.
A: Trình quản lý tải thực hiện các hoạt động cần thiết để trích xuất và tải quy trình. Quy mô và độ phức tạp của trình quản lý tải khác nhau giữa các giải pháp cụ thể từ kho dữ liệu đến kho dữ liệu.
A: Trình quản lý tải trích xuất dữ liệu từ hệ thống nguồn. Tải nhanh dữ liệu đã trích xuất vào kho dữ liệu tạm thời. Thực hiện các phép biến đổi đơn giản thành cấu trúc tương tự như cấu trúc trong kho dữ liệu.
A: Người quản lý kho chịu trách nhiệm về quy trình quản lý kho. Trình quản lý kho bao gồm phần mềm hệ thống của bên thứ ba, các chương trình C và các tập lệnh shell. Quy mô và độ phức tạp của người quản lý kho khác nhau giữa các giải pháp cụ thể.
A : Người quản lý kho thực hiện kiểm tra tính nhất quán và tính toàn vẹn tham chiếu, tạo chỉ mục, chế độ xem nghiệp vụ, chế độ xem phân vùng so với dữ liệu cơ sở, chuyển đổi và hợp nhất dữ liệu nguồn vào kho lưu trữ tạm thời vào kho dữ liệu đã xuất bản, sao lưu dữ liệu trong kho dữ liệu, và lưu trữ dữ liệu đã hết thời gian lưu trữ.
A : Thông tin Tóm tắt là vùng trong kho dữ liệu nơi lưu giữ các tổng hợp được xác định trước.
A : Trình quản lý truy vấn chịu trách nhiệm hướng các truy vấn đến các bảng phù hợp.
A : Có bốn loại máy chủ OLAP, đó là OLAP quan hệ, OLAP đa chiều, OLAP kết hợp và Máy chủ SQL chuyên dụng.
A : OLAP đa chiều nhanh hơn OLAP quan hệ.
A : OLAP thực hiện các chức năng như cuộn lên, xem chi tiết, cắt, xúc xắc và xoay.
A : Chỉ một thứ nguyên được chọn cho thao tác cắt.
A : Đối với hoạt động xúc xắc, hai hoặc nhiều kích thước được chọn cho một hình khối nhất định.
A : Chỉ có một bảng dữ kiện trong Lược đồ sao.
A : Chuẩn hóa chia nhỏ dữ liệu thành các bảng bổ sung.
A : Lược đồ Snowflake sử dụng khái niệm chuẩn hóa.
A : Chuẩn hóa giúp giảm dư thừa dữ liệu.
A : Ngôn ngữ truy vấn khai thác dữ liệu (DMQL) được sử dụng cho Định nghĩa lược đồ.
A : DMQL dựa trên Ngôn ngữ truy vấn có cấu trúc (SQL).
A : Việc phân vùng được thực hiện vì nhiều lý do như quản lý dễ dàng, hỗ trợ khôi phục sao lưu, nâng cao hiệu suất.
A : Đánh dấu dữ liệu liên quan đến chi phí phần cứng và phần mềm, chi phí truy cập mạng và chi phí thời gian.