-
admin
-
Tháng Hai 15, 2022
-
Không có phản hồi
Thiết lập quan hệ dữ liệu trong Tableau
Có vẻ như Covid 2019 không làm ảnh hưởng quá nhiều đến tốc độ update phiên bản mới của Tableau. Tuần vừa qua Tableau đã phát hành phiên bản update theo quý 2020.2.
Với phiên bản update này Tableau bổ sung một tình năng rất thú vị là Relationships. Sau đây là bài tổng hợp ngắn về update mới này của Tableau.
1- Relationships là gì?
Một cách đơn giản thì nó là một mô hình tổ chức dữ liệu mới (Data Modeling) cho phép việc chuẩn bị ra Meta Data trong Tableau trở nên dễ dàng và đơn giản hơn. Với phiên bản Tableau giới thiệu 2 khái niệm là Physical layer và Logical layer
Với phiên bản 2020.2 trở về trước, chúng ta sẽ Join hoặc Union các bảng, kết quả trả ra sẽ là chúng ta có một bảng dữ liệu trải phẳng từ nhiều nguồn (flattening multiple tables into a single table)
Với phiên bản 2020.2 chúng ta có thên lớp Logical layer, ở lớp này bạn có thể phản ánh quan hệ giữa các bảng Logical Table và cái này là Relationships.
Nói nhiều không bằng xem hình, các bạn xem mô hình ở phần ảnh nhé.
2- Relationships thì khác gì Join?
Có 3 điểm khác nhau cơ bản giữa Relationships và Join
-
No up-front join type: Relationships không yêu cầu lựa chọn TRƯỚC join type (left, right, inner, outer). Bạn chỉ phải map các key giữa các logical table với nhau thôi.
-
Automatic and context-aware: Tableau sẽ tự động lựa chọn join type tuỳ thuộc vào các chỉ tiêu (meassure) và chiều phân tích (dimension) mà bạn đang dùng trong Worksheet.
-
Flexible: Đại loại, với mô hình dữ liệu của Relationships, bạn có thể tạo ra source dữ liệu cho rất nhiều workbook thay vì phải xử lý thành nhiều source như các phiên bản trước, Tableau sẽ chỉ truy vấn các bảng cần thiết dựa trên các trường và bộ lọc trong viz mà bạn đang xài.
3- Relationships thì ảnh hưởng gì đến cách chúng ta vẫn dùng Tableau Desktop?
Về cơ bản thì Tableau chỉ thêm chứ không bớt. Bạn vẫn có thể sử dụng Join và Union bình thường như trước kia, lúc này bạn sẽ chỉ có duy nhất 1 logical table thôi.
Còn nếu sử dụng Relationships, với Tableau 2020.2 bạn có thể thiết kết các mô hình phân tích dữ liệu phổ biến trong các Data Warehouse như Star hoặc SnowFlake.
Trong các Data Warehouse, thông thường các Measure sẽ được lưu trữ ở các bảng Fact trong khi các Dimension sẽ được lưu trữ trong các bảng Dim. Nếu DWH được thiết kế tốt, quan hệ giữa Fact với Dim có thể sẽ là many – to – one, trong trường hợp này bạn chỉ đơn giản là kéo Fact table vào và kéo các Dim cần thiết để có mô hình khai thác ngay trên Tableau desktop. Tableau sẽ tự dựa vào bạn đang phân tích chỉ tiêu và chiều nào để chọn hình thức join, điều này sẽ giúp tối ưu hoá tốc độ xử lý Viz.
Chúc các bạn sử dụng hiệu quả phiên bản mới nha