Huy Bui
3,484
03-06-2023
Data model Power BI – làm thế nào để trực quan hóa dữ liệu trong Power BI là hoạt động mà mọi chuyên gia phân tích dữ liệu thực hiện thường ngày. Bài viết dưới đây sẽ giúp bạn có cái nhìn tổng quan nhất về cách thức model trong Power BI.
Power BI là một giải pháp phân tích kinh doanh do Microsoft cung cấp. Nó giúp bạn tạo trực quan hóa dữ liệu từ nhiều nguồn dữ liệu khác nhau. Bạn có thể nhập dữ liệu từ các nguồn dữ liệu này, tạo mô hình dữ liệu và chuẩn bị báo cáo, hình ảnh. Các nguồn dữ liệu có thể đến từ:
Chúng ta sẽ có các mô hình sau để kết nối các nguồn dữ liệu tại chỗ hoặc trên đám mây:
Trong chế độ import, chúng tôi nhập dữ liệu vào PB cache – bộ đệm. Đây là phương pháp mặc định và tiêu chuẩn để phát triển các mô hình và tạo trực quan hóa. Khi chúng tôi lưu giải pháp PBD, nó sẽ lưu dữ liệu đã nhập vào đĩa. Dữ liệu được tải vào bộ đệm của nó và bạn có thể truy vấn dữ liệu hoặc chuẩn bị hình ảnh.
Giả sử bạn đang nhập dữ liệu từ một bảng excel 1 GB. Trong trường hợp đó, mô hình dữ liệu của bạn không nhận được kích thước tệp 1 GB. Nó sử dụng công cụ nén VertiPaq dựa trên công nghệ lưu trữ cột trong bộ nhớ. Nếu bạn kiểm tra kích thước tệp giải pháp của PBD sau khi nhập dữ liệu, bạn có thể thấy kích thước của nó trong một vài MB do quá trình nén dữ liệu.
Trong chế độ import dữ liệu, bạn có thể sử dụng một hoặc nhiều nguồn dữ liệu để nhập dữ liệu của mình.
Tải dữ liệu vào PBD và lưu mô hình dữ liệu. Điều này sẽ tạo một tệp PBIX trong hệ thống cục bộ của bạn.
Lưu ý sự khác biệt về kích thước tệp:
Trong mô hình DirectQuery, Power BI không import dữ liệu. Nó chỉ giữ lại siêu dữ liệu để xác định cấu trúc mô hình. Khi chúng ta truy vấn mô hình dữ liệu, nó sẽ sử dụng các truy vấn gốc đối với data source và tìm nạp dữ liệu.
Ví dụ: Giả sử dữ liệu được lưu trữ trong các bảng của cơ sở dữ liệu SQL Server. Trong chế độ kết nối dữ liệu, bạn có hai tùy chọn:
Chế độ DirectQuery phù hợp với trường hợp dữ liệu được lưu trữ trong cơ sở dữ liệu quan hệ – relational databases. Ví dụ: bạn có thể sử dụng nó cho Microsoft SQL Server, Oracle, Amazon Redshift, Azure Data Bricks, Azure SQL Database, Impala, Google BigQuery, Snowflake, Teradata, SAP HANA.
DirectQuery cung cấp các lợi ích sau:
Bên cạnh đó, một số nhược điểm của mô hình DirectQuery có thể kể đến như:
Mô hình hóa dữ liệu – Data Model Power BI là một trong những tính năng được sử dụng để kết nối nhiều nguồn dữ liệu trong công cụ Power BI bằng mối quan hệ. Mối quan hệ xác định cách các data sources được kết nối với nhau và bạn có thể tạo trực quan hóa dữ liệu thú vị trên nhiều nguồn dữ liệu.
Với tính năng thiết lập mô hình, bạn có thể xây dựng các phép tính tùy chỉnh trên các bảng hiện có và các cột này có thể được trình bày trực tiếp trong trực quan hóa Power BI. Điều này cho phép doanh nghiệp xác định các chỉ số mới và thực hiện các phép tính tùy chỉnh cho các chỉ số đó.
Trong hình trên, bạn có thể thấy một mô hình dữ liệu chung, mô hình này cho thấy mối quan hệ giữa hai bảng. Cả hai bảng được nối bằng tên cột “Id”.
Tương tự, trong Power BI, bạn đặt mối quan hệ giữa hai đối tượng. Để thiết lập mối quan hệ, bạn phải kéo một dòng giữa các cột chung. Bạn cũng có thể xem “Relationship” trong mô hình dữ liệu trong Power BI.
Để tạo mô hình dữ liệu trong Power BI, bạn cần thêm tất cả các data sources trong tùy chọn báo cáo mới của Power BI. Để thêm data sources, hãy chuyển đến tùy chọn Get data. Sau đó, chọn nguồn dữ liệu muốn kết nối và nhấn nút Connect.
Sau khi bạn thêm data source, nó sẽ được hiển thị trên thanh bên phải. Trong hình ảnh sau đây, người nhập đã sử dụng 2 tệp xls để nhập dữ liệu – Khách hàng và Sản phẩm.
Trong Power BI ở bên trái màn hình, bạn có ba tab sau:
Khi điều hướng đến tab Report, bạn có thể thấy trang tổng quan và biểu đồ được chọn để trực quan hóa dữ liệu. Bạn có thể chọn các loại biểu đồ khác nhau theo nhu cầu của bạn. Trong ví dụ này, người sử dụng đã chọn một loại Bảng từ các Visualizations có sẵn.
Khi bạn chuyển đến tab Data, bạn có thể xem tất cả dữ liệu theo Mối quan hệ đã xác định từ các data sources.
Trong tab Relationship, bạn có thể thấy mối quan hệ giữa các nguồn dữ liệu. Khi bạn thêm nhiều data sources vào Power BI visualization, công cụ sẽ tự động cố gắng phát hiện mối quan hệ giữa các cột. Khi điều hướng đến tab Relationship, bạn có thể xem mối quan hệ giữa các bảng. Bạn cũng có thể tạo Relationship giữa các cột bằng tùy chọn Create Relationships.
Bạn cũng có thể thêm và xóa các mối quan hệ trong trực quan hóa dữ liệu. Để xóa mối quan hệ, bạn phải nhấp chuột phải và chọn tùy chọn “Delete”. Để tạo một “Relationship” mới, bạn chỉ cần kéo và thả các trường mà bạn muốn liên kết giữa các nguồn dữ liệu.
Bạn cũng có thể sử dụng dạng xem Relationship để ẩn một cột cụ thể trong báo cáo. Để ẩn một cột, nhấp chuột phải vào tên cột và chọn tùy chọn “Hide in report view”.
Bạn có thể tạo các cột được tính toán trong Power BI bằng cách kết hợp hai hoặc nhiều phần tử của dữ liệu hiện có. Bạn cũng có thể áp dụng tính toán trên một cột hiện có để xác định số liệu mới hoặc kết hợp hai cột để tạo một cột mới.
Bạn thậm chí có thể tạo một cột được tính toán để thiết lập mối quan hệ giữa các bảng và nó cũng có thể được sử dụng để thiết lập mối quan hệ giữa hai bảng.
Để tạo một cột được tính toán mới, hãy điều hướng đến tab Data View ở bên trái màn hình rồi nhấp vào Modeling.
Khi điều hướng đến tab Modeling, bạn có thể thấy tùy chọn New Column ở đầu màn hình. Thao tác này cũng mở thanh công thức, nơi bạn có thể nhập công thức DAX để thực hiện phép tính. DAX (Data Analysis Expression) – Biểu thức phân tích dữ liệu là một ngôn ngữ mạnh mẽ cũng được sử dụng trong Excel để thực hiện các phép tính. Bạn cũng có thể đổi tên cột bằng cách thay đổi văn bản Column trong thanh công thức.
Một danh sách dài các công thức cũng được cung cấp giúp bạn có thể sử dụng để tạo ra các cột được tính toán. Bạn chỉ cần nhập ký tự đầu tiên của công thức sẽ được sử dụng trong phép tính.
Bạn cũng có thể tạo một bảng được tính toán mới trong data model Power BI. Để tạo một bảng mới, hãy điều hướng đến tab Data View ở bên trái màn hình, sau đó chuyển đến tùy chọn Modeling ở đầu màn hình.
Biểu thức DAX được sử dụng để tạo bảng mới. Bạn phải nhập tên của một bảng mới ở bên trái của dấu bằng và công thức DAX để thực hiện phép tính để tạo thành bảng đó ở bên phải. Khi quá trình tính toán hoàn tất, bảng mới sẽ xuất hiện trong mục Fields trong mô hình của bạn.
Một bảng mới được thêm vào trong phần “Fields” trong màn hình Power BI như minh họa. Khi cột tính toán và bảng tính toán được tạo theo yêu cầu của bạn, bạn có thể sử dụng các trường trong tab Report trong Power BI.
Để thêm các đối tượng này, bạn phải chọn checkbox và mối quan hệ sẽ tự động được phát hiện nếu có thể. Nếu không, bạn có thể kéo các cột mà bạn muốn kết nối.
Để xem báo cáo, bạn điều hướng đến tab Report và bạn có thể thấy cả “Calculated columns” – các cột đã tính và các trường từ “Calculated table” mới trong chế độ xem báo cáo.
Power BI cho phép xem chi tiết dữ liệu dựa trên thời gian theo mặc định. Khi bạn thêm trường ngày vào phân tích của mình và bật tính năng xem chi tiết về trực quan hóa dữ liệu, bạn sẽ chuyển sang một level mới của dữ liệu dựa trên thời gian.
Chúng tôi có thể bật tính năng “drill” trong trực quan hóa bằng cách sử dụng tùy chọn ở trên cùng. Sau khi chúng tôi bật tính năng “drill” – xem chi tiết – và nhấp vào các thanh hoặc đường trong biểu đồ, tính năng này sẽ đi sâu xuống cấp phân cấp thời gian tiếp theo. Ví dụ: Năm → Quý → Tháng.
Hiểu về data model Power BI sẽ giúp các data analyst, các nhà quản trị doanh nghiệp có thể xây dựng và đọc báo cáo một cách chính xác, hiệu quả nhất. Thành thạo data model Power BI với khóa học data analysis Power BI
>> Phân loại các kĩ thuật data modeling, data model Power BI thuộc loại kĩ thuật nào?