cloudLibrary 雲端圖書館 - bibliotheca€¦ · 了一些新的視覺效果、更新的工作流程和改進的導覽,以提升整體讀者體驗。 向所有讀者介紹數位內容
資料視覺化軟體 - 花蓮慈濟醫院 Hualien Tzu Chi...
Transcript of 資料視覺化軟體 - 花蓮慈濟醫院 Hualien Tzu Chi...
課程安排
1. Power BI Desktop 操作介面簡介
下載安裝(Part 3-3)
操作介面(Part 3-4)
2. 互動式圖表 (finaldata2019.xlsx)
取得資料練習 (Excel, JSON, 公開資料, csv等)
變更資料來源(Part 3-17)
互動呈現及交叉分析篩選器(Part 4-24, 4-25)
做中學~
資料分析步驟• 根據研究目的擬定(研究對象)
• 問卷收集、醫院病歷資料庫、健保資料庫資料收集
• 收集變數(risk factors, outcome or endpoint/ features)
• 申請 IRB、回收問卷key in、申請資料庫 (Excel, CSV, Txt)
資料整理
• 檢查資料正確性(善用圖表)
• 視覺化 (Excel, Power BI, Tableau, R…)
• 推論統計 (R, SAS, SPSS, STATA, Minitab,…)
資料分析
視覺化工具 Power BI
建立互動式資料視覺效果
Power BI 簡介與示範 https://powerbi.microsoft.com/zh-tw/downloads/
下載軟體安裝
https://powerbi.microsoft.com/zh-tw/get-started/
雲端共同作業與共用
使用 Power BI Pro 與他人共用和散發報表,不必進行任何複雜設定。60 天免費的 Power BI Pro 試用。
開始學BI前 網路資源眾多可參考(e.g., 如何安裝)
https://www.youtube.com/watch?v=Azi0-hjotjs
https://www.youtube.com/watch?v=fEP5yqaRDEc
或者從微軟官方網站查詢
https://powerbi.microsoft.com/zh-tw/support/
系列課程
BI Desktop版 免費使用但功能有限
Open BI →取得資料
https://docs.microsoft.com/zh-tw/power-
bi/guided-learning/
探索 Power BI (取用者) 分析 Power BI 中的資料 (取用者) 開始使用 Power BI 來建置 取得資料 模型資料 使用視覺效果 探索資料 發佈與共用 DAX 簡介
Video
Power BI 影片
https://www.youtube.com/playlist?list=PL1N57mwBHtN2q1WbU5O29rrn_A0lkVv9p
Get data
https://www.youtube.com/embed/Qgam9M8I0xA
Create a report
https://www.youtube.com/embed/IMAsitQ2cAc
Data visualization
歷年、累月使用FB的狀況
請試著安裝 Power BI Desktop
Power BI 簡介 最常見的 Power BI Desktop 使用方式:
1. 連接到資料
2. 轉換並清理資料,以建立資料模型
3. 建立圖表之類的視覺效果,以便提供視覺呈現
4. 在多個報表頁面上,建立視覺效果集合的報表
「資料分析師」或商業智慧專業人員:使用Power BI 產生資料視覺化報表
https://docs.microsoft.com/zh-tw/power-bi/desktop-what-is-desktop
連接到資料 Power BI Desktop 連線到許多不同的資料來源以下影像顯示出現的
[取得資料] 視窗,其中顯示 Power BI Desktop 可以連線的許多類別。
轉換及清理資料,建立模型 使用內建的查詢編輯器來清理及轉換資料。
每個步驟 (如重新命名資料表、轉換資料類型或刪除資料行) 都會由查詢編輯器記錄
建立視覺效果(P112-113)
許多不同類型的視覺效果可供選擇。
這是什麼圖?有何作用?
建立報表
視覺效果集合稱為「報表」。報表可有一或多個頁面。以下影像顯示 Power BI Desktop 報表。在此報表中,共有十頁。
Excel data (3-06-1.xls) 兩個worksheet
練習:Power BI 連接到你的Excel檔案
導覽器可以預覽資料 可勾選多個工作表載入 參考課本P73-74 可試著畫各年代男女生人數分布 來臺目的(探親、醫療等)哪個最高?
資料讀入畫面
報告:視覺化分析處資料:檢視資料關聯性:多個資料表的關聯性
報告介面(儀表版)執行視覺化分析
視覺化選項(27種請參考課本112-113頁)
+可增加更多圖型
資料介面 檢視資料
可設定多個資料表間的關聯
Power BI Desktop 可取得資料型態超過50種
參考網站Data World (DW)
https://data.world/
https://powerbi.microsoft.com/zh-tw/blog/connect-to-tens-of-thousands-of-datasets-on-data-world-with-the-new-connector-for-power-bi-desktop-and-join-the-webinar/
Microsoft Power BI Guided Learning
https://docs.microsoft.com/en-us/power-bi/guided-learning/
Data World (DW) is a Public Benefit Corporation, established in 2016 and free for academic use. As of mid-2018, there were about 16 000 projects and datasets listed on DW covering multiple industries. Approximately, 3600 health-related projects and datasets have been uploaded and new datasets are added weekly.
練習取得資料
1. Excel
2. JSON
3. 公開資料(Web)
4. csv
主題式視覺效果:課堂問卷分析:
大學生身高、體重之比較(n=660)
Surevy
讀取外部 Excel 檔案 (原始資料)
資料讀取注意事項
資料讀取注意事項(2)
資料過大無法匯入,請嘗試縮減
資料路徑或檔名改變
參考課本98頁 變更資料來源
目前BI版本與課本稍不同可自行查找
需重新取得資料(網路資料)
參考課本99頁 重新整理
檔案→選項設定→資料來源設定
資料頁面→重新整理
視覺化分析之前
對資料欄位須重新定義或檢視變數類型是否正確
須先做資料處理
查詢編輯器 (首頁→編輯查詢):進行資料前處理
查詢編輯器 (首頁→編輯查詢)
資料整理:變數類型設定(文字、數字或日期)、變數命名、分割資料行、日期時間轉換等
功能區
顯示資料筆數(資料列)及變數個數(資料行)
橫列
直行
將資料成形及合併
使用 Power BI Desktop,您可以連線到各種不同的資料來源,然後將資料成形以符合需求,以便建立能夠與其他人共用的視覺效果報表。
將資料「成形」的意思為轉換資料:重新命名資料行或資料表、將文字變更為數值、移除資料列、將第一個資料列設定為標頭等。
https://docs.microsoft.com/zh-tw/power-bi/desktop-shape-and-combine-data
資料成形
查詢編輯器中將資料成形時,您會提供逐步指示,以在查詢編輯器載入及呈現資料時調整資料。
查詢編輯器會記錄您指定的步驟(例如重新命名資料表、轉換資料類型或刪除資料行)。每次此查詢連線到資料來源時,查詢編輯器都會執行這些步驟,如此一來,資料便會一律以您指定的方式成形。
查詢編輯器→紀錄成形步驟
取得 finaldat2019.xls請確認 _______列 ______行
取得資料→Excel→確認工作表→載入 (課本 73-76頁)
資料整形(整理)
1. 去除null列 (移除資料列)
2. 將欄位皆變更為文字
3. 計算 BMI=kg/(m2)
4. 確認無誤再進行資料視覺呈現
總計空白或遺漏值刪除 _______筆?
Steps
移除空白資料列
請由資料類型→改成文字類型後, 關閉並套用
讀取資料後→編輯查詢→確認資料變數特性正確
BMI
=[Weight]/(([Height]/100)*([Height]/10
0))
https://docs.microsoft.com/zh-tw/power-bi/desktop-add-custom-column
男女生之
身高、體重、BMI及星座
之分析
互動式圖表
性別 值
男 1
女 2
管理關聯性:建立Gender 1=男, 2=女
BI 取得gender編碼資料後建立兩資料之關聯性:多對1
匯入多個資料表時,您可能想要使用所有資料表中的資料來進行一些分析。這些資料表之間必須有關聯性,才能正確地計算結果
以手動方式建立關聯性 在常用索引標籤上,按一下管理關聯性>新增。 在 [建立關聯性] 對話方塊中,選取第一個資料表下拉式清單中的資料表,然後選取您要用於關聯性的資料行。
在第二個資料表下拉式清單中,選取您要用於關聯性的其他資料表,然後選取您要使用的其他資料行,再按一下 [確定] 。
在 Power BI Desktop 中建立和管理關聯性
https://docs.microsoft.com/zh-tw/power-bi/desktop-create-and-manage-relationships
多對一 (*:1) -最常見的預設類型,表示一個資料表中的資料行可以有特定值的多個執行個體,而其他相關資料表 (通常稱為查閱資料表) 只能有特定值的一個執行個體。
一對一 (1:1) -一個資料表中的資料行只能有特定值的一個執行個體,而其他相關資料表只能有特定值的一個執行個體。
多對多關聯性:使用複合模型時,您可以在資料表間建立多對多關聯性,移除資料表中唯一值的需求。此方法也會移除先前的因應措施,像是只為建立關聯性而導入新的資料表。如需詳細資訊,請參閱多對多基數關聯性。
關聯性
https://docs.microsoft.com/zh-tw/power-bi/desktop-create-and-manage-relationships
課本 P221-222
請試看看畫出性別之長條圖
星座之分析:請練習清資料
有人沒按照輸入規則 (座)有人寫牡羊、白羊、山羊??回查詢編輯器→整理
顯示資料→針對有問題處處理
(1) 分割資料行:取出前兩位
(2) 選取欄位後,篩選要處理的數值(天平、天秤、天枰) →取代為天枰
火象星座(精力型):牡羊座、獅子座、射手座→Red
土象星座(實際型):金牛座、處女座、魔羯座→Brown
風象星座(智慧型):雙子座、天秤座、水瓶座→Yellow
水象星座(情感型):巨蟹座、天蠍座、雙魚座→Blue
變更套用後→報表區繼續做圖
例:學生之身高、體重及星座之分析
繪圖區空白處點選散佈圖,定義X,
Y軸變數後,選擇”不摘要”
將性別拉至圖例→標示性別差異
或是互動式圖表,圖上點女生→呈現女生資料
呈現男生資料
[ 篩選 ] 窗格簡介
您可以在 [ 篩選 ] 窗格中套用篩選,或是直接在報表本身的交叉分析篩選器中進行選取。 [ 篩選 ] 窗格會顯示報表中使用的資料表及欄位,以及已套用的篩選 ( 如果有的話 ) 。
從篩選器→勾選”女生”
與前面互動式圖表比較你喜歡哪一種?
加入文字方塊(參考課本P151)
可將參考網址填入 設定連結
身高以10 cm 分組
新增群組(參考課本P168)
欄位: Height →按右鍵→新增群組
女生較男生多(2:1) 沒談過戀愛者之BMI稍高 (多出0.7) 男生身高較女生高 男生BMI比女生大
長條圖、卡片、散佈圖、堆疊長條圖、矩陣
大一佔66%, 大二佔25% 大一到大四的平均身高變化不大(4%起伏) 大一到大四的體重變化幅度較大(11%起伏) 大四的平均體重似乎最重(BMI) 也可以男女分開比較喔!!
環圈圖、圓餅圖、散佈圖、漏斗圖(P192)
(善用篩選器)
申請BI帳號 登入即可下載
可自marketplace在安裝其他繪圖
如Word cloud
將最重要的資訊大小調整為最大 如果報表頁面上的文字和視覺效果大小都一樣,則讀者會很難專注於最重要的內容。例如,卡片視覺效果是凸顯重要數字的好方法
但請務必提供內容脈絡
使用文字方塊和工具提示等功能,將內容脈絡加入您的視覺效果。
將最重要的資訊放在左上角 大部分的人從上往下讀取,所以將最高層級的詳細資料放置在頂端,並且當您順著對象閱讀的方向移動時,會顯示更多的詳細資料 (由左到右、由右到左)。
在 Power BI Desktop
建立報表的祕訣和訣竅
https://docs.microsoft.com/zh-tw/power-bi/power-bi-reports-tips-and-tricks-for-creating
請小心使用曲解事實的圖表,像是不是從零開始的立體圖表和圖表。請記住,圓形的圖形會較難理解。圓形圖、環圈圖、量測計和其他圓形的圖表類型可能很好看,但是否有可以使用的其他圖表?
軸的圖表刻度、圖表維度次序,以及在圖表內維度值所用的色彩務必保持一致。
請務必小心地編碼量化資料。顯示數字時,不要超過三或四個數字。量值應在小數點、千位數、百萬等左邊顯示為一或兩個數字,亦即可以將量值顯示為 3.4 百萬,而不要顯示為 3,400,000。
避免混用精確度和時間的層級。請確定時間框架可讓人充分了解。不要讓上個月的圖表緊鄰從該年度指定月份篩選出的圖表。
為資料使用正確的視覺效果
請注意圖表如何排序。如果您想要強調最高或最低數字,請依量值排序。如果您想要在許多其他類別目錄內,能夠快速尋找特定分類,請依軸排序。
圓形圖最適合具有少於八個類別目錄的量值。因為您無法以並排方式比較值,所以在圓形圖中比較值,會比在橫條圖和直條圖中比較值更困難。圓形圖適於檢視部分與整體的關聯性,而不是用於部分比較。量表圖非常適合用來在目標內容中顯示目前狀態。
為資料使用正確的視覺效果
分類地理欄位以建議 Bing 的地理編碼
確保欄位地理編碼正確的另一個方法,便是在資料欄位上設定 [資料類別]。在Power BI Desktop 中,選取所需的資料表,移至進階功能區,然後將 [資料類別] 設定為 [地址]、[城市]、[大陸]、[國家/地區]、[國家]、[郵遞區號]、[州] 或[省]。這些資料類別可以協助 Bing 將該資料正確編碼。若要深入了解,請參閱 Power BI Desktop 中的資料分類。
區域分布圖、地圖(P172-175)
https://docs.microsoft.com/zh-tw/power-bi/desktop-mobile-
geofiltering
Power BI Map (課本174-175)
請取得 5-01.pbix
https://docs.microsoft.com/zh-tw/power-bi/visuals/power-bi-map-tips-and-tricks#in-the-dataset-tips-to-improve-the-underlying-dataset
選居住地區→模型→省/市
選地圖 →位置(居住地區)→ 大小(顧客人數)
請由滾筒改變地圖樣式或顏色
Summary
取得內部或外部資料公開資料(web)
資料來源設定
資料整理:檢視列行數、資料類型、日期格式、轉換(計算各組平均數)
產生報表:
次數表、長條圖、匯出數據