以下是與資料品質相關的 5 個維度,它們對於資料可靠性也很重要。
一致性
一致性資料是指跨多個系統的資料一致性和統一性的量測。明顯不一致的資料會在整個資料集中產生矛盾,並可能導致對哪些資料點包含錯誤的混淆。
準確性
雖然準確性(數據正確且無錯誤)和可靠性(數據一致)並不相同,但它們通常是相輔相成的。不準確的數據有時可能是一致的(因此是可靠的),但它會導致始終錯誤的結論。準確的數據是無錯誤的 台灣數據 並且及時的(及時性有時作為單獨的維度來呈現)。
有效性
數據有效性是指數據是否準確地代表其要測量的內容。
完整性
完整性是決定資料全面性和完整性的維度,即所有需要的資料都是可用的,且資料中沒有缺少的值。
可用性
數據可用性意味著組織的數據可供最終用戶和利害關係人隨時使用。
信任數據
然而,可以理解的是,資料可靠性不只是勾選方框和查看精確的資料檔案。為了建立圍繞數據的信任文化,組織需要擁有努力確保數據品質的數據團隊,並專注於在整個公司範圍內對數據進行共享定義,並且能夠在工作中建立誠信。
在研究、信任組織的資料以及確保資料可靠性時,您可能會遇到各種相互關聯的術語和目標。因為這是一個持續改進的過程。
我們來討論一下數據可觀測性。可觀察性定義了公司如何追蹤和管理其正在使用的數據的健康狀況。
對資料的信任也與一個較新的術語「資料停機」有關,值得研究。數據停機旨在表明數據品質差或數據不可用的情況。
數據可靠性與數據有效性
數據可靠性和數據有效性經常相互混淆或被錯誤地用作同義詞,因為兩者都評估測量的品質。資料有效性著重於評估資料是否真實,而資料可靠性則檢查資料是否一致地產生預期結果。
從這個角度來看,數據有效性可以看作數據可靠性的組成部分。數據必須可靠才有效。例如,如果您使用有關營利性公司的資料,但資料集包含有關非營利公司的信息,則您使用的資料無效。無效的資料會產生無效的結果,從而變得不可靠。