此文是杭州包裝設計公司關于設計公司如果推廣和營銷企業的分享,杭州包裝設計公司旨在想讓更多的設計公司提高設計業務能力!
注:配圖為UCI設計公司作品
杭州包裝設計公司轉發原文直譯:
我們過去已經談了很多關于數據質量的問題,包括壞數據的成本。但是,盡管對數據質量有了基本的了解,許多人仍然不太理解"質量"的確切含義。
例如,有沒有一種方法可以衡量質量,如果有,你是如何做到的?
在這篇文章中,我們將尋找這些問題的答案,甚至更多。但是首先
破除數據質量神話
確保數據質量的基礎始于基本需求的創建
關于數據質量的最大誤區之一是它必須完全沒有錯誤。隨著網站和其他活動收集如此多的數據,零錯誤幾乎是不可能的。相反,數據只需要符合為其設定的標準。為了確定什么是"質量",我們首先需要知道三件事:誰創建了需求
需求是如何產生的,以及
在滿足這些要求方面,我們有多大的自由度?
許多企業都有一個單一的"數據管理員",他了解并設定這些要求,同時也是決定錯誤容忍度的人。如果沒有數據管家,它通常會確保負責數據的人了解任何可能影響數據的缺點。
你可以選擇好的、快的或便宜的——選擇兩個從收集數據到使數據符合公司需求的一切都有可能出錯。擁有100%完整和100%準確的數據不僅非常昂貴,而且非常耗時,幾乎沒有觸及投資回報率.
面對如此多的數據,必須迅速做出決策。這就是為什么數據質量在很大程度上是一種微妙的平衡行為——在準確性和完整性之間周旋和判斷。如果這聽起來像是一個難以完成的任務,您會很高興知道有一個瘋狂的方法,第一步是數據概要分析。
什么是數據分析?
數據分析包括查看數據庫中的所有信息,以確定其是否準確和/或完整,以及如何處理不準確的條目。例如,導入貴公司生產的產品的數據庫并確保所有信息都是準確的,這相當簡單,但當您導入競爭對手產品的詳細信息或其他相關詳細信息時,情況就不同了。
通過數據分析,您還可以查看數據的準確性。如果你在2016年七月一日發射,系統會記錄為1916年還是2016年?
在梳理你已經獲得的信息時,你甚至可能發現重復的和其他的問題。以這種方式分析數據為我們提供了一個起點——一個跳板,讓我們可以確保我們使用的信息是盡可能高質量的。
確定數據質量
現在我們有了一個起點來確定我們的信息是否完整和準確,下一個問題就變成了——當我們發現錯誤或問題時,我們該怎么做?
通常,你可以做以下四件事之一:接受錯誤——如果它在可接受的標準范圍內(即主要街道而不是主街),你可以決定接受它并繼續下一個條目。
拒絕錯誤——有時,特別是在數據導入時,信息被嚴重破壞或不正確,與其試圖糾正錯誤,不如干脆刪除條目。
糾正錯誤——客戶姓名的拼寫錯誤是常見的錯誤,很容易糾正。如果名稱有變化,您可以將其中一個設置為"主",并在所有數據庫中保持數據的統一和正確。
創建一個默認值——如果你不知道該值,有一些東西(未知或不適用)總比什么都沒有好。整合數據
當您在不同的數據庫中擁有相同的數據時,出現錯誤和重復的機會就來了。成功集成的第一步是看到數據在哪里,然后以一致的方式組合這些數據。在這種情況下,投資于經過驗證的數據質量和準確性工具來幫助跨數據庫協調和同步信息是非常值得的。
您的數據質量檢查表最后,由于您要處理的數據涉及如此之多的不同領域,因此有一個檢查表來確定您正在使用的數據質量是否盡可能的高是很有幫助的達馬聯合王國創建了一個關于"數據維度"的優秀指南,可以用來更好地了解如何決定數據質量的全貌。
他們的數據質量維度包括:
完整性包含一個或多個值的數據的百分比。重要的是,關鍵數據(如客戶姓名、電話號碼、電子郵件地址等。)首先完成,因為完整性不會對非關鍵數據產生太大影響。
唯一性——與其他數據集相比,只有一個同類條目。
及時性—日期和時間對數據的影響有多大?
這可能是以前的銷售,產品l
注:配圖為UCI設計公司作品
杭州包裝設計公司
通過杭州包裝設計公司的精彩分享,設計師更輕松快捷地掌握杭州包裝設計公司分享的營銷與設計知識,幫助北京vi設計公司更好地服務好客戶 。
聲明:本文“ 什么是數據質量,如何衡量數據質量以獲得最佳結果_杭州包裝設計公司 ”信息內容來源于網絡,文章版權和文責屬于原作者,不代表本站立場。如圖文有侵權、虛假或錯誤信息,請您聯系我們,我們將立即刪除或更正。