越來越多的企業做大數據分析,第一步當然是大量收集數據。客戶時常會問,到底哪些的數據有用?是否大包圍,採集所有數據就是最完美?其實,數據多不一定是好,錯誤或者不適用的數據會影響分析結果,導致報告出現誤差,亦增加數據分析的成本。所以在做分析之前,我們要先篩選數據。以下就列出4大數據,你應該刪走這些妨礙你的資料。
數據過時
有企業保留大量顧客數據,有些客戶資料可能是多年前留下。但事隔多年,一些通訊資料可能已經過時,例如地址、電話、Email已經不再有效,繼續保留這些數據會影響行銷的成效。
所以有企業委託我們做手機APP時,一般會建議在APP中保留渠道,讓用戶可以在手機上主動更新一些的個人資料。而在眾多的通訊資料,企業需要優先選擇哪些是最重要的。現時Email的打開率低得可憐,SMS短訊宣傳亦沒落,這些資料亦不長久,很多時他們只是作身份驗證的用途。
那麼哪一些的通訊資料,最恆久,客戶最常用?答案當然是社交媒體帳號。一些保留太久的電話、電郵,需要檢查是否仍然生效、有用,否則就應該刪除。
數據的異常值
異常值是數據分析中的專業術語,能導致錯誤的分析結果。
簡單來說,異常值就是異常地偏離整體數據的值。例如,某一類的產品平均消費是100元,但有幾個客戶在此產品消費了過5位數字。或者,輸入了1900年出世,出現了年齡200歲的客戶等等。異常值出現是十分常見,主要是因為人手輸入錯誤所做成。
不完整的數據
資料收集不完整,導致關鍵數據缺失,失去分析價值。例如,你想分析某優惠券的兌換情況,有齊了兌換時間、數量,卻沒有用戶的年齡組別。
還有就是資料量過小。資料量太少無法反映真實情況,沒有分析價值。例如,有餐廳在APP上設置意見收集,向用戶收集用餐體驗和評分。通常此部分非強制性,收集到的數據量太少,沒有分析價值。太偏頗的數據亦影響準確度,例如,想分析整體所有分店的用餐情況,某些地區收集到的意見樣本卻過少。
邏輯錯誤
還有就是邏輯上的矛盾。例如,交易訊息和登記人資料對不上。例如是登記人留的電話、地址,和實際交易時運送的地址,聯絡的電話不同。當然有可能是客戶使用了另一個通訊資料做收貨,但都有可能是數據上的誤差。
或者,客戶輸入的年齡組別是18-24歲,但身份證字母是D(年輕一輩的字母不可能是D)。類似這類型的邏輯,處理上較為複雜,需要熟悉業務的人,設想不同的情景,再判斷數據是否有用。
以上,就是4大企業應該刪除或者重新審視的數據。有部分的漏洞,其實可以在收集數據的部分預事堵塞。先達智能有多年處理客戶數據的經驗,不妨找我們商量一下。
對零售科技趨勢有興趣的讀者,記得Follow我們的專頁,我們會繼續將最新資訊推送給大家。Chinetek CRM & Big Data