資料分析案例(帶資料)
資料來源
資料來自於kaggle中的E-Commerce Data ,詳見附件。
分析目標
描出客戶畫像
使用工具
MySQL,SPSS,Excel
一、
資料整理
表1 資料null值情況
原資料中欄位Description,CustomerID存在空值,在這次分析中客戶是我的主要分析物件,所以沒有CustomerID的數值對我這次的分析沒有意義,我將刪除CustomerID為null的資料。刪除過後,資料中不存在null。
二、標註每個欄位的含義
InvoiceNo:
發票編碼,其中“C”開頭的編碼代表退貨;
StockCode:
產品程式碼,是區分產品的唯一標識;
Description
:具體的產品描述;
Quantity
:每單中各產品的購買數量;
InvoiceDate
:開票的日期;
UnitPrice
:產品單價
CustomerID
:客戶編碼,是區分客戶的唯一標識;
Country
:客戶所屬的區域
三、整體的銷售情況
表2 一年中產品交易量
圖1 客戶單次採購量
客戶大多是批次採購,當然也存在單個購買的現象。
四、客戶分佈區域
圖2 客戶分佈
客戶主要來自英國,佔整體客戶的89%。
五、產品價格與銷量
圖3 產品價格與銷量
客戶比較青睞於店鋪內的低價商品。
六、客戶採購時間段
圖4 客戶採購時間段分佈
注:早上6:00-10:00;中午10:01-14:00;下午14:01-18:00;晚上18:01-22:00
客戶都集中在中午或者下午採購,尤其喜歡中午。
七、客戶購買頻次
表3 客戶採購頻次
從表3中可見每年1-12次的採購頻次最多。
表4 大部分客戶採購頻次
由表中可見每年採購1次和2次的客戶佔到了整體的一半。
八、客戶畫像
客戶主要分佈在英國,尤其喜歡在10:00-18:00這個時間段進行批次採購低價商品,且在這一年中很少會反覆採購。
注:如果資料能夠有更多,那客戶的畫像將更清晰。
data。csv
45。6M
·
百度網盤