資訊與行銷人必看的行銷資料科學入門課-含範例與R程式碼

這幾年 「資料科學 」非常火紅,各行各業也紛紛打出大量招收資料科學人才的口號,讓資料科學家變成大家所嚮往的職業。
有接觸過資料科學這個領域的人一定會知道,裡面充滿著高深的機器學習演算法與各種大數據處理框架,所以總是會讓人誤以為,一定要會用最強的深度學習技術或是有能力處理大數據的人才叫做真正的資料科學家。真是這樣嗎?

舉個簡單的例子。以下是一家販售嬰兒車公司的資料集,名稱為 Carseats。假設我們是這間賣嬰兒車公司的資料科學家,老闆希望我們馬上可以對明年的行銷策略提出建議。這時我們發現公司的資料集只有各店的相關銷量與費用,沒有其他資料,卻連最基礎的顧客資料都沒有收集的很完整,所以只能嘗試從銷售資料來尋找可能的建議。


先看一下資料集有什麼可用變數:
  • * Sales(銷量) Unit sales (in thousands) at each location
  • * CompPrice(競爭者價格) Price charged by competitor at each location
  • * Income(收入等級) Community income level (in thousands of dollars)
  • * Advertising(廣告預算) Local advertising budget for company at each location (in thousands of dollars)
  • * Population(人口) Population size in region (in thousands)
  • * Price(價格) Price company charges for car seats at each site
  • * ShelveLoc(貨架陳列位置) A factor with levels BadGood and Mediumindicating the quality of the shelving location for the car seats at each site
  • * Age(年齡) Average age of the local population
  • * Education(教育程度) Education level at each location
  • * Urban A factor with levels No and Yes to indicate whether the store is in an urban or rural location
  • * US A factor with levels No and Yes to indicate whether the store is in the US or not
如果不談學術上行銷定義,通常行銷的最終目標就是促進銷量,所以我們會想知道究竟是什麼因素可能影響銷量(Sales),藉此達到提升銷量的目的。先從基本的人口因素開始比較,通常一個市場的大小與人口(Population)有絕對的相關,以下我們先以視覺化的方式來呈現。
圖1、人口/銷量 比較圖

將人口與銷量分別放在XY軸(圖1)比較後,可以發現人口與銷量其實是散佈的狀態,代表銷量與人口沒有顯著的相關,因此合理推論只看人口與銷量是不夠的。
圖1中人口是外部環境的因素,所以下一張圖中加入一個公司可控且有機會影響銷量的因素-貨架陳列位置(ShelveLoc),貨架陳列位置是指公司商品放在通路的擺放位置的優劣。通常在實體通路中,消費者一進門就可看到商品,通常會相對容易被消費者購買,所以在不考慮產品本身功能的前提下,放在好的位置也會提升銷量。
圖2、銷量/人口/貨架陳列位置 比較圖

放入貨架陳列位置因素後(圖2)就可以清楚地發現,貨架陳列位置的確會影響銷量, 成功驗證我們的假設,所以這時就可以明確的向老闆建議,銷量不好、但是人口數大的分店,將行銷預算投資到提升商品於貨架陳列位置。 如果此時我們可能會擔心該店根本沒有足夠的行銷預算可以編列,我們就再放入因素廣告預算(Advertising)。
圖3、銷量/人口/貨架陳列位置/廣告預算 比較圖

放入變數廣告預算後(圖3),可以更精確地看有許多分店, 即便投入大量行銷預算, 效果也不大。為了找到可以改進銷量不好的分店,而我們可以設定一個條件,例如: 選出人口數大於300且銷售量在7.5(千單位)以下,並且有廣告預算的分店(圖4),建議將廣告預算可以 勻撥一些至提升貨架陳列位置,就可預期會有提升銷售的效益。
圖4、行銷策略可修正分店
本文的範例中, 係目前一般企業中常見的狀態,往往只有銷量與費用的前提下,給定一個依據資料顯示的決策方案。讀者可能會覺得,一家公司怎麼可能連資訊化的交易資料都沒有,事實上現在台灣還是有許多公司認為,把訂單打在Excel就是資訊化,然而 Excel上的資料距離可分析成有用的資訊,還有很大的距離。
對於一般的公司而言,想導入資料科學的技術,初期公司資源有限,資料可能也不多,但只要是有品質的資料、且能夠有邏輯的呈現,就算是不用演算法,也可以協助公司做初步的決策。當然想要精準行銷或者推薦系統等,大量的資料與適當的演算法,絕對是不可或缺的一環。

作者:林建興(TMR技術長)、蘇宇暉(台科大管研所博士生)、羅凱揚(台科大兼任助理教授)

留言

這個網誌中的熱門文章

淺談資料類型 — 初級資料與次級資料

淺談資料類型 — 研究資料

淺談資料類型—企業內部資料和外部資料