統計的英文(Statistics)是從拉丁文的status(國家、政府)而來,指的是國家經濟狀態、人口統計等原始數據。
「簡單說,統計學就是資料的科學,也就是用科學的方法問問題,處理、分析資料,進而做出推論。」乍聽之下,不管是統計學或資料分析科學,都像是特定專業人士的技能,但是對Code for Tomorrow基金會共同發起人劉嘉凱來說,這是任何人都可以學會,也應該要學會的能力。
Code for Tomorrow的願景,是以資料為基礎,提供對社會有益的資料服務。其中一項計畫,劉嘉凱戲稱為「開補習班」,補習科目是「看資料找故事」,教學員如何觀察資料、掌握架構、然後說出資料的故事。
所謂的「看資料」,可以從資料的生命周期來理解,也就是數據產生後,一連串蒐集、整理、儲存和分析的流程;而「找故事」,則是依據分析資料的目的,評估現狀、預測未來、做出決策。
結合看資料和說故事,就是把資料轉換成老闆聽得懂的語言,支援管理者的決策。
多做科學思考:問問題、做假設
面對數字不知從何下手,是許多經理人的煩惱。劉嘉凱認為,資料分析的第一步,先別急著分析或解讀,而是問問題。經理人必須先了解自己的管理目標──提高營業額、市占率、還是降低成本,才能提出達到目標的假設。
比方說,百貨公司專櫃店長的目標是衝刺營業額,店長便提出「下個月以降價促銷提高營業額」的假設。有此假設,店長才知道要怎麼觀察數據,從過去的數字找出實施降價的營業額變化,藉以預測促銷方案的結果。
另一種情況是,經理人還不知道要問什麼問題,就直接面對數據,就像每個月的損益表、進出貨金額、庫存狀況、銷售品項等統計數字。
此時,經理人必須先了解自己工作上的關鍵數字(例如來客數、營業額、採購金額、庫存量),運用以下4個方法觀察數字,找出「和平常不一樣」的地方,針對不一樣的地方問問題,提出假設回答問題,再從數字當中反覆驗證假設。
1.比較(大小):哪項產品賣得最好。
2.組成(占比):產品組合如何,加上外部數字還可以觀察市占率。
3.關係(相關性、趨勢):什麼產品總是一起賣出;產品銷售和天氣、地域的關係。
4.分布狀況(呈現常態分布或偏離):實際數據與常態分布的落差,可以當作思考的起點。
「資料分析應該多花一點時間放在科學思考,也就是問問題的階段,這個部分更屬於管理的領域。」劉嘉凱舉例,某連鎖冷飲店店長看了報表後發現,台北市南區的店面紅茶賣得特別好。他可能要提出幾種「為什麼紅茶賣得比較好」的假設,並加以驗證。比如說,是菜單上的紅茶類占比較高?咖啡的庫存太低?還是因為上個月來客數增加,營業額自然成長?分析這些統計數字的變化,店長才能做出相應的預測與決策。
由於預測從來不會只是一種,而是多種情境,每一種假設也都有相應的風險,因此,劉嘉凱表示,「統計數字可以告訴管理階層的是,對每一種scenario(情境)的預測有幾成把握。」另一方面,紅茶賣得好的這項統計事實,對冷飲店店長和總公司的管理階層來說,各自牽涉到不同的決策,表示「數字本身只是工具,重點還是管理者如何解讀、推論和下決策。」
抽樣和隨機對照,有力的決策工具
有別於經理人常仰賴的經驗法則和直覺,統計也有助於改善決策品質,舉凡抽樣、假設驗證和實驗設計等,都是管理者可用的決策工具。
例如,下個月要上線的網站應該採用什麼樣的版面,才能吸引流量?這時就可以設計「隨機對照實驗」,以隨機出現的網站版本,測試哪一種編排最能達到網站設計者或經營者的點閱、註冊、購買等目標。抽樣則是常見於消費者意見調查,好的抽樣設計,可以兼顧市場調查的成本,與決策所需的市調準確度。
最後,劉嘉凱建議,經理人可多以團隊合作的方式解讀數據,因為同樣的數據交由不同的人來解讀,往往會得出不同的假設,有助於突破單一角度的盲點。
劉嘉凱
Code for Tomorrow 共同發起人、御言堂總經理,創立未來事件交易所。
|