賈伯斯說的那句話,你真的懂嗎?
“Creativity is just connecting things.”
賈伯斯這句話大家都聽過,但老實說,許多數據分析師根本不認為與他有關。
曾有數據分析師跟我抱怨:「老闆要我做這個專案的data太少了,很難做出什麼有價值的分析。」我問他:「你找過上中下游的數據嗎? 還是你只看了一個系統的數據?」
他頓時愣了一下。

這就是問題所在,數據分析師們常被困在「現有數據」的框架裡,以為創新就是要有什麼前所未有的新數據、新技術、新方法。但真正的創新不是這樣的。
前所未有並非創新唯一的定義。
所謂創新,是把散落的資訊與專業經驗串聯起來,從中找蛛絲馬跡,發現別人沒看到的洞察
別只盯著你眼前的那張表
數據分析師拿到一張大表(或table)就開始分析,完全不管這張大表的數據是哪來的、怎麼產生的、中間經過什麼處理。
之前有個案例,同事在做客戶貢獻度分析,用的是data mart裡面的客戶資料表,分析了老半天,實在找不出區分貢獻度的因子。
我問他:「你知道這張表的數據怎麼來的嗎?」
他說:「不就是從客戶資料庫來的嗎?」
「那你知道中間經過什麼處理嗎?」
「呃…不知道。」
後來我們一起往回追,才發現問題:data mart裡的「客戶貢獻度」定義,跟業務單位實際認知的計算邏輯不一樣。IT在ETL過程中做了一些簡化處理,導致數據不一致。
你看,如果他只盯著data mart那張表,永遠找不到真正的問題。
身為數據分析師,千萬不要受限於現存僅有的數據。
你要做的是不斷地從data warehouse到data mart之間來回,甚至從數據的上中下游系統去摸索。這些數據中間如何處理?如何定義?有沒有遺漏?有沒有重複?
這不是在找麻煩,這是在找真相。
客戶畫像不是一張表,是一個拼圖
讓我換個角度講。如果從客戶角度思考,你要怎麼更完整地掌握所謂的客戶畫像(customer persona)、以及客戶旅程(customer journey)的數據?
很多公司有「客戶資料表」,裡面有基本資料、交易記錄、產品持有狀況,然後數據分析師就用這張表做分析,畫出客戶輪廓。
但這只是一小部分而已。
真正的客戶畫像,應該整合:
- 交易數據:買了什麼?什麼時候買?花多少錢?
- 行為數據:在網站上看了什麼?停留多久?點了哪些按鈕?
- 互動數據:打過幾次客服電話?問了什麼問題?抱怨過什麼?
- 社群數據:在社群媒體上說過什麼?對品牌的態度如何?
- 外部數據:人口統計、地理位置、經濟狀況
這些數據散落在不同系統、不同部門、不同格式,即所謂的數據孤島。你的工作不是等別人把它們整理好給你,而是主動去串聯它們。

之前某家電商公司的行銷部門一直覺得數據分析做得不夠好,因為分析師只會看銷售數據,給不出什麼有用的建議。
後來重新設計了整個分析流程,數據分析師開始:
- 串聯網站行為數據,看客戶瀏覽了什麼但沒買
- 串聯客服系統,看客戶打電話問過什麼
- 串聯EDM系統,看客戶對什麼內容有反應
- 串聯物流系統,看配送體驗如何影響回購
當這些數據串起來之後,客戶的「完整樣貌」才出現。我們發現:很多客戶不是不想買,而是在某個環節卡住了。有人是因為運費太貴、有人是因為找不到尺寸資訊、有人是因為不確定品質。
這些洞察,如果你只看銷售數據,永遠發現不了。
創新就是把散落的點連成線
回到賈伯斯那句話:”Creativity is just connecting things.”
他不是說創新要發明什麼從來沒有的東西。他說的是,創新就是連結那些已經存在、但還沒被連在一起的東西。
套用在數據分析領域也是一樣。
你不需要什麼神奇的新數據、不需要什麼最新的演算法、不需要什麼前所未有的技術。你需要的是把現有的數據整合與連結起來。
整合與連結的過程,就是創新的過程。
當你把:
- 交易數據 + 行為數據 → 發現客戶的真實需求
- 客服數據 + 產品數據 → 發現產品的痛點
- 行銷數據 + 流失數據 → 發現行銷的盲點
- 內部數據 + 外部數據 → 發現市場的機會
這種整合與連結,會讓你看到別人看不到的東西。這就是數據分析的重新詮釋、或差異化詮釋。
進而達到新觀點,這也就是創新了。
整合不是把所有數據丟在一起
這裡要特別強調一點:整合不是把所有數據都倒進一個大表格裡就好了。
我見過有人把十幾個資料表用left join串在一起,結果產生一個有200個欄位的超大表。然後他說:「你看,我把所有數據都整合了。」
這不叫整合,這叫混亂。
真正的整合,要有邏輯、有目的、有架構。
你要先想清楚:
- 我要回答什麼問題? 不是為了整合而整合,而是為了解決特定問題
- 需要哪些數據來回答這個問題? 不是越多越好,而是必要且充分
- 這些數據之間的邏輯關係是什麼? 是一對多?多對多?有時間先後順序嗎?
- 整合後要如何呈現? 是建立新的分析維度?還是建立新的指標?
舉個例子。如果你要分析「客戶旅程中的流失點」,你需要:
- 時間序列的行為數據:客戶在每個階段做了什麼
- 轉換漏斗數據:從瀏覽→加購→結帳→付款,哪一步流失最多
- 客服互動數據:在哪個階段遇到問題來問客服
- 最終結果數據:買了還是沒買?之後有沒有回購?
這四類數據要依照客戶旅程的時間軸串起來,才能看出流失點在哪裡。如果你只是把它們全部合併成一個大表,反而看不出什麼。
從系統的上中下游去摸索
還有一個很重要的技能:你要知道數據的生命週期。
數據不是憑空出現在data warehouse裡的。它有源頭、有流動、有轉換、有落地。
上游:數據的源頭
- 客戶在APP上點了一個按鈕
- 業務員在CRM系統裡輸入客戶資料
- POS機記錄了一筆交易
中游:數據的處理
- ETL流程把原始數據清洗、轉換
- 系統之間的串接和同步
- 資料定義的統一和標準化
下游:數據的應用
- 進入data warehouse
- 建立data mart供分析使用
- 產生報表和儀表板
作為數據分析師,你要能夠在這個流程中來回游走。不要只看下游的data mart,而要往回追到中游的處理邏輯,甚至上游的原始數據。
之前碰過一案例,有個指標一直很奇怪,業務單位說不對,但數據分析師堅持數據沒錯,後來我們一路追到上游,發現是業務員在CRM系統裡輸入錯誤,因為系統介面設計不良,很容易點錯。
如果只看data mart的數據,永遠會跟業務單位有溝通障礙。
結語:創新的能力,就是連結的能力
回到一開始的問題:你的公司真的沒數據嗎?還是你沒有去連結那些數據?
大多數情況下,不是數據不夠,而是數據散落各處,沒有被整合起來。
你的價值不在於用什麼厲害演算法,而在於能不能把連結散落數據,找到別人看不到的洞察。
這需要:
- 不受限於現有數據的思維
- 在data warehouse和data mart之間來回的能力
- 從上中下游系統摸索的好奇心
- 整合與連結數據的邏輯架構
- 重新詮釋數據的創新視角
當你具備這些能力,你就不再是「淺層分析的人」,而是「創造洞察的人」。
賈伯斯說:”Creativity is just connecting things.”
現在你應該懂他在說什麼了。
創新不是發明,而是連結你已經擁有的。