賈伯斯教我的創新:為何連結思維是數據分析師的外掛利器?

賈伯斯說的那句話,你真的懂嗎?

Creativity is just connecting things.”

賈伯斯這句話大家都聽過,但老實說,許多數據分析師根本不認為與他有關。

曾有數據分析師跟我抱怨:「老闆要我做這個專案的data太少了,很難做出什麼有價值的分析。」我問他:「你找過上中下游的數據嗎? 還是你只看了一個系統的數據?」

他頓時愣了一下。

數據分析師們常被困在「現有數據」的框架裡,這才是問題

這就是問題所在,數據分析師們常被困在「現有數據」的框架裡,以為創新就是要有什麼前所未有的新數據、新技術、新方法。但真正的創新不是這樣的。

前所未有並非創新唯一的定義。

所謂創新,是把散落的資訊與專業經驗串聯起來,從中找蛛絲馬跡,發現別人沒看到的洞察


別只盯著你眼前的那張表

數據分析師拿到一張大表(或table)就開始分析,完全不管這張大表的數據是哪來的、怎麼產生的、中間經過什麼處理。

之前有個案例,同事在做客戶貢獻度分析,用的是data mart裡面的客戶資料表,分析了老半天,實在找不出區分貢獻度的因子。

我問他:「你知道這張表的數據怎麼來的嗎?」

他說:「不就是從客戶資料庫來的嗎?」

「那你知道中間經過什麼處理嗎?」

「呃…不知道。」

後來我們一起往回追,才發現問題:data mart裡的「客戶貢獻度」定義,跟業務單位實際認知的計算邏輯不一樣。IT在ETL過程中做了一些簡化處理,導致數據不一致。

你看,如果他只盯著data mart那張表,永遠找不到真正的問題。

身為數據分析師,千萬不要受限於現存僅有的數據。

你要做的是不斷地從data warehouse到data mart之間來回,甚至從數據的上中下游系統去摸索。這些數據中間如何處理?如何定義?有沒有遺漏?有沒有重複?

這不是在找麻煩,這是在找真相


客戶畫像不是一張表,是一個拼圖

讓我換個角度講。如果從客戶角度思考,你要怎麼更完整地掌握所謂的客戶畫像(customer persona)、以及客戶旅程(customer journey)的數據?

很多公司有「客戶資料表」,裡面有基本資料、交易記錄、產品持有狀況,然後數據分析師就用這張表做分析,畫出客戶輪廓。

但這只是一小部分而已。

真正的客戶畫像,應該整合:

  • 交易數據:買了什麼?什麼時候買?花多少錢?
  • 行為數據:在網站上看了什麼?停留多久?點了哪些按鈕?
  • 互動數據:打過幾次客服電話?問了什麼問題?抱怨過什麼?
  • 社群數據:在社群媒體上說過什麼?對品牌的態度如何?
  • 外部數據:人口統計、地理位置、經濟狀況

這些數據散落在不同系統、不同部門、不同格式,即所謂的數據孤島。你的工作不是等別人把它們整理好給你,而是主動去串聯它們。

賈伯斯教我的創新_為何連結思維是數據分析師的外掛利器

之前某家電商公司的行銷部門一直覺得數據分析做得不夠好,因為分析師只會看銷售數據,給不出什麼有用的建議。

後來重新設計了整個分析流程,數據分析師開始:

  • 串聯網站行為數據,看客戶瀏覽了什麼但沒買
  • 串聯客服系統,看客戶打電話問過什麼
  • 串聯EDM系統,看客戶對什麼內容有反應
  • 串聯物流系統,看配送體驗如何影響回購

當這些數據串起來之後,客戶的「完整樣貌」才出現。我們發現:很多客戶不是不想買,而是在某個環節卡住了。有人是因為運費太貴、有人是因為找不到尺寸資訊、有人是因為不確定品質。

這些洞察,如果你只看銷售數據,永遠發現不了。


創新就是把散落的點連成線

回到賈伯斯那句話:”Creativity is just connecting things.”

他不是說創新要發明什麼從來沒有的東西。他說的是,創新就是連結那些已經存在、但還沒被連在一起的東西。

套用在數據分析領域也是一樣。

你不需要什麼神奇的新數據、不需要什麼最新的演算法、不需要什麼前所未有的技術。你需要的是把現有的數據整合與連結起來

整合與連結的過程,就是創新的過程

當你把:

  • 交易數據 + 行為數據 → 發現客戶的真實需求
  • 客服數據 + 產品數據 → 發現產品的痛點
  • 行銷數據 + 流失數據 → 發現行銷的盲點
  • 內部數據 + 外部數據 → 發現市場的機會

這種整合與連結,會讓你看到別人看不到的東西。這就是數據分析的重新詮釋、或差異化詮釋

進而達到新觀點,這也就是創新了。


整合不是把所有數據丟在一起

這裡要特別強調一點:整合不是把所有數據都倒進一個大表格裡就好了。

我見過有人把十幾個資料表用left join串在一起,結果產生一個有200個欄位的超大表。然後他說:「你看,我把所有數據都整合了。」

這不叫整合,這叫混亂。

真正的整合,要有邏輯、有目的、有架構

你要先想清楚:

  1. 我要回答什麼問題? 不是為了整合而整合,而是為了解決特定問題
  2. 需要哪些數據來回答這個問題? 不是越多越好,而是必要且充分
  3. 這些數據之間的邏輯關係是什麼? 是一對多?多對多?有時間先後順序嗎?
  4. 整合後要如何呈現? 是建立新的分析維度?還是建立新的指標?

舉個例子。如果你要分析「客戶旅程中的流失點」,你需要:

  • 時間序列的行為數據:客戶在每個階段做了什麼
  • 轉換漏斗數據:從瀏覽→加購→結帳→付款,哪一步流失最多
  • 客服互動數據:在哪個階段遇到問題來問客服
  • 最終結果數據:買了還是沒買?之後有沒有回購?

這四類數據要依照客戶旅程的時間軸串起來,才能看出流失點在哪裡。如果你只是把它們全部合併成一個大表,反而看不出什麼。


從系統的上中下游去摸索

還有一個很重要的技能:你要知道數據的生命週期

數據不是憑空出現在data warehouse裡的。它有源頭、有流動、有轉換、有落地。

上游:數據的源頭

  • 客戶在APP上點了一個按鈕
  • 業務員在CRM系統裡輸入客戶資料
  • POS機記錄了一筆交易

中游:數據的處理

  • ETL流程把原始數據清洗、轉換
  • 系統之間的串接和同步
  • 資料定義的統一和標準化

下游:數據的應用

  • 進入data warehouse
  • 建立data mart供分析使用
  • 產生報表和儀表板

作為數據分析師,你要能夠在這個流程中來回游走。不要只看下游的data mart,而要往回追到中游的處理邏輯,甚至上游的原始數據。

之前碰過一案例,有個指標一直很奇怪,業務單位說不對,但數據分析師堅持數據沒錯,後來我們一路追到上游,發現是業務員在CRM系統裡輸入錯誤,因為系統介面設計不良,很容易點錯。

如果只看data mart的數據,永遠會跟業務單位有溝通障礙。


結語:創新的能力,就是連結的能力

回到一開始的問題:你的公司真的沒數據嗎?還是你沒有去連結那些數據?

大多數情況下,不是數據不夠,而是數據散落各處,沒有被整合起來。

你的價值不在於用什麼厲害演算法,而在於能不能把連結散落數據,找到別人看不到的洞察。

這需要:

  • 不受限於現有數據的思維
  • 在data warehouse和data mart之間來回的能力
  • 從上中下游系統摸索的好奇心
  • 整合與連結數據的邏輯架構
  • 重新詮釋數據的創新視角

當你具備這些能力,你就不再是「淺層分析的人」,而是「創造洞察的人」

賈伯斯說:”Creativity is just connecting things.”

現在你應該懂他在說什麼了。

創新不是發明,而是連結你已經擁有的。