
“The map is not the territory.” – Alfred Korzybski
❏ 引言
歡迎回到《非正式寫作》#79 — 理解複雜世界,前往那尚未被命名的自己。
數據是 AI 時代的黃金,前提是這些資料要能整合起來,成為對模型有用的上下文。如何打破「數據孤島1」成了企業 AI 轉型的必修課題之一。
大多數組織的做法是建置數據湖倉,期望把散落在各資料域的龐大數據,放進一致化的儲存與存取介面,讓整合與創新更容易生長 — 但,這樣真的有用嗎?
「打破數據孤島,實現一統的資料平台」:這樣的口號,常在數位轉型的正義之下被視為最佳實踐。
我不禁想:如果可以,誰不希望家裡永遠整整齊齊?然而,每樣物品總能找到一個又一個的理由,出現在你意想不到的地方。儘管你一次次地收拾,空間仍會隨著時間回到屬於它的熵增平衡。
數據孤島?它從何而來?把數據統一放進資料平台之後,又該如何對抗自然的熵增?這期電子報,就讓我們用「因果力學」的角度,聊聊數據孤島的生成緣由以及有效的應對策略。
.
📚 目錄 & 關鍵字
1. 數據孤島的根源:解析人性中的三股力量
2. 為什麼「權力」與「技術」無法根治孤島
3. 解決方案:與孤島共存的務實橋樑策略
Keywords: 數據孤島 | 資料孤島 | 首席數據官 | 數據平台 | Data Lakehouse | 數據治理
🔍 工人智慧猜你也喜歡
《非正式寫作》探索並理解當代世界的多面向特質。
每週更新。馬上訂閱,與 1400+ 位讀者一同升級 ⬆️
❏ 數據孤島的根源:解析人性中的三股力量
✔ 邊界感
「數據孤島」這個詞總讓我覺得帶有過度指責的意味。仔細想想,「孤島」難道不是數據的自然狀態嗎?就像每個人都有屬於自己的記憶,我們不會因此批評這是「記憶孤島」,也不會試圖建立統一的記憶平台(當然,國家層面可能是個例外)。
數據天生就是以孤島形式存在,只是因為我們如何分類、如何看待它,才產生了不同的界線。
當我們從個人視角、家庭視角、城鎮視角,一路擴展到國家視角來觀察同一件事時,會發現不同層級需要不同程度的抽象。以鄉鎮發生的瑣碎事件為例,如果缺乏適當的抽象機制,國家政府很可能被各種雞毛蒜皮的細節所淹沒。
因此,當我們不設定明確的邊界時 (明確的抽象層級),所謂的「孤島」其實並不存在。
.
✔ 權力的放大器
數據邊界並不是天生的,而是因為我們如何分類、如何看待它而生成。這些界線就像地圖的格線,標示了誰該負責什麼,讓協作得以展開。
每個邊界內的單元職責不同、工具不同、關注焦點不同。於是衍生出形形色色的資料,成為各自運作的「燃料」。
例如:一間咖啡店準備討論「冬天要不要推出楓糖拿鐵」,不同單元在意的資料大不相同:
門市營運關注的是「杯數、時段、客單價」,他們關心排隊和現金流;
行銷團隊盯著 IG 按讚數和 LINE 會員點擊率,他們在乎品牌聲量;
供應鏈計算牛奶、糖漿、咖啡豆庫存,他們想確保原物料穩定。
三組資料各居一島,彼此互不相通。當決策會議召開,誰能最快把自己的燃料轉成大家看得懂、信得過的資訊,就能左右最終的行動方案:
門市若先端出「高峰時段模擬與預估日銷量」,方案可能更快被採納;行銷如果及時拿出「社群聲量暴增趨勢」,預算與檔期便可能轉向他們。
因此,資料不只驅動業務運轉,同時也是權力的放大器:擁有資料並能有效「轉譯」的人或團隊,往往能在組織內獲得更大的影響力。
.
✔ 注意力侷限
邊界一旦畫下,裡面的人就比較難再把目光投向外面。注意力有限,我們本能地只搜尋「屬於自己領地、對自己最有價值」的訊息;找到之後,可能還會把它視為競爭優勢而緊握不放,形成一條自我強化的路徑:
邊界讓專業聚焦 → 專業催生資料 → 注意力侷限 → 關鍵數據被視為私有資本 → 權力因此被放大 → 邊界更加穩固
這條路徑不斷反覆,就像河水日復一日沖刷著同一條海岸線。在缺乏外部力量介入的情況下,孤島的輪廓只會被刻得更深、彼此距離越拉越遠。
.
❏ 為什麼「權力」與「技術」無法根治孤島
這些看似理所當然的數據孤島,究竟是問題的根源,還是我們面對複雜性的必然結果?「我們有了數據,為什麼決策還是如此困難?」。
通常,當組織在更高層級的決策制定上卡關時,才會赫然驚覺數據孤島的存在。這種卡關,往往表現在三個令人頭痛的面向:
各個業務單位儘管手握海量資料,但這些資料對上層的策略決策卻缺乏實質的價值與洞見。
想要有效整合各個孤島的數據?舉步維艱!無法形成足以支撐決策的整合數據,就像一盤散沙。
更糟的是,孤島各自得出不同的結論,只揭露了部分的真相,有時甚至還會相互矛盾,無形中增加了決策的複雜度與不確定性。
面對數據離散的混沌,我們經常能見到的應對方式:透過一個「更高權力」的外部力量,強行將這些孤島拉近在一起。
例如,指派一位 CDO (首席數據官) 來統籌大局,或是導入 Data Lakehouse (資料湖倉) 這類新技術,期望一網打盡所有數據。
人(權力)與物(技術)看似都統一了,那麼我們所期望看見的事「打破孤島」,就會自然而然地水到渠成嗎?
.
✔「槌子找釘子」的思維慣性
一個被賦予權力的人,或是一個被奉為圭臬的技術,當我們面對複雜問題時,這些過度簡化的實踐,讓我們誤入貧於思考的歧途。
以一位技術出身的 CDO 為例,他可能習慣性地專注於解決技術問題,例如將所有資料集中、提升查詢效能等,並為導入新的資料倉儲技術感到興奮。
然而,這種「槌子找釘子」的方法,僅僅在技術層面打破了數據孤島,卻未能從業務決策和組織運作的「宏觀角度」來定義資料目標。
如果資料目標無法明確定義,並與業務策略保持一致,即使在技術上已經集中,不同部門因其「邊界感」 所形成的「業務理解孤島」依舊存在。
數據集中了,但大家的「品味」和「視角」 卻依然無法對齊,那又有什麼用呢?
.
✔ 資料並不直接貢獻價值
認真看待資料的組織,也會認真看待如何移除資料成功使用與管理上的任何障礙2
這意味著資料必須與組織的「績效」和「價值鏈」產生直接關聯,才能真正成為權力的放大器。
若資料無法體現出它對業務價值的相應產出,而僅被視為技術或行政成本,對資料的投入將備受質疑,難以持續。
數據的價值,不能再停留在「我有這些資料!」這種靜態的擁有,而是要能直接回答:「這些資料為我們帶來什麼商業價值?」、「它如何提升我們的產出效率?」3。
CDO 的失敗,往往源於資料未被納入關鍵的「績效管理」或「業務預算決策」中。
因此,資料的存續與成長,端看其能否直接貢獻於整體業務成果,並在核心決策流程中取得實際的「權限與地位」。
當我們在談論數據時,不是只談論技術,而是在談論如何讓這些數據,真正成為我們理解問題本質、做出選擇、並最終創造價值的基石。
.
✔「權力集中」不等於「注意力集中」
當組織把希望寄託於任命 CDO、導入資料湖倉等「權力集中」手段時,被統一的往往只是硬體與權限,並非人的注意力。
各部門 KPI 咬得緊緊,做好分內的事已耗盡心力;還要額外將欄位解釋、指標對齊、流程檔案化,既燒腦又看不見直接收益,自然被排到待辦清單的最後面。
即便資料集中到資料湖倉,資料整理的貢獻卻難以在其中體現,誰提供、誰受益無從衡量,激勵機制模糊。
於是,技術層面看似合而為一,認知與動機仍各行其是,結果是得到一座規模更大的「集中式孤島」,決策依舊被片段事實所牽制。
.
❏ 解決方案:與孤島共存的務實橋樑策略
用問題牽動合作,用約定穩住品質,用道路管理分享
每座島都有自己的生態系、語言(資料格式)和步調。當我們試圖用傳統的「集中式」方法,想一次性填平大海,再鋪設統一的高速公路時,往往會陷入無止盡的泥淖。
畢竟,組織內部複雜的數據分佈和權責歸屬,讓「集中化數據管理」遠比字面上困難。
真正的解方,或許並不在於消滅這些數據孤島,
而是先想辦法讓島與島之間「走得過去」。
與其追求一步到位的完美計畫,不如先找出最短可用路徑,讓人們能從痛點出發,逐步建立信任。
數據之「橋」,從一個迫切的業務痛點開始,提供一個可信、方便的整合入口,並且讓人願意走第二次、第三次 … 直到它自然成為日常動線。
.
✔ 組織與文化:從共同痛點出發
先選一個每個人都喊痛的問題,例如「這個月生產良率為什麼驟降?」或「庫存到底卡在哪個環節?」,這些都是實際業務場景日夜煩惱的痛點。
接著,用小步快跑的原則,在兩到三週內交付一條「最小可行性產品」。
這座橋一開始或許簡陋,重點是,要讓第一線的使用者「第一次真切體會過橋比渡海還方便、還快速」。這種親身感受帶來的價值,勝過任何複雜的技術報告與願景路線圖。
接著,把縮短決策時間這樣的成功故事,說給更多利害關係人聽,將這份價值流動的效益擴散出去。
.
✔ 實施與治理:先有路,再談統一
我們應該以「最小可行原則」解決單一痛點,並訂下清晰的「約定」。
這些約定包括「定義、計算方法、更新節奏、負責窗口,等等…」。這些原則性的約定,不僅是技術規範,更是團隊間的共識與承諾。
在「必須互通」處做接口的標準化,但在孤島內我們仍保留自主與敏捷。這樣一來,既能避免「扼殺創新」— 讓各部門能根據自身業務特性靈活應變;又能防止數據「各說各話」— 確保跨部門溝通時,數據口徑一致。
把這些約定寫在人看得懂、找得到的地方,而不是埋在程式碼當中。一份有用的文檔 (Data Catalog),能釋放團隊成員的記憶負擔,讓他們專注於更有價值的事務。
.
✔ 副本治理:在效率與一致間取平衡
在追求數據效率的過程中,「副本失控」是常見的副作用。當每個部門都為了自己的報表或分析,不斷複製、儲存相同的數據,不僅造成資源浪費,更可能引發「數據不一致」的混亂。
因此,應該鼓勵「查看不複製,能連線就別另存新檔」。這需要建立一個「透明化」的數據存取機制,讓數據的「可追溯性」成為常態。
當不可避免地需要複製時,也要「附上來源、版本與到期日,等等…」。這不僅是對數據有意識地管理,也是避免雜亂叢生的重要手段。
.
❏ 結語
回到開頭的那句話:「地圖不是疆域」。我們習慣將「數據孤島」視為需要被消滅的敵人,就像試圖用一張完美的地圖來取代真實的地形。
但疆域本身就是崎嶇不平的,孤島的存在反映了組織複雜性的真實面貌。
當我們從「消滅孤島」的思維轉向「連結孤島」的實踐,數據治理便不再是一場零和遊戲,而是一個共創價值的過程。每一座橋的建成,都是組織學習與成長的里程碑。
下次當你聽到「打破數據孤島」這樣的口號時,不妨問問:我們真的需要一個統一的王國,還是一個連結活絡的群島聯邦?答案可能就藏在組織協作中的那些「痛點」裡。
好的數據策略,從來不是技術的勝利,而是人性的理解。
.
如果這篇文章對您有所啟發,您可以透過以下方式支援我的寫作:
請我喝杯咖啡 ☕
將其轉發給可能也會欣賞它的同伴。
留言告訴我什麼讓你印象深刻,分享你的想法,或只是打個招呼。
💡 我也提供各種諮詢服務。如果您想探討合作方式,請透過我的社群媒體聯絡我,或回覆此郵件。
❏ 本週好讀 🛋️
🦥 parting thoughts 🦥
《The 5 Reasons Why A Chief Data Officer Fails》- https://www.anmut.co.uk/a-chief-data-officer-often-fails-because-of-these-5-things/
喜歡這篇