首頁 > 知識分享 > 大數據行銷與個人資料

大數據行銷與個人資料

2017/06/07
目錄

大數據(Big Data)似乎已經成為近期人人朗朗上口的名詞,而大數據也確實在行銷領域顯現了巨大的發展潛力。例如Walmart透過高價併購一家專長分類社群網站資訊並客製化輸出資訊的公司(Kosmix),能將資訊個人化後提供終端消費者採購建議,因此Walmart不僅能挖掘客戶需求,更能創造客戶需求;麥當勞則將大數據利用於改善得來速的使用經驗-畢竟只想買一杯奶昔的消費者,要是排在一輛載滿一大家子成員的車子後方,當下恐怕難有何良好的消費體驗。在臺灣,雅虎奇摩也利用稱為「有價值的點擊」(quality click)技術,分析消費者的點擊分佈,偵測消費者採購前的比較行為,以針對不同購買者推薦不同商品。一個尷尬的案例發生在美國的知名零售商Target,該公司利用大數據分析客戶的購物習慣,來預測客戶是否即將懷孕,以便向準媽媽推銷相關產品,某位高中女生的父親,因為女兒收到嬰幼兒用品的折價券,而憤怒地前往Target興師問罪,但最終結果是Target的分析並沒有錯誤,這位高中生確實已經懷孕,賣場的行銷系統竟然比父母更了解自己的女兒,這就是大數據的威力之一。

什麼是大數據?

所謂「大數據」又稱為巨量資料或海量資料,雖然沒有一個固定的定義,但一般用於稱呼具有巨量(volume)、多樣(variety)及即時(velocity)等特性的資料集。「巨量」的資料是大數據的第一個特徵,但巨量資料並非單一來源,而是來自如網路搜尋、信用卡的消費紀錄、社群媒體的發文、手機定位…等「多樣」途徑;某些觀點甚至認為這是大數據最重要的一項特性,亦即資料庫的規模不但要夠龐大,而有必要結合其他外部資料,才足以產出新的發現,也才能夠被稱為是大數據。「即時」則指快速甚至立即(real time)的資料分析,過去以分析由人類所製造的資料為主的「靜止大數據」(Big Data at Rest),也開始轉變為以機器產生的資料作為資料源的「流動大數據」型態(Big Data in Motion),比如物聯網設備即時產生的各種資料等。

大數據與個人資料

大數據分析的資料雖然包括許多與個人無關的資訊,如氣候或氣象資訊的預測,或是利用公車裝備GPS裝置取得地理資訊估算可能的抵達時間等,但確實許多的大數據分析可能與個人資料有關,所謂個人資料,指的是足以識別(identify)特定個人的資料,某些資料雖然本身不足以識別特定個人,但如果透過與其他資訊交叉比對後,仍然可以達到識別特定人的效果時,此類資料也屬於個人資料的一種,例如,由病人身上監控設備所測得的資訊、手機地理位置資訊、利用穿戴裝置進行的消費行為等,而現代依照個人的年齡、偏好、生活方式提供產品或服務的潮流,便是大數據分析在行銷領域應用的成果。大數據分析也有潛力「創造」新的個人資料,比如利用一個人在社群媒體的活動再結合其他數據分析,決定一個人的信用評級,或是利用車輛的各種感應裝置判斷個人的開車習慣,以決定駕駛人的保險費率,又或是藉由大眾運輸票券的使用紀錄與交通資訊,制訂新的公車路線等等,而後者此種利用方式,通常在分析前已先將個人資料進行去識別化或匿名化(anonymised)處理。

大數據分析與個人資料保護

涉及個人資料的大數據分析,可能以特定人為對象以制訂對個人的精準行銷計畫,也可能以一群人為對象以掌握市場脈動,然而將個人資料利用於大數據分析,屬於個人資料的「利用」行為,必須基於合法蒐集及當事人事前或事後的同意,否則即屬違法,其次,資料庫在匿名化(去識別化)處理前,僅得供原始蒐集企業內部使用,即使在關係企業間或母子公司間亦然。如果一種資訊無法識別特定個人,該資訊自然就不具有個人資料的資格,而成為單純的數據資料,不僅可以於組織內部自行使用,甚至可以與他人共享,因此去識別化後的資料在大數據分析中有許多的應用空間。

然而,去識別化(匿名化)的要件在國際間有數種不同的標準,比如歐盟的「資料保護工作小組」(The Article 29 Working Party)所提出的參考指引文件(WP 216)中,以是否滿足下列三項要求,作為判定是否完成「去識別化」之參考:1.是否仍可能識別當事人、2.是否仍可能與其他個人資料相連結、3.是否仍可能推論出與特定人相關;美國雖然沒有統一的認定標準,但以聯邦健康保險法(HIPAA)底下制定的隱私規範(Privacy Rule)為例,以1、專家判斷法:由具備統計等相關領域專業的專家,依其認為適當的統計或其他分析原則與方式,判定資料受到他人再識別之可能性極低時,即完成去識別化,或2、安全港判斷:如個人醫療資訊中已移除姓名、地址、電話、電子郵件等特定18項要素,作為是否完成去識別化的判斷標準。我國則由法務部目前作成的函釋觀察,傾向以匿名資料的接收者是否有能力重新識別當事人為判斷標準,此與德國、英國資訊保護官及英國法院見解相同,因此,單純的遮掩個人姓名或是部分資訊,或僅是將個人資料檔案加密,顯然都不是國際上一般所認為的個人資料匿名化方法,而未以符合國際標準匿名處理的資料,就仍屬於個人資料,一切的利用即仍應遵循個資法相關規定,否則即有違法之虞。

不過,大數據可能帶來大規模的隱私侵害,而招致大型的團體訴訟,除了資料庫可能外洩或遭竊外,也可能是制度設計不良所致,著名的線上影音網站Netflix就曾經為此付出代價。Netflix係透過Cinematch演算法為客戶精確推薦影片,給予用戶良好的使用體驗,為了行銷與改進推薦系統等目的,Netflix曾舉辦名為Netflix Prize的百萬美金大賽,以自己的客戶資料庫為分析基礎,吸引數萬組菁英團隊加入競爭,為Netflix打造更先進的電影推薦系統,然而,固然Netflix提供的資料庫不包括完整的用戶個人資訊,但是許多用戶仍認為,他們對於電影的偏好涉及各人喜好以及敏感的個人議題-比如性傾向、家暴、亂倫等等,而Netflix竟然未經用戶同意就將這些資訊公開上網,因此他們一狀告上法庭,最後Netflix付出了900萬美元的代價取得和解,也使得連續舉辦兩屆的Netflix Prize無以為繼。

結語

大數據的分析已經在行銷領域上扮演了非常重要的角色,然而隨著國際上對個人隱私保護的愈加重視,如何兼顧效率及隱私,將是企業必須持續精進的課題。前述Target精準的分析與預測,是否符合當事人的期待?或已經逾越個人隱私的份際?Netflix在規劃行銷活動之時,並沒有將個人隱私權考量在內,賠上了商譽和金錢。在大數據的領域究竟應該如何拿捏隱私保護的尺度,無論企業或個人,顯然都還在互相學習與適應中。

本文發表於經貿透視雙週刊第442期


  行銷與法律系列文章

請輸入關鍵字