本文發表於會計研究第409期(2019.12)
日前交通部鐵道局基於乘客安全,在台鐵豐原站進行「智慧型影像監控系統」的測試,因原規劃項目包含人臉辨識功能,配合大型人臉資料庫偵測特定黑名單(如通緝犯等),引起社會的廣泛關注,而鐵道局也立即表示該功能將確定不啟用。然而,社會大眾真的這麼在意人臉辨識對於「隱私」的侵害嗎?還記得臉書(Facebook)上「#10年挑戰」熱潮嗎?臉友們紛紛貼上自己10年前後對照相片的同時,正是給了FB訓練人臉辨識AI大量且正確資料,FB比你還要更容易辨認出不同年紀的你。在吸引親友按讚的同時,你的照片連同按讚的臉友與你的互動,一併都成為FB的資產,你又怎麼看這個問題呢?
一、我們都身處於科技巨頭打造的溫柔鄉
「嘿Siri,今天天氣怎麼樣?」「松山區今天多雲,溫度25度到29度,下雨機率20%。」「嘿Siri,我要到國父紀念館。」「正在取得到國父紀念館的路線。開始導航到國父紀念館的路線」,iPhone的Siri就是這麼好用;生日時是否FB動態牆滿滿的都是來自親友的生日祝福?別沈醉在自己有好人緣的幻想中,那是FB提醒好友們記得來送上生日的祝福;晚餐想吃什麼,直接上Google鍵入「晚餐 推薦」,優先出現的就是家附近的高評價餐廳。顯然Google知道你家在哪裡,而且預期你晚上沒有其他行程,在家附近吃晚餐可能最符合你的心意。
當我們享受Apple、Facebook、Google等科技巨頭所提供各項方便的服務時,別忘了科技之所以「貼心」,必然來自於廠商對於我們個人資料的掌握,而在擔心隱私權問題的同時,其實科技巨頭們正是在我們的「同意」之下,一點一滴蒐集我們的個人資料,等我們驚覺他們或許知道的太多時,已經被貼心的服務寵壞而難以離開。更不用說隨手下載的APP或是隨意拜訪的網站,可能根本就是在未經同意或逾越同意範圍的情形下,有系統地蒐集我們的個人資料。
涉及美國總統大選的劍橋分析事件發生後,我們才有一點意識到,原來一個FB的心理測驗小遊戲,就可以透過FB取得這麼多個人資料,進而分析人們的政治取向,而用投其所好的方式,釋出各類真假夾雜的資訊,引導我們做出有心人士想要的決策結果。連我們自己都不知道他人掌握多少我們使用連網設備的各種資訊,如何使用這些資訊影響我們。絕大多數人是明知隱私很重要,卻總是輕易地將個人資料交付給他人,成為他人營運的重要資產,這就是我們所身處的數位環境。
二、從資料、資料庫到大數據-量變造成質變
還記得小時候家附近的雜貨店嗎?當媽媽第一次帶著你上雜貨店,老闆娘把你是某某家小孩的資訊輸入腦海中,之後媽媽請你幫忙買醬油時,就算忘了媽媽請你買哪個牌子,沒關係,老闆娘知道。這是傳統我們所熟知的雜貨店模式,一筆一筆累積客戶的資料作為銷售的依據,這可說是最原始的「資料」蒐集與利用的形態。
一家雜貨店蒐集常客的資料,提供適當的購買建議,我們覺得很貼心,但如果像政府機關一樣,原先是獨立地針對民眾出生、就醫、就學、繳稅、各式補貼等建置資料庫,提升行政效率,其後則發現不同資料庫間相互比對,可以進一步找出「漏洞」,例如:勞保局會自動依據民眾繳稅的薪資數額,逕行核定調高前一年度勞保投保薪資級距,要求回溯補繳保費差額;地方政府以子女或配偶擁有不動產為由終止發放低收入戶補助;甚至用以收取高速公路通行費的ETC,有人提議利用ETC的資料來抓超速違規。就算我們不是鑽漏洞、不正義的一方,恐怕心中也可能覺得不舒服。這類來自政府機關超出蒐集目的的資料庫比對利用行為,大概是首次民眾意識到由腦海或紙筆逐筆記錄的資料,進到以電腦處理的資料庫時代,不是只有資料庫的增加,還產生質的變化,資料庫的活用與比對,可能產生資料被蒐集時,人們所不曾預見的利用,甚至可能因此產生「不利益」。
「大數據」(巨量資料)是另一次的「質變」。「資料庫」年代,各類資料的蒐集是先預設特定目的,進行特定資料的蒐集、累積(結構化的資料),也能夠以人類理解的方式進行分析,而其資料量相對於人類社會活動所產出的「資訊」而言,恐怕九牛一毛都算不上。而大數據則是因應儲存設備與運算能力的大幅提升,不再需要為節省欄位或考量電腦運算能力,僅蒐集人類想像中具有關連性、結構化的資料,只要是資料就多多益善,先蒐集、儲存再說。過去沒有被注意到,或是被認為無用的,或是無「能力」蒐集的資訊(例如:超大量的資料或是即時更新的資料),可以透過新的思惟或方法再來找出這些巨量非結構化資料中隱含的新價值。
例如:7-11可能分析巨量的門市錄影監視資料,發現前一天穿非白色制服的來客量減少10%,隔天鮭魚親子口味的御飯糰的銷售量增加20%。中間似乎沒有人類目前可以理解的「道理」可言,但用來協助店長訂購御飯糰的決策顯然是有用的,歷史資料產生具有「預測」未來的可能性。
進入萬物聯網的年代,我們使用這些聯網設備(電腦、智慧型手機、手環、交通工具、GPS、智慧型電視、智慧音箱、各類型機器人等),分分秒秒都在產出或累積各種數位資訊,這些就是我們的數位足跡。就像是人類找到史前生物留下來的腳印化石一樣,結合不同來源的資訊,可以拼湊出該生物概略的狀況,更遑論有超大量、即時更新的數位足跡正在被蒐集與分析。未來你的政治傾向可能隱藏不了,因為大數據已經透過「真實資料」統計、分析出來,你曾經在三週內拜訪色情網站8次、每次停留15至23分鐘、觀看影片為A類型、平均在拜訪色情網站後1個小時內瀏覽B購物網站,並分別在12至17分鐘內完成3C類別產品購買,平均每週運動時數介於39至47分鐘,所以,你有85%可能性是顯性或隱性支持特定政黨,沒有意外的話,明年總統大選將投票給H候選人。你已經決定好投給誰了嗎?別擔心,其實廣告商已經都知道了,你所接觸到的動態訊息、廣告都會幫助你做出你認為的正確決定。