文:劉虹君
台北市長柯文哲卸任前力推的政策之一「台北大數據中心」昨(1/19)正式啟用,柯表示,此開啟以數據治理城市並作為政治決策的新時代,且發展「資料經濟」勢在必行,但對於過去外界屢屢質疑恐有侵害個資、不當商用等問題,柯文哲僅回應「科技永遠走在法律前面」,重申以設立資料治理委員會確保個資不被濫用。
大數據的價值是數據的真實性
要用大數據創造價值,必要條件就是數據的真實性。大數據的標準定義是,資料量要在100TB到PB之間,但其實絕大多數的企業,都不符合這個標準。大企業如eBay、亞馬遜或AT&T等大型電商或許符合大數據的標準。但其實資料量只是大數據的其中一個面向,大數據揭示的是一種「資料經濟」的精神,而非只是「大」。
企業真正要尋找的是非傳統的、且未曾被挖掘過的資料,並從中去提煉出價值,這才是對大數據應有的正確認知,而非只是執著於資料大小,只要能從看似毫無意義的數據礦坑中挖掘出金礦,有誰會在意那座礦坑原本的大小呢?大數據這個名字容易讓人誤導,因為真正重要的是其中的大智慧。
無所不在的大數據威力
凡走過必留下痕跡
互聯網、社交網站、網購等已經是很多人生活的一部份,無可避免地我們有越來越多的重要個人資料,包括姓名、地址、電話、生日日期、證件號碼、信用卡資料,以致社交網絡、個人喜好、購物習慣、行為等,被不同的機構收集、追蹤、保存,甚至販賣。
不少機構還會把我們的資料,與其他用戶的資料作比較、分析,然後作出預測性的營銷。電子商務網站Amazon的成功,這句 「Customers Who Bought This Item Also Bought」 背後的數據分析能力,居功不少。假如你有網購的習慣,商戶除了擁有你所有的基本個人資料、地址、信用卡帳號,還有你的購物記錄、瀏覽記錄等。透過對比你與其他顧客的資料,和分析你所購買的商品和其他商品的關係,商戶可以估計出你的喜好、預計你將會需要的物品,從而對你作出個人化的精準行銷。我常開玩笑說:充滿大數據的今天,網路商家甚至比你的家人更了解你。
大數據與警政聯手出擊
近年來,「大數據」除了運用在商業、管理與科技研發上,從「資料探勘」中掌握「大數據」,也擴大到打擊與預防犯罪的領域中。大數據增強科技辦案能量,讓犯罪無所遁形。
隨著網路犯罪的橫行,加上資安管理法通過,要順利偵破網路犯罪案件,後端必須要有強大的犯罪資料庫。警政單位在二○一八年開始陸續使用大數據工具和建置大數據分析平台,透過分析相關的犯罪手法,再輔以資深員警的辦案經驗,藉此提高警察的破案率。
預測一直是大數據的核心應用,當然也運用在偵查領域的預防及體現在對犯罪行為的提前感知上,即犯罪預警,預防是對犯罪最好的打擊。
除此,大數據能夠幫助偵查人員精確鎖定犯罪嫌疑人、擴展案件相關線索,並深入挖掘其他罪行。大數據精確型偵查能夠回應新常態下犯罪發展出的系列性、跨區域性、地域性趨勢,彌補過去偵查機關由於對資訊量不足、準確性低,所導致的破案率低、追贓少的不足。近年來許多假新聞,網路詐騙等案件偵破,大數據在偵查破案中的功勞也不可小覷。