引言
隨著互聯網、物聯網、云計算等技術的快速發展,以及智能終端、網絡社會、數字地球等信息體的普及和建設,全球數據量出現爆炸式增長,僅在2011年就達到1.8萬億GB。IDC(IntemetData Center,互聯網絡數據中心)預計,到2020年全球數據量將增加50倍。毋庸置疑,大數據時代已經到來。一方面,云計算為這些海量的、多樣化的數據提供存儲和運算平臺,同時數據挖掘和人工智能從大數據中發現知識、規律和趨勢,為決策提供信息參考。大數據的發展將進一步擴大信息的開放程度,隨之而來的隱私數據或敏感信息的泄露事件時有發生。面對大數據發展的新特點、新挑戰,如何保障數據安全是我們需要研究的課題。
1 大數據的特征
大數據通常被認為是一種數據量很大、數據形式多樣化的非結構化數據。隨著對大數據研究的進一步深入,大數據不僅指數據本身的規模,也包括數據采集工具、數據存儲平臺、數據分析系統和數據衍生價值等要素。其主要特點有以下幾點:
1.1數據量大
大數據時代,各種傳感器、移動設備、智能終端和網絡社會等無時無刻不在產生數據,數量級別已經突破TB,發展至PB乃至ZB,統計數據量呈千倍級別上升。據估計,2012年全球產生的數據量將達到2.7ZB,2015年將超過8ZB。
1.2類型多樣
當前大數據不僅僅是數據量的井噴性增長,而且還包含數據類型的多樣化發展。以往數據大都以二維結構呈現,但隨著互聯網、多媒體等技術的快速發展和普及,視頻、音頻、圖片、郵件、HTML,RFID,GPS和傳感器等產生的非結構化數據,每年都以60%速度增長。預計,非結構化數據將占數據總量的80%以上。
1.3運算高效
基于云計算的Hadoop大數據框架,利用集群的威力高速運算和存儲,實現了一個分布式運行系統,以流的形式提供高傳輸率來訪問數據,適應了大數據的應用程序。而且,數據挖掘、語義引擎、可視化分析等技術的發展,可從海量的數據中深度解析,提取信息,掌控數據增值的“加速器”。
1.4產生價值
價值是大數據的終極目的。大數據本身是一個“金礦”,可以從大數據的融合中獲得意想不到的有價值的信息。特別是激烈競爭的商業領域,數據正成為企業的新型資產,企業都在追求數據最大價值化。同時,大數據價值也存在密度低的特性,需要對海量的數據進行挖掘分析才能得到真正有用的信息,形成用戶價值。以監控視頻為例,連續播放的畫面中,可以產生價值信息的數據可能僅僅是一兩秒。
2 大數據面臨的安全挑戰
正如Gartner所說:“大數據安全是一場必要的斗爭。在大數據時代,無處不在的智能終端、互動頻繁的社交網絡和超大容量的數字化存儲,不得不承認大數據已經滲透到各個行業領域,逐漸成為一種生產要素發揮著重要作用,成為未來競爭的至高點。大數據所含信息量較高,雖然相對價值密度較低,但是對它里面所蘊藏的潛在信息,隨著快速處理和分析提取技術的發展,可以快速捕捉到有價值的信息以提供參考決策。然而,大數據掀起新一輪生產率提高和消費者盈余浪潮的同時,隨之而來的是信息安全的挑戰。
2.1網絡化社會使大數據易成為攻擊目標
網絡化社會的形成,為大數據在各個行業領域實現資源共享和數據互通搭建平臺和通道。基于云計算的網絡化社會為大數據提供了一個開放的環境,分布在不同地區的資源可以快速整合,動態配置,實現數據集合的共建共享。而且,網絡訪問便捷化和數據流的形成,為實現資源的快速彈性推送和個性化服務提供基礎。正因為平臺的暴露,使得蘊含著海量數據和潛在價值的大數據更容易吸引黑客的攻擊。也就是說,在開放的網絡化社會,大數據的數據量大且相互關聯,對于攻擊者而言,相對低的成本可以獲得“滾雪球”的收益。近年來在互聯網上發生的用戶賬號的信息失竊等連鎖反應可以看出,大數據更容易吸引黑客,而且一旦遭受攻擊,失竊的數據量也是巨大的。
2.2非結構化數據對大數據存儲提出新要求
在大數據之前,我們通常將數據存儲分為關系型數據庫和文件服務器兩種。而當前大數據洶涌而來,數據類型的千姿百態也使我們措手不及。對于將占數據總量80%以上的非結構化數據,雖然NoSQL數據存儲具有可擴展性和可用性等優點,利于趨勢分析,為大數據存儲提供了初步解決方案,但是NoSQL數據存儲仍存在以下問題:一是相對于嚴格訪問控制和隱私管理的SQL技術,目前NoSQL還無法沿用SQL的模式,而且適應NoSQL的存儲模式并不成熟;二是雖然NoSQL軟件從傳統數據存儲中取得經驗,但NoSQL仍然存在各種漏洞,畢竟它使用的是新代碼;三是由于NoSQL服務器軟件沒有內置足夠的安全,所以客戶端應用程序需要內建安全因素,這又反過來導致產生了諸如身份驗證、授權過程和輸入驗證等大量的安全問題。
2.3技術發展增加了安全風險
隨著計算機網絡技術和人工智能的發展,服務器、防火墻、無線路由等網絡設備和數據挖掘應用系統等技術越來越廣泛,為大數據自動收集效率以及智能動態分析性提供方便。但是,技術發展也增加了大數據的安全風險。一方面,大數據本身的安全防護存在漏洞。雖然云計算對大數據提供了便利,但對大數據的安全控制力度仍然不夠,API(Application Programming Interface,應用程序編程接口)訪問權限控制以及密鑰生成、存儲和管理方面的不足都可能造成數據泄漏。而且大數據本身可以成為一個可持續攻擊的載體,被隱藏在大數據中的惡意軟件和病毒代碼很難被發現,從而達到長久攻擊的目的。另一方面,攻擊的技術提高了。在用數據挖掘和數據分析等大數據技術獲取價值信息的同時,攻擊者也在利用這些大數據技術進行攻擊。
3 大數據安全的應對策略
當然,大數據也為數據安全的發展提供了新機遇。大數據正在為安全分析提供新的可能性,對海量數據的分析有助于更好地跟蹤網絡異常行為,對實時安全和應用數據結合在一起的數據進行預防性分析,可防止詐騙和黑客人侵。網絡攻擊行為總會留下蛛絲馬跡,這些痕跡都以數據的形式隱藏在大數據中,從大數據的存儲、應用和管理等方面層層把關,可以有針對性地應對數據安全威脅。
3.1大數據存儲安全策略
基于云計算架構的大數據,數據的存儲和操作都是以服務的形式提供。目前,大數據的安全存儲采用虛擬化海量存儲技術來存儲數據資源,涉及數據傳輸、隔離、恢復等問題。解決大數據的安全存儲,一是數據加密。在大數據安全服務的設計中,大數據可以按照數據安全存儲的需求,被存儲在數據集的任何存儲空間,通過SSL(Secure Sockets Layer,安全套接層協議層)加密,實現數據集的節點和應用程序之間移動保護大數據。在大數據的傳輸服務過程中,加密為數據流的上傳與下載提供有效的保護。應用隱私保護和外包數據計算,屏蔽網絡攻擊。目前,PGP和TrueCrypt等程序都提供了強大的加密功能。二是分離密鑰和加密數據。使用加密把數據使用與數據保管分離,把密鑰與要保護的數據隔離開。同時,定義產生、存儲、備份、恢復等密鑰管理生命周期。三是使用過濾器。通過過濾器的監控,一旦發現數據離開了用戶的網絡,就自動阻止數據的再次傳輸。四是數據備份。通過系統容災、敏感信息集中管控和數據管理等產品,實現端對端的數據保護,確保大數據損壞情況下有備無患和安全管控。
3.2大數據應用安全策略
隨著大數據應用所需的技術和工具快速發展,大數據應用安全策略主要從以下幾方面著手:一是防止APT(Advanced Persistent Threat,高級持續性威脅)攻擊。借助大數據處理技術,針對APT安全攻擊隱蔽能力強、長期潛伏、攻擊路徑和渠道不確定等特征,設計具備實時檢測能力與事后回溯能力的全流量審計方案,提醒隱藏有病毒的應用程序。二是用戶訪問控制。大數據的跨平臺傳輸應用在一定程度上會帶來內在風險,可以根據大數據的密級程度和用戶需求的不同,將大數據和用戶設定不同的權限等級,并嚴格控制訪問權限。而且,通過單點登錄的統一身份認證與權限控制技術,對用戶訪問進行嚴格的控制,有效地保證大數據應用安全。三是整合工具和流程。通過整合工具和流程,確保大數據應用安全處于大數據系統的頂端。整合點平行于現有的連接的同時,減少通過連接企業或業務線的SIEM工具的輸出到大數據安全倉庫,以防止這些被預處理的數據被暴露算法和溢出加工后的數據集。同時,通過設計一個標準化的數據格式簡化整合過程,同時也可以改善分析算法的持續驗證。四是數據實時分析引擎。數據實時分析引擎融合了云計算、機器學習、語義分析、統計學等多個領域,通過數據實時分析引擎,從大數據中第一時間挖掘出黑客攻擊、非法操作、潛在威脅等各類安全事件,第一時間發出警告響應。
3.3大數據管理安全策略
云計算專家李志霄博士說:“數據安全三分靠技術,七分靠管理。”閻通過技術來保護大數據的安全必然重要,但管理也很關鍵。大數據的管理安全策略主要有:一是規范建設。大數據建設是一項有序的、動態的、可持續發展的系統工程,一套規范的運行機制、建設標準和共享平臺建設至關重要。規范化建設可以促進大數據管理過程的正規有序,實現各級各類信息系統的網絡互連、數據集成、資源共享,在統一的安全規范框架下運行。二是建立以數據為中心的安全系統。基于云計算的大數據存儲在云共享環境中,為了大數據的所有者可以對大數據使用進行控制,可以通過建設一個基于異構數據為中心的安全方法,從系統管理上保證大數據的安全。三是融合創新。大數據是在云計算的基礎上提出的新概念,大數據時代應以智慧創新理念融合大數據與云計算,以智能管道與聚合平臺為基礎,提升數據流量規模、層次及內涵,在大數據流中提升知識價值洞察力。積極創造大數據公司技術融合平臺,尋找數據洪流大潮中新的立足點,特別是在數據挖掘、人工智能、機器學習等新技術的創新應用融合創新。
4 結束語
大數據是信息化時代的“石油”。大數據轉化為信息和知識的速度與能力將成為這個時代的核心競爭力之一,而大數據面臨的安全挑戰卻不容忽視。只有大數據技術和大數據安全“兩條腿”走路時,大數據才可以真正成為這個時代的驅動力量。
核心關注:拓步ERP系統平臺是覆蓋了眾多的業務領域、行業應用,蘊涵了豐富的ERP管理思想,集成了ERP軟件業務管理理念,功能涉及供應鏈、成本、制造、CRM、HR等眾多業務領域的管理,全面涵蓋了企業關注ERP管理系統的核心領域,是眾多中小企業信息化建設首選的ERP管理軟件信賴品牌。
轉載請注明出處:拓步ERP資訊網http://www.vmgcyvh.cn/
本文標題:大數據環境下的數據安全研究