<button id="crlzx"></button>
      1. 財經 房產 娛樂 地方 美食
        首頁 » 科技

        大數據是什么意思?大數據會監視個人隱私嗎?

        2022-12-16 16:40:46 中網
        A+ A-

        大數據,不僅僅是數據量大,同時在其他方面,也有一定的特點。

        之一,大數據數據體量非常大,傳統的單機存儲系統,已經無法在存儲這么大量的數據,此時需要用到分布式存儲技術。

        第二,大數據的數據種類非常多,數據的格式也會變得復雜,比如數據種類有視頻、文檔、圖片、消息記錄等等。

        第三,大數據中潛藏著非常重要的價值,通過數據分析技術,對商業決策做出智能化以及數據化的支持。

        大數據最主要的功能,就是為公司上層提供商業化決策支持,讓公司能夠結合歷史數據,往正確的方向發展。大數據技術主要分為兩類:大數據計算和大數據存儲。

        大數據計算主要分為離線計算和實時計算,具體使用要看業務場景對于數據產出時延的要求

        離線計算對于數據的產出會有一定的時延,具體時延可以是15分鐘、小時或者天級別的。離線任務一般會對數據進行全局批計算,這一次運行完就運行完了,不會像實時計算那樣,除非你自己停止實時任務,否則實時程序會一直運行。

        實時計算數據是不斷產生的,一般數據產出的延遲會很低,最多是秒級別的。比如我們的數據大屏、實時數據流的加工處理等,這些場景對于數據的產出的時延要求很低。

        離線計算的話,一般對于數據的產出時延沒有那么高的要求,只要數據最終產出即可,具體使用像現在很多公司離線業務報表。目前大多數公司離線計算引擎使用的是Hive或者Spark,實時計算引擎目前主要是Flink。

        大數據存儲需要數據分布式存儲,單機不能夠在存儲這么多巨量數據

        在傳統的關系型數據庫中,當一個表非常大時,會使用分庫分表技術,將表分布式的存儲在不同的機器上面。分庫分表技術可以使用開源工具TDDL。

        在非關系型NoSQL數據庫中,一般更底層的文件存儲系統可以選擇HDFS。HDFS文件系統將文件按照塊來進行存儲,一個塊的大小為128兆,同時每個塊會存儲三份,對數據進行容災存儲,即使其中一個塊壞了,可以選擇其他塊進行數據恢復。

        分布式數據庫系統可以對數據表進行水平分割和垂直分割。比如HBase數據庫,水平分割使用的是Region,垂直分割則是使用的列族。

        分布式數據存儲技術,需要不同機器一起協同工作,每臺機器存儲整體數據的一個子集。在未來大數據時代,肯定都會使用分布式數據存儲,分布式數據庫,會成為大數據系統的標配。

        責任編輯:bH_05349

        關鍵詞: 大數據是什么意思 大數據能精確到什么程度 大數據定位精確到多大范圍 大數據會監視個人隱私嗎

        點擊查看全文(剩余0%)

        相關新聞

        中文版A片在线观看

          <button id="crlzx"></button>