亚洲精品中文免费|亚洲日韩中文字幕制服|久久精品亚洲免费|一本之道久久免费

      
      

            <dl id="hur0q"><div id="hur0q"></div></dl>

                「大數(shù)據(jù)」 Hive 入門 以及Handoop 系統(tǒng)認知

                「大數(shù)據(jù)」 Hive 入門 以及Handoop 系統(tǒng)認知

                前言

                本文主要介紹Hive 的基礎概念,以及Handoop的大體架構,組件依賴,對于大數(shù)據(jù)有個總體的認識

                Hive 基礎概念

                官網(wǎng):https://hive.apache.org/

                The Apache Hive data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL. Structure can be projected onto data already in storage. A command line tool and JDBC driver are provided to connect users to Hive.

                Apache Hive 數(shù)據(jù)倉庫軟件支持使用SQL讀取、寫入和管理分布存儲中的大型數(shù)據(jù)集。結構可以映射到存儲中的數(shù)據(jù)。提供了一個命令行工具和JDBC驅動程序來將用戶連接到Hive。

                Hive的 特點:

                • Hive是一個構建于Hadoop頂層的數(shù)據(jù)倉庫工具,可以查詢和管理PB級別的分布式數(shù)據(jù)。
                • 支持大規(guī)模數(shù)據(jù)存儲、分析,具有良好的可擴展性
                • 某種程度上可以看作是用戶編程接口,本身不存儲和處理數(shù)據(jù)。
                • 依賴分布式文件系統(tǒng)HDFS存儲數(shù)據(jù)。
                • 依賴分布式并行計算模型MapReduce處理數(shù)據(jù)。
                • 定義了簡單的類似SQL 的查詢語言——HiveQL。
                • 用戶可以通過編寫的HiveQL語句運行MapReduce任務。
                • 可以很容易把原來構建在關系數(shù)據(jù)庫上的數(shù)據(jù)倉庫應用程序移植到Hadoop平臺上。
                • 是一個可以提供有效、合理、直觀組織和使用數(shù)據(jù)的分析工具。

                Hive應用場景:

              1. 數(shù)據(jù)挖掘:用戶行為分析;興趣分區(qū);區(qū)域展示;
              2. 非實時分析:日志分析;文本分析。
              3. 數(shù)據(jù)匯總:每天/每周用戶點擊數(shù),流量統(tǒng)計。
              4. 數(shù)據(jù)倉庫:數(shù)據(jù)抽取,加載,轉換(ETL)。
              5. 思考: Hive 其實不是一個數(shù)據(jù)庫或者數(shù)據(jù)存儲系統(tǒng),而且是一個數(shù)據(jù)工具,主要是將SQL語句轉化為MapReduce任務執(zhí)行。

                Hive 的結構

                該組件圖包含不同的單元。下表描述每個單元:

                Hive的工作原理

                下表定義Hive和Hadoop框架的交互方式:

                Handoop 的結構

                (1)Pig是一個基于Hadoop的大規(guī)模數(shù)據(jù)分析平臺,Pig為復雜的海量數(shù)據(jù)并行計算提供了一個簡單的操作和編程接口; (2)Hive是基于Hadoop的一個工具,提供完整的SQL查詢,可以將sql語句轉換為MapReduce任務進行運行; (3)ZooKeeper:高效的,可拓展的協(xié)調系統(tǒng),存儲和協(xié)調關鍵共享狀態(tài); (4)HBase是一個開源的,基于列存儲模型的分布式數(shù)據(jù)庫; (5)HDFS是一個分布式文件系統(tǒng),有著高容錯性的特點,適合那些超大數(shù)據(jù)集的應用程序; (6)MapReduce是一種編程模型,用于大規(guī)模數(shù)據(jù)集(大于1TB)的并行運算。

                Handoop 集群部署

                Handoop 組件依賴關系

                Handoop的核心

                參考資料:

                https://blog.csdn.net/zl834205311/article/details/80334346

                https://www.cnblogs.com/tieandxiao/p/8799287.html

                https://www.yiibai.com/hive

                https://www.jianshu.com/p/d68272609bf8

                鄭重聲明:本文內容及圖片均整理自互聯(lián)網(wǎng),不代表本站立場,版權歸原作者所有,如有侵權請聯(lián)系管理員(admin#wlmqw.com)刪除。
                用戶投稿
                上一篇 2022年7月28日 18:09
                下一篇 2022年7月28日 18:09

                相關推薦

                • ios手游模擬器(手游模擬器ios)

                  本文主要講的是ios手游模擬器,以及和手游模擬器ios相關的知識,如果覺得本文對您有所幫助,不要忘了將本文分享給朋友。 哪個iOS模擬器能多開手游賬號?可以推薦個好用的模擬器給我嗎…

                  2022年11月27日
                • 短視頻策劃內容的3個要點(短視頻策劃內容怎么做)

                  短視頻在制作時,內容框架非常重要。如果直奔主題,然后結束,聚卓告訴你,這樣的短視頻已經(jīng)過時了。現(xiàn)在的短視頻需要框架的,但不是任何框架,它需要一種易于理解和消化的框架。而且,現(xiàn)在大多…

                  2022年11月27日
                • 美團第三季度實現(xiàn)營收626億元,即時配送訂單量增至50億筆

                  新京報訊(記者秦勝南)11月25日,美團發(fā)布業(yè)績公告顯示,第三季度營收為626億元,較去年同比增長28.2%,凈利潤為12.2億元。第三季度,美團即時配送訂單數(shù)增長至50億筆。截至…

                  2022年11月27日
                • 個人怎么做抖音帶貨(個人做抖音帶貨能賺錢嗎)

                  抖音如今是大家很熟悉的短視頻平臺,不過現(xiàn)在的抖音卻不只是短視頻那么簡單,它的功能非常豐富,其中一個就是可以帶貨,相信很多小伙伴都有在抖音上買過東西,抖音如今的變現(xiàn)能力也是不容小覷的…

                  2022年11月25日
                • 抖音帶貨怎么做入門(抖音帶貨怎么做入門教學)

                  相信很多小伙伴都有注意到,現(xiàn)在抖音已經(jīng)成為大家最常光顧的一個平臺了,作為一個日活破億的流量池,如今抖音上的用戶數(shù)量極大。因此,現(xiàn)在在抖音上帶貨、賣貨的人也是越來越多了,那么想在抖音…

                  2022年11月25日
                • 小紅書平臺的一些機制及玩法詳解(小紅書玩法有哪些)

                  關于小紅書 一:小紅書平臺的一些機制 1. 筆記內容的CES評分機制 2. 筆記流量入口與長尾效應 二:小紅書優(yōu)質筆記的特點(分維度、類型分析) 1.筆記的本身架構組成 維度 2.…

                  2022年11月25日
                • 什么是推廣cpa一篇文章帶你看懂CPA推廣渠道

                  CPA渠道 CPA指的是按照指定的行為結算,可以是搜索,可以是注冊,可以是激活,可以是搜索下載激活,可以是綁卡,實名認證,可以是付費,可以是瀏覽等等。甲乙雙方可以根據(jù)自己的情況來定…

                  2022年11月25日
                • 百度關鍵詞快速排名的4大原理解析(百度怎么刷關鍵詞)

                  近期百度公告驚雷算法2.0,升級之快還是第一次吧,看來百度對于刷點擊行為是零容忍了。之前尹華峰SEO技術博客介紹過一篇如何使用刷點擊工具,其實市面上有很多這類SEO快速排名的軟件,…

                  2022年11月25日
                • 抖音直播帶貨有哪些方法技巧(抖音直播帶貨有哪些痛點)

                  如今抖音這個短視頻的變現(xiàn)能力越來越突顯了,尤其是在平臺上開通直播,更具有超強的帶貨屬性,已經(jīng)有越來越多的普通人加入到其中了。不過直播帶貨雖然很火,但是也不是每個人都能做好的,那么在…

                  2022年11月24日
                • 抖音世界杯投屏怎么弄 抖音看世界杯怎么看能投屏嗎

                  抖音作為短視頻平臺第一次進軍世界杯直播,小編還是很期待的,畢竟每天沒事的時候都會刷一下抖音,看直播的話也是方便了不少,那抖音看世界杯可以投屏嗎?下面一起來了解一下。 抖音世界杯投屏…

                  2022年11月24日

                聯(lián)系我們

                聯(lián)系郵箱:admin#wlmqw.com
                工作時間:周一至周五,10:30-18:30,節(jié)假日休息