為什么選擇kafka采集數(shù)據(jù)?大數(shù)據(jù)采集層主要可以使用Flume, Kafka兩種技術(shù)。查看全文>>
本地和遠(yuǎn)程模式安裝配置方式大致相同,本質(zhì)上是將Hive默認(rèn)的元數(shù)據(jù)存儲(chǔ)介質(zhì)由自帶的Derby數(shù)據(jù)庫(kù)替換為MySQL數(shù)據(jù)庫(kù),這樣無(wú)論在任何目錄下以任何方式啟動(dòng)Hive,只要連接的是同一臺(tái)Hive服務(wù),那么所有節(jié)點(diǎn)訪問的元數(shù)據(jù)信息是一致的,從而實(shí)現(xiàn)元數(shù)據(jù)的共享。下面就以本地模式為例,講解安裝過程。查看全文>>
任何一種編程語(yǔ)言都有特定的數(shù)據(jù)類型,Scala也不例外。與其他語(yǔ)言相比,Scala中的所有值都有一個(gè)類型,包括數(shù)值和函數(shù)。接下來(lái),通過一張圖來(lái)描述Scala數(shù)據(jù)類型的層次結(jié)構(gòu),具體如圖1所示。查看全文>>
HBase數(shù)據(jù)庫(kù)最常見的操作就是讀寫數(shù)據(jù),接下來(lái),針對(duì)HBase讀寫數(shù)據(jù)的流程進(jìn)行詳細(xì)介紹。查看全文>>
Hadoop集群的安裝和配置完成之后。并不能直接啟動(dòng)集群,因?yàn)樵诔醮螁?dòng)HDFS集群時(shí),必須對(duì)主節(jié)點(diǎn)進(jìn)行格式化處理,具體指令如下。查看全文>>
大數(shù)據(jù)不斷向世界的各行各業(yè)滲透,影響著我們的衣食住行。例如,網(wǎng)上購(gòu)物時(shí),經(jīng)常會(huì)發(fā)現(xiàn)電子商務(wù)門戶網(wǎng)站向我們推薦商品,往往這類商品都是我們最近需要的。查看全文>>