Scala是Scalable Language的簡稱,它是一門多范式的編程語言,其設計初衷是實現可伸縮的語言、并集成面向對象編程和函數式編程的各種特性。查看全文>>
大多數的Scala開發(fā)程序員都會選擇IDEA作為開發(fā)Scala的工具。接下來,以Window操作系統(tǒng)為例,分步驟講解如何在IDEA工具上下載安裝Scala插件,具體步驟如下:查看全文>>
HBase是一個高可靠性、高性能、面向列、可伸縮的分布式數據庫,它起源于2006年Google發(fā)表的BigTable論文。在2008年,PowerSet的Chad Walters和Jim Keller受到了該論文思想的啟發(fā),從而把HBase作為Hadoop的子項目來進行開發(fā)維護,用于支持結構化的海量數據存儲。查看全文>>
Sqoop是Apache旗下的一款開源工具,該項目開始于2009年,最早是作為Hadoop的一個第三方模塊存在,后來為了讓使用者能夠快速部署,也為了讓開發(fā)人員能夠更快速的迭代開發(fā),并在2013年,獨立成為Apache的一個頂級開源項目。查看全文>>
想要通過外部UI界面訪問虛擬機服務,還需要對外開放配置Hadoop集群服務端口號。為了后續(xù)學習方便,就直接將所有集群節(jié)點防火墻進行關閉即可,具體操作如下。查看全文>>
MapReduce的核心思想是“分而治之”。所謂“分而治之”就是把一個復雜的問題,按照一定的“分解”方法分為等價的規(guī)模較小的若干部分,然后逐個解決,分別找出各部分的結果,把各部分的結果組成整個問題的結果,這種思想來源于日常生活與工作時的經驗,同樣也完全適合技術領域。查看全文>>