學習大數據並不是一蹴而就的事情,即使是工作多年的開發工程師都需要不斷補充新鮮的知識內容。目前學習大數據知識可以通過視頻和圖書兩種方式學習,視頻的優勢在於能夠將老師的個人開發經驗傳授給學習者,而圖書的優勢在於能夠隨時翻閱,內容比較豐富。
這裡為大家推薦零基礎學習大數據的10本經典圖書,希望同學們能夠通過不同的學習途徑充分掌握大數據開發技能。
大數據學習10本經典圖書推薦
1、《大數據時代》
《大數據時代》是國外大數據系統研究的先河之作,本書作者維克托·邁爾·舍恩伯格被譽為「大數據商業應用一人」,擁有在哈佛大學、牛津大學、耶魯大學和新加坡國立大學等多個互聯網研究重鎮任教的經歷,早在2010年就在《經濟學人》上發佈了長達14頁對大數據應用的前瞻性研究。《大數據時代》認為大數據的核心就是預測。大數據將為人類的生活創造前所未有的可量化的維度。書中展示了谷歌、微軟、IBM、蘋果、facebook、twitter、VISA等大數據先鋒們具價值的應用案例。作者圍繞「要全體不要抽樣、要效率不要絕對精確、要相關不要因果」三大理念,通過數十個商業和學術案例,剖析了萬事萬物數據化和數據復用挖掘的巨大價值。
2、《一本書讀懂大數據》
進入大數據時代,讓數據開口說話將成為司空見慣的事情,本書將從大數據時代的前因後果講起,全面分析大數據時代的特徵、企業實踐的案例、大數據的發展方向、未來的機遇和挑戰等內容,展現一個客觀立體、自由開放的大數據時代。
3、《Hadoop權威指南》
Hadoop是大數據技術中的核心內容之一。本書內容豐富,展示了如何使用Hadoop構建可靠、可伸縮的分佈式系統,程序員可從中探索如何分析海量數據集,管理員可以了解如何建立與運行Hadoop集群。
4、《Hive編程指南》
Hive是基於Hadoop的一個數據倉庫工具。一本ApacheHive的編程指南,旨在介紹如何使用Hive的SQL方法,通過大量的實例,首先介紹如何在用戶環境下安裝和配置Hive,並對Hadoop和MapReduce進行詳盡闡述,演示Hive如何在Hadoop生態系統進行工作。
5、《HBase權威指南》
HBase是一個分佈式的面向列的開源數據庫。如何通過使用與HBase高度集成的Hadoop將HBase的可伸縮性變得簡單;把大型數據集分佈到相對廉價的商業服務器集群中;了解HBase架構的細節,包括存儲格式、預寫日誌、後台進程等;在HBase中集成MapReduce框架;了解如何調節集群、設計模式、拷貝表、導入批量數據和刪除節點等。
6、《Flink入門與實戰》
Flink是一款開源處流處理框架,其河西是Java和Scala編程的分佈式流數據流引擎。這是一本Flink入門級圖書,力求詳細而完整地描述Flink基礎理論與實際操作,旨在幫助讀者從零開始快速掌握Flink的基本原理與核心功能。
7、《Kafka入門與實踐》
Kafka是一種高吞吐量的分佈式發佈訂閱消息系統,它可以處理消費者在網站中的所有動作流數據。本書是基於Kafka 0.10.1.1版本,深入剖析Kafka源碼與框架。書中的大量實例來源於作者在實際工作中的實踐,具有現實指導意義。
8、《Spark快速大數據分析》
這是一本為Spark 初學者準備的書,它沒有過多深入實現細節,而是更多關註上層用戶的具體用法。不過,本書絕不僅僅限於Spark 的用法,它對Spark 的核心概念和基本原理也有較為全面的介紹,讓讀者能夠知其然且知其所以然。
9、《大數據技術全解:基礎、設計、開發與實踐》
可以作為計算機軟件專業的本科生和研究生的大數據技術教材,也可作為大數據技術開發培訓、大數據系統諮詢規劃培訓的教材,更是大數據領域內一線的需求分析人員、系統分析人員、高級開發人員和開發管理人員的必備參考書。重點不在於對大數據技術的原理性介紹,而是從實戰角度出發,系統地闡述如何基於hadoop開源軟件為客戶設計、安裝和開發一個大數據系統。《大數據技術全解:基礎、設計、開發與實踐》還着重分享了具體實踐中的一些案例,不僅對於從事大數據系統開發的it技術人員具有珍貴的參考價值,而且對準備實施大數據系統項目的企業級客戶也具有指導作用。
10、《大數據項目實戰》
本書定位在實戰系統學習大數據技術實現,是有傳智播客教育黑馬程序員系統編撰。本書旨在令讀者具備Hadoop生態系統的分析能力,並能夠構建強大的解決方案來執行大數據分析,同時毫不費力地從大數據分析結果中獲得敏銳的洞察力。本書涉及Java語言、Hadoop、Hive、Sqoop的綜合運用,同時實現了大數據分析的可視化結果。本書適合Hadoop的初學者閱讀,也可以作為高等院校相關課程的教學參考書。讀者不僅能夠通過項目實戰鞏固基礎知識的學習效果,還能學習商業智能系統的開發過程。全書共分為6章,分別是項目概述、搭建大數據集群環境、數據採集、數據預處理、數據分析與數據可視化。
以上10本書基本覆蓋了目前大數據領域的大部分的常用技術,無論是對於零基礎入門大數據,還是初級大數據開發工程師都是非常有用的。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/268593.html
微信掃一掃
支付寶掃一掃