
不久前我們推出的《推薦演算法不夠精準?讓知識圖譜來解決》以及《如何將知識圖譜特徵學習應用到推薦系統?》系列文章受到了同學們的廣泛歡迎。大家對推薦系統以及與之相關的、底層的數據挖掘技術非常關注。
為了幫助小夥伴們更好地學習相關內容,我們邀請微軟亞洲研究院社會計算組研究員張富崢為大家推薦了六本數據挖掘領域的經典書籍,既涵蓋了數據挖掘的概念、演算法等基礎知識,又包含了數據挖掘在不同子領域的具體應用。一起來看看吧!
一、基礎篇
主要目標:幫助大家了解數據挖掘領域的基本概念、代表性演算法和評估技術,比如數據的關聯分析、分類及聚類演算法等,為大家之後進一步學習數據挖掘知識、深入進行科研或在實際場景中應用奠定基礎。
1. Introduction to Data Mining
作者:Pang-Ning Tang、Michael Steinbach、Vipin Kumar
中文譯名:數據挖掘導論(完整版)
推薦指數:★★★★★

主要內容:本書內容涵蓋了數據挖掘的方方面面,從什麼是數據挖掘、什麼是數據以及數據預處理的方法,到具體的數據挖掘演算法,比如分類、關聯分析、聚類、異常檢測等,從基本的定義入手,由淺至深地幫助讀者透徹地理解數據挖掘的基礎。書中使用大量的圖表、綜合示例、關鍵演算法的簡潔描述等,儘可能地直接聚焦於數據挖掘的主要概念。
推薦理由:本書是明尼蘇達大學和密歇根州立大學數據挖掘課程的教材,是數據挖掘領域經典的入門教程。本書內容淺顯易懂,只要求具備很少的統計學或數學背景知識,略去了各個定理的證明部分,通過枚舉大量具體的演算法實例來簡要說明演算法的流程和意義,讓初學者可以以最快速度總攬全局,掌握數據挖掘領域的基本要點。
2. Data Mining: Concepts and Techniques
作者:Jiawei Han、Micheline Kamber、Jian Pei
中文譯名:數據挖掘:概念與技術(原書第三版)

主要內容:本書是最新的第三版,主要從資料庫角度全面系統地介紹了數據挖掘的基本概念、方法、技術以及技術的研究進展,並且重點關注了數據挖掘領域最新的技術和發展,介紹了社會網路挖掘、流數據挖掘和數據立方體計算等最新的研究方法,並探討了數據挖掘方法在金融等領域的應用。書中引入了許多演算法和實現實例,以易於理解的偽代碼編寫,適用於實際的大規模數據挖掘項目。
推薦理由:本書是一本非常優秀的數據挖掘教材,更是數據挖掘領域具有里程碑意義的經典著作。它不僅詳盡講述了數據挖掘的基本概念和方法,又具有一定的深度,介紹了數據挖掘領域近年來最新的課題。它結構合理、調理清晰,每一章都針對關鍵專題有單獨的指導,並且只要求讀者具備少量的編程經驗以及了解基本的數據和統計分析方向的知識。
二、 應用篇
主要目標: 在大數據時代,數據的形式多種多樣,在不同科研領域、商業背景、產業類型中的應用也十分豐富。這裡我們通過四本書來為大家介紹數據挖掘的方法和思想在三個不同的子領域中的具體應用,幫助大家了解數據挖掘領域最前沿的熱門研究方向和應用場景,為大家把握科研或工程的方向提供參考。
1. Recommender Systems: An introduction
作者:Dietmar Jannach、Markus Zanker、Alexander Felfernig、Gerhard Friedrich
中文譯名:推薦系統
推薦指數:★★★★★

主要內容:本書比較全面地介紹了推薦系統涉及的相關知識點,呈現了許多經典演算法,並討論了如何衡量推薦系統的有效性。書中內容分為基本概念和最新進展兩部分:前者涉及協同推薦、基於內容的推薦、基於知識的推薦、混合推薦方法,推薦系統的解釋、評估推薦系統和實例分析;後者包括針對推薦系統的攻擊、在線消費決策、推薦系統和下一代互聯網以及普適環境中的推薦。
推薦理由:本書內容詳盡,廣泛涵蓋了不同類型的推薦系統,並對這些推薦系統逐一進行了細緻地剖析,並輔以實際應用案例的介紹,適合想要了解推薦系統的基礎和相關研究的讀者作為推薦系統的入門書籍。書中包含了大量的圖、表以及示例,有助於讀者理解和把握相關知識。
2. Recommender Systems: The Textbook
作者:Charu C. Aggarwal
推薦指數:★★★★☆

主要內容:本書詳盡地介紹了推薦系統的方方面面,可以大致地被分為三個部分:「演算法和評估」部分探討了推薦系統中的基礎演算法,包括協同過濾的方法、基於內容的方法、基於知識的方法、集成方法以及推薦系統的評估方法;「特定領域和上下文下的推薦系統」部分介紹在如時間空間數據、社交數據、標籤數據以及信用度數據等不同的上下文場景數據中如何進行推薦;「高級的主題和應用」部分介紹了和推薦系統的魯棒性相關的內容,如先令系統、攻擊模型以及相應的防禦模型。
推薦理由:這是一本非常優秀的推薦系統教科書,它不僅用簡單的語言闡述了推薦系統的基礎,深入地介紹了核心演算法的概念以及數學論證,還為讀者提供了第三方工具或框架使用時需要查詢的大量資料。它對於推薦系統的基礎、具體應用和相關文獻進行了全面介紹,既適合研究人員作為推薦系統的入門書籍,又適合工業從業人員作為工具參考書。
3. Sentiment Analysis: Mining Opinions, Sentiments,and Emotions
作者:Bing Liu
中文譯名:情感分析:挖掘觀點、情感和情緒

主要內容:本書主要從自然語言處理的角度全面地介紹情感分析這個主題中的基礎演算法以及先進的研究技術和科研結果。書中幾乎涵蓋了情感分析所有的核心領域,在介紹了情感分析的基本概念和多種基本的情感分析場景後,又解讀了多個新興的情感分析主題,比如辯論分析、意圖挖掘、假民意檢測等,不僅能夠讓讀者了解通常用於表達觀點和情感的問題和語言的基本結構,還能幫助讀者深入地探究大量觀點挖掘和情感分析的演算法和系統。
推薦理由:本書是迄今為止觀點挖掘與情感分析領域最權威、最全面的著作之一。書中幾乎涵蓋了情感分析的方方面面,將理論和實踐相結合,深入淺出,同時兼顧了領域知識的深度和廣度,不僅可以作為剛接觸這一領域的學者或開發者的入門教材,又可以作為了解這一領域最前沿研究成果的經典讀物。
4. 移動數據挖掘
作者:連德富、張富崢、王英子、袁晶、謝幸

主要內容:本書選取當前學術界和工業界的熱點為主題,自成體系,書中以人的軌跡數據,特別是移動社交網路的位置數據為中心,結合人的基本信息及社交網路等相關信息來研究個人與群體的移動模式特性,介紹了移動數據挖掘的基本概念和方法,具體包括移動數據預處理、用戶移動模型、用戶畫像以及興趣位置推薦等,內容十分新穎。
推薦理由:本書是大數據管理叢書中的一本,書中梳理總結了作者團隊過去十年在人群移動數據理解上展開的研究,這些研究經驗不僅對於很多實際應用有著重要的價值,也有助於解決一些具有社會意義的科學問題。本書在介紹了移動數據的概念及其價值的同時,還細緻地講解了移動數據領域內的多個前沿研究課題,對於想要深入了解這個領域的學者和工業從業人員是非常好的選擇。
看完了書單,還不趕緊挑選幾本!
歡迎大家在下方留言區留言,分享你心目中數據挖掘的經典書籍。
你還需要哪個領域的書單呢?也歡迎在留言區告訴我們!
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/222996.html
微信掃一掃
支付寶掃一掃