第一图书网

集体智慧编程

西格兰 东南大学出版社
出版时间:

2008-3-1  

出版社:

东南大学出版社  

作者:

西格兰  

页数:

334  

字数:

378000  

Tag标签:

无  

内容概要

想要探寻搜索排名、产品推荐、社会化书签和在线匹配背后的力量吗?这本颇具魅力的书籍向你展现如何创建Web 2.0应用程序,从参与性?Internet应用程序产生的大量数据中挖掘金矿。运用本书中介绍的先进算法,你可以编写聪明的程序,以访问其他网站那些有趣的数据集,从自有应用程序的用户中收集数据,或者分析和理解你所发现的数据。  《集体智慧编程》将你带入机器学习和统计的世界,并且阐释了如何从你和他人每天收集的信息中获得关于用户体验、市场营销、个性品味及人类行为的结论。每个算法的描述都十分简明清晰,相关代码均可以立即用于你的网站、博客、Wiki或特定应用程序。本书讲解了下列主题:  可以让在线零售商推荐产品或媒体的协作过滤技术  用于在大数据集中发现同类项组的聚类方法  从数以百万计可能方案中选择问题最佳解决方案的最优化算法  贝叶斯过滤,用在基于单词类型和其他特征的垃圾信息过滤中  支持向量(support-vector)机器,用于在线交友网站中的速配  用于问题解决的演化智能——计算机如何通过多次玩同样的游戏,改进自身代码并获得技能提升  每一章都包含了相关练习,可通过扩展使算法变得更强大。超越简单的数据库支持应用程序模式,让 Internet数据财富为你所用。

书籍目录

ForewordPreface1. Introduction to Collective Intelligence What Is Collective Intelligence? What Is Machine Learning? Limits of Machine Learning Real-Life Examples Other Uses for Learning Algorithms2. Making Recommendations Collaborative Filtering Collecting Preferences Finding Similar Users Recommending Items  Matching Products  Building a del.icio.us Link Recommender Item-Based Filtering Using the MovieLens Dataset User-Based or Item-Based Filtering? Exercises 3. Discovering Groups 4. Searching and Ranking5. Optimization 6. Document Filtering 7. Modeling with Decision Trees 8. Building Price Models 9. Advanced Classification: Kernel Methods and SVMs 10. Finding Independent Features 11. Evolving Intelligence 12. Algorithm Summary


编辑推荐

  “好极了!我无法想象会有更好的方式来开始学习这些算法和方法,也没有更好的方式能让我(一个人工智能老家伙)头脑中关于它们的细节知识迅速复苏。”  “Toby的书非常成功地将复杂的机器学习算法问题分解为现实而易理解的例子,可直接用于分析当前Web上的社会化交互行为。如果我在两年前拥有这《集体智慧编程(影印版)》,一定会省下大把浪费在迷途歧路上的宝贵时间”。

图书封面

图书标签Tags

广告

下载页面


集体智慧编程 PDF格式下载



事实上,这些常用的智能算法基本上都是从工程应用中被发明并得到发展的,基本上都没有非常严格的数学理论基础。我个人还是比较了解这些算法的,而且有不少工科的同学也了解而且平常科研也用过,并没有感觉到需要深厚的数学基础。不过就我了解的情况,好像这些方法在国内IT开发领域使用得并不太多吧(从我找工作多次面试中交谈时感觉到的,面试官大都知道这些方法但也不太熟悉),好像只是高校里面做些科研或工程项目在使用。仅知道有位在土豆网的师兄说有用到,他以前学这个的时候也没觉得有多大用处似的。有兴趣的可以去google看一下http://books.google.com/books?id=fEsZ3Ey-Hq4C&printsec=frontcover&dq=collective+intelligence&ei=QvyESouoIYLckATK4ICCCg#v=onepage&q=&f=falsePS:这本是英文版本的哦


算法实现清晰易懂,一周就可以过一遍。算法思路可以用到各处。


这本书也是朋友推荐的,相当不错,还是英文的,喜欢编程的朋友一定要看一下.
希望中文版早点到货,呵呵,英文毕竟看起来有点累.


很多python代码


没学过python 也不知道他这东西都是在哪个平台弄的,windows还是linux 弄的我自己做的时候没一个项目成功的,,现在放下了,,看到第二章项目没弄好,就放下了,,以后再看吧


挺好的,一部外文图书,对业内研究人员很有帮助-----


很基本的书适合入门


有空仔细读一读


当当这次真的很不错。


很不错的一本书哦,推荐大家一看


之前看过中文版,感觉内容很好,很系统,是一本好书,是研究个性化推荐人员的不可多得的一本参考书。想买本英文版的看看。美中不足是,书的边缘又被挤压变形了,和上次在当当买的“c primer plus”一样,又是"九成新"......


  看此书之前的想法:
   好似很多人推荐此书入门。我对入门书籍的看法是能够快速地让读者感受到idea,给读者一副地图,指导读者之后的方向选择。所以我猜想这本书就是以web上通俗易懂的方法介绍machine learning algorithms.而我读这本书的目的就是想了解一下machine learning, 方便毕业论文。
  
  现在看这本书的感受:
   有一种刷新读书观的感觉,every step with some mathematics is not discussed!!! 通过介绍一些朴素至极的idea,然后用python给出code,结合一个API演示一下。看着代码,脑子里还需要还原成数学公式,再想这些数学公式的含义,参数的含义。我想这就是大部分人阅读此书的过程。所以我现在放弃此书,我认为这样的学习成本过高,看了code之后,不会对公式有更多的理解,也不会对这些算法有更多的理解,一本书读完对算法的认识还是相当朴素。但我觉得可以收获到的就是对数据处理的一个流程的把握,这当然也是入门者需要的。
   所以我觉得这本书应该这样用:了解machine learning 算法之后,用python 实现一遍,以本书为实验指导。这样即锻炼了编程能力也对之前学习过的算法印象更深了。


  机器学习经典书籍
  
   http://suanfazu.com/discussion/109/
  
  
  作者Toby Segaran也是《BeautifulData : The Stories Behind Elegant Data Solutions》(《数据之美:解密优雅数据解决方案背后的故事》)的作者。这本书最大的优势就是里面没有理论推导和复杂的数学公式,是很不错的入门书。目前中文版已经脱销,对于有志于这个领域的人来说,英文的pdf是个不错的选择,因为后面有很多经典书的翻译都较差,只能看英文版,不如从这个入手。还有,这本书适合于快速看完,因为据评论,看完一些经典的带有数学推导的书后会发现这本书什么都没讲,只是举了很多例子而已。


  最近对推荐系统比较感兴趣,所以在同时看这本书和《推荐系统实践》。这本书总的来讲相当不错。但是因为书中的程序都是Python写的,所以不懂Python的建议找个快速入门的教程看一下,这样可以事半功倍。推荐《简明 Python 教程》,地址:http://sebug.net/paper/python/,这个教程最多花你一天的时间,但是看完之后可以对Python有的大体的了解,之后可以更好的看本书的程序。另外,建议实现书中程序时使用Python2.7,不要使用Python3的版本。因为两个版本有区别,会给你添很多的麻烦,会让你浪费时间花在版本差别的,而且后期用到的SQLite数据库现在还不支持Python3。我觉得应该带着学习算法思想的目的去看本书,所以不要在版本上花费太多的时间。有网友总结了在实现程序时Python版本不同会存在的问题。网址: http://blog.sciencenet.cn/blog-791354-689554.html。现在刚看完 优化 这一章,讲的真好。尤其是模拟退火算法和遗传算法。
  总结一些:这是本好书,如果你对相关的东西感兴趣,看了之后绝对不后悔。


  读完这本书,真的很是受益匪浅!作者没有用一个公式就把数据挖掘领域常用的算法给大家讲解清楚了!真的很是受益匪浅!如果你会Python语言就更好了!而且强烈建议大家去读英文原版,中文翻译会丢失原著的一些东西!


  这是一本很适合对各种机器学习知识进行了解的入门读物,涵盖了较为全面的机器学习方法。全书翻译得不错,但是到处都是须要,真是需要,须要,傻傻分不清楚啊,看着有点别扭的感觉,不过没办法,还是得感谢译者,这只能怪自己的英文水平太低咯~


   刚看了collective intelligence没多久,里面讲解了很多实用的东西。很多例子自己也动手写了一遍,感觉收获不少。第四章讲搜索引擎。原来上过udacity的公开课,里面cs101也是讲用python写一个搜索引擎,但后者没有前者叙述的全面。作为了解搜索引擎的原理,基本算法,第四章的讲解还是很不错的。
   第五章讲述随机优化。可是在代码里发现了不少错误,还好在中文版都得到了纠正。看来译者是比较仔细的。建议把两个版本结合来看,英文版用来理解,中文版看代码。


    这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。   这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
    
    不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
    
    数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
    
    集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。


  记得第一次读这本书的时候,是刚毕业在第一家小公司工作,虽然当时只是做Web,但是作为十人团队中少有的还有那么点数学基础的人,无可避免地把一些简单的非工程化的东西接了过来。当时有一个小任务是来做喜欢xxx的人也喜欢xxx,老大就把这本集体智慧编程扔给了我,说看这本书,然后看看能不能把这个做出来,当时我还不知道这门“蹩脚”的语言叫做Python,不过感谢有了这本书,我知道了什么叫Item-based,虽然之后又忘记了。接下来我便顺着半懂不懂地读完了这本书,“知道”了SVM,"知道"了协同过滤,然后便自认为懂了算法。以至于在今后的几年,每当有人希望学习下数据挖掘,我便向他们推荐这本书。
  
  再到几年后,我自己真的置身到了算法领域。前几天看PRML看到SVM的知识,看的有些迷迷糊糊,于是便回头翻了一下许久不动的《集体智慧编程》,我做的是从第一页开始不停地往后翻,发现对我理解算法几乎没有任何的帮助,因为发现这本书其实什么都没有讲。
  
  回到说这本书本身,其实这本书最大的优势便是书中没有理论推导,没有复杂的数学公式,例如在讲SVM的时候,他讲到的我们做SVM的目的就是要需要找到超平面,至于非线性可分的数据来说,我们需要的是把低维数据升至高维,然后便可线性可分了,而对照PRML这种把SVM讲了整整三四章的书来说,知识之浅显就可见一斑了;甚至不用和PRML来比较,就算是对比斯坦福的机器学习公开课来说,其深入程度都不如一堂课的内容了。
  
  这本书在我看来适合的三个人群:A. 刚刚具有基础编程知识的学生 B. 如我刚毕业的情况,不是希望进入数据挖掘领域,只是要急着做完一个项目 C. 大多数的产品经理。
  
  最后说数学公式,大多数人对这本书的赞誉莫过于本书没有复杂难懂的数学公式,Talk is cheap , Show me the code,是被很多程序员尊为“圣经”的一句话,其实对于数据挖掘理论恰恰却是Code is cheap , Show me the method。然后数学作为一种奇妙的语言,可以把很多晦涩的理论通过一些巧妙的数学符号给表示出来,而代码往往做的是把这些优美的数学公式用if , for给打乱。正如我之前一次所说,把数学公式反映成代码非常简单,但是把代码给还原成数学公式简直就是让人抓狂的事情。所以我以前尝试过一个系列,叫做“白话数据挖掘”,里面希望不用一个数学公式把我理解的数据挖掘算法讲给所有人听,但是后来发现这个事情是不现实的,因为代码比公式要难懂,冗余的多。
  
  另外,作为算法工程师,如果只是会盲从地遵从paper去套用他人的算法,而没办法对其算法进行一个从头至尾的理解,这个学术上的算法往往也是无法应用于工程化实践的。
  
  所以,如果你真的热爱数据挖掘,热爱算法领域,集体智慧编程可以成为你的第一本书,但是不要花费太多的时间,把更多的时间留给数学,留给那些每篇都有着“晦涩”的数学公式的大块头把。


   这本书很好 ,可惜 正版的没了。
   第二章的 算法,很简单,想明白了 就是四个步骤,照做 一个算法就出来了。 厉害
  然后 该书 还提供了 搜索、 个性算法等很多模块的算法,都很简单,但是清晰 实用。我朋友说,照着这个开发就可以
  
  缺点是 python 这个语言不是很通用,现在主要是php .net JAVa等, 不过大数据的 处理 技术 好像用python比较多
  
  不过该书主要讲思路,逻辑设计,所以 一样有用


  集体智慧,很容易被误导,实际上指的是根据大量群体的行为来推测或预测其他个体的行为,正如一只蜜蜂没有智慧,而一大群蜜蜂却分工合作,井井有条,在计算机科学中,采用集体智慧的思想可以说是另一条实现人工智能的途径,其在聚类,推荐,分类等中都有非常大的应用!本书并没有非常详细的介绍每种算法那,只是对这些算法的主要思想和方法作了一些介绍,对于入门学习者很有帮助,今年python语言很火,其编程非常的方便,本书采用的就是python来实现的这些算法,目前开源社区有很多python的库,有些非常的出色,可以拿过来直接用,用这些库,然后自己再编写些程序可以构造出非常出色的程序。其编程简单,用于人工智能是一件非常合适的编程工具。


  第一次完整的读完了英文版的教材,深入浅出,联系实践,跟着敲了大部分的代码。应该找时间再读一遍,并整理读书笔记。自己水平有限,只能看懂算法,还不能理解其中的根本思想。


  一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!一本非常不错的好书!确实是非常不错的!


  这是我唯一一本可以坚持读下去的机器学习/模式识别的书,能把复杂问题给你通俗的讲解,而不是给你大堆大堆的公式,很同意其他读者的观点:著者一定是绝顶高人,另外他还有几本书《数据之美》《Programming the Semantic Web 》值得一看


  如果你从没接触过挖掘,推荐,搜索引擎的书,确实值得一读。
  如果你懂python,那就更好了,还可以练练手。
  不过理论上也没有太多的深入,比如搜索引擎一块,基本就是个小例子,前沿的东西是没有的,毕竟篇幅有限。


  这本书当做导论来看才比较适合。里面理论性的实在是很浅,价值大多都体现在实现上。
  
  搞过数学建模的同学看到此书肯定特别亲切,好多理论都接触过,不少内容还用MATLAB实现过,而且还比书里边的研究得更为深入。
  
  因此该书的意义绝不是在于对某某算法的深入研究。而是告诉你,在工程领域的具体实现上应该运用哪类算法。权当更新知识地图了,这也正是导论书籍作用所在。
  
  至于到实际需要写代码实现的时候,还是针对性的看看相关论文为宜。聚类的几个参数不搞透彻,那效果还不如肉眼看呢。


    为了更好地学习本书,我从学习python开始到后来调试书中的网站实例。花了不少功夫,希望朋友们不要走弯路。这里提供了图文并茂的指导过程。请参考:
    http://blog.csdn.net/zjmwqx/article/details/7007438


  为了更好地学习本书,我从学习python开始到后来调试书中的网站实例。花了不少功夫,希望朋友们不要走弯路。这里提供了图文并茂的指导过程。请参考:
  http://blog.csdn.net/zjmwqx/article/details/7007438


  在前头那些来自业界的赞誉,还是没有夸大的。
  这个领域也就这么些话题,而这本书的确把这些话题一个个整理出来,并评价他们的应用场景和优缺点。我不知道阅读此书前没看过学院派书籍的人感觉如何,要是我一上手看这书,也只是知其然不知其所以然的程度。
  这本书的示例代码用python,也是挺讨巧的,python的代码可读性很强,尤其那些涉及数据结构的运算,很多一行就搞定了。配合的注释也很清晰,每个代码后还会再用一定篇幅阐明代码是干什么的。而源代码在网上也能轻松获得,对于想跃跃欲试开发的朋友也是不错的起步。
  我原以为他会揭露一些商用系统的算法细节,结果只是从商用系统的API去获得数据而已。
  总之,这是一本适合机器学习方向的入门好书,能从这本书中一窥当今这方面热门的话题,若是我早些读到的话,或许自己的研究方向也会不同吧。


    的确是本实用,有深度,又浅显易懂的书。能够把复杂的问题写得如此简单的人肯定是位绝顶高手。特别是原来感觉比较深奥的问题,比如:
  核方法(Kernal Trick)、模拟退火(Simulated Annealing)等这些困扰多年的问题。想当年为了弄清SVM的核方法,看了不少参考资料,有的厚厚的像块砖。几次一头扎进水想弄明白,结果每次都因营养不足被迫浮出水面。当时感觉这东西好难。读完后,以前纠结的问题,忽然就明白了。原来是这样!


  Want to tap the power behind search rankings, product recommendations, social bookmarking, and online matchmaking? This fascinating book demonstrates how you can build Web 2.0 applications to mine the enormous amount of data created by people on the Internet. With the sophisticated algorithms in this book, you can write smart programs to access interesting datasets from other web sites, collect data from users of your own applications, and analyze and understand the data once you've found it. Programming Collective Intelligence takes you into the world of machine learning and statistics, and explains how to draw conclusions about user experience, marketing, personal tastes, and human behavior in general -- all from information that you and others collect every day. Each algorithm is described clearly and concisely with code that can immediately be used on your web site, blog, Wiki, or specialized application. This book explains: Collaborative filtering techniques that enable online retailers to recommend products or media Methods of clustering to detect groups of similar items in a large dataset Search engine features -- crawlers, indexers, query engines, and the PageRank algorithm Optimization algorithms that search millions of possible solutions to a problem and choose the best one Bayesian filtering, used in spam filters for classifying documents based on word types and other features Using decision trees not only to make predictions, but to model the way decisions are made Predicting numerical values rather than classifications to build price models Support vector machines to match people in online dating sites Non-negative matrix factorization to find the independent features in adataset Evolving intelligence for problem solving -- how a computer develops its skill by improving its own code the more it plays a game Each chapter includes exercises for extending the algorithms to make them more powerful. Go beyond simple database-backed applications and put the wealth of Internet data to work for you. "Bravo I cannot think of a better way for a developer to first learn these algorithms and methods, nor can I think of a better way for me (an old AI dog) to reinvigorate my knowledge of the details." -- Dan Russell, Google "Toby's book does a great job of breaking down the complex subject matter of machine-learning algorithms into practical, easy-to-understand examples that can be directly applied to analysis of social interaction across the Web today. If I had this book two years ago, it would have saved precious time going down some fruitless paths." -- Tim Wolters, CTO, Collective Intellect


  推荐对数据挖掘想入门的同学阅读,这本书没有大篇幅让人头晕的数学推导,适合想边学理论边实践的人阅读,如果能把每章最后的习题进行实践,相信会更有收获


   本书介绍了人工智能(机器学习与数据挖掘为主)在编程(特别是网络编程)方面的具体应用,介绍了许多机器学习与数据挖掘的算法与实现,几乎每个算法都是结合着实例来说的,因此能让读者有很感性的认识,并且没有复杂的数学推导,比较适合入门者,要想读懂本书的算法,唯一的要求就是懂python,如果不懂就没有办法精通本书,尤其是初学者,很多原理与实现的详解都是用python语言来表达的。


    猎兔搜索从事企业搜索,自然语言处理等软件开发。产品包括多种语言的自然语言处理和搜索系统,网站搜索和垂直搜索软件,网络信息监测软件等。服务于农业信息化,竞争情报分析等领域。
    
    岗位要求:
    
    1.熟悉数据结构及其实现;
    2.熟悉Java或c#;
    3.数学基础较好。
    
    开发工作:
    中文分词、文本分类、爬虫等。
    
    工作地点:北京或济南任选。
    
    网站:http://www.lietu.com
    
    联系方式:
    email: luogang@gmail.com
    msn:lgjut@sina.com
    QQ:270954928


  这本书还不错的,很适合数学基础不算太好(当然也还是要一定的数学基础),又想了解数据挖掘这个领域的读者。或者有实际的项目需求,但又没有足够的时间去深入了解这个领域的实践者。
  
  不过我每次看到有人说它把艰涩的数学讲的很通俗、进而认为那些写满数学公式的书是故弄玄虚这样的说法时就觉得很反胃口。但这种说法很普遍,不论是在这里还是在Amazon.com。
  
  数学从某种程度上说就是一门语言,能够让复杂的概念和关系用严谨而简洁的方式表达出来。就好比有了"操作系统"这样的专业术语,你在跟别人交谈的时候就不用说"我的软件是运行在另外一个管理内存、进程、文件等的底层系统之上"这样罗索而充满歧义的话一样。想进入一个新的圈子,就必须懂得这个圈子的语言,这是显而易见的事情。所以每个领域都有自己的一些专业术语,而数学的一些分支就是数据挖掘或机器学习这个圈子的语言的重要组成部分。
  
  集体智慧编程这本书能够让你在掌握很少的数学知识时,仍然能够掌握一定的数据挖掘技能。不管是为了应对紧迫的项目压力,或是培养这个领域的兴趣,把它作为入门书,都是一个不错的选择。但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。
  
  


  作者把复杂的东西讲的我这么平凡的读者都可以读懂,并产生了极大的兴趣。是在是佩服。
  有点遗憾的是 每章后的习题 没有答案,哪位朋友有答案,或者都能很简单的完成的,希望写出来放在网上,共大家参考。
  虽然我不是搞 c端的,目前用处不大,但对于信息大爆炸的时代来说
  迟早会用上的


请问你读的是中文版的吗?现在网上买不到啊


@山桃
是中文版,我从图书馆借的。网上好像有电子版,真不行打印出来看呗。


我也是之前大概看了下《推荐系统实践》对CF算法有所了解,正准备看这本呢。


把更多的时间留给数学,留给那些每篇都有着“晦涩”的数学公式的大块头把。


说的挺好,非常认同:代码比公式要难懂,冗余的多,尤其在数据挖掘领域。


非常赞同!
本科快毕业,想往数据挖掘方向发展(本已考上研,觉得还是实践出真知,准备工作了)
希望多认识数据大牛们,QQ1589243265,可以加下吗?


大块头完全不敢看


这本书网上没得卖了啊,上哪儿买呢


果然是站在更高的高度呀。这本书应当是个Get feeling of mining method的好书,但确实仅限于入门。


感觉lz有点装,本来不同的书就有不同的定位。不能说你学了高等数学,就否认小学数学课本的价值。


ls真无聊,我完全否定这本书的价值了么?我最后一段写的明晃晃吧:如果你真的热爱数据挖掘,热爱算法领域,集体智慧编程可以成为你的第一本书,但是不要花费太多的时间


难得的好书,对于数据挖掘很有用


求推荐其他类似好书


jimin 继续哦,你的读书笔记写的很好!


标记一下,牛人啊


赞楼主!


我比较认同,数学即是业内人士沟通的统一标准与语言的说法,就好比飞机的设计符合一定的标准,不同的部件才能对接,各类的技术文档与书籍才能方便地传输思想。
但数据挖掘是一个普及面很广的领域,不单研究人员,专业人士在用,在研究。还有大量对数学兴趣不大的程序员在用或者想用。也许只是想实现一个简单的功能,而并不需要深入细究与改进。对于这个规模其实很大的人群以及这样简单的应用目的,我觉得这样的书是很有价值的。更何况,美国人似乎比中国人更不喜欢数学:),所以写这样的书的通常也是美国人。这样的书拿回来与国内一些满篇数学公式的“编著”相比,让国人爱不释卷也是合乎情理的。


Why?


依据"没有免费的午餐"原理, 没有哪个方法会在所有情况下都最优,Bayesian方法也不例外。但bayesian方法的确能容纳更丰富的先验知识,从这个角度看bayesian方法的确有他的优势。这个在一些"No Free Lunch"方面的文章里有论述。


是啊,所以说没有哪个方法会在所有情况下都最优,Bayesian方法也不例外。


俺是外行,最近关注这个领域,说得不对请批评
要想这些算法能在实际项目中使用,最起码要突破产品经理这个层面,数学好,理解用户需求的产品经理有多少?
比如新浪的微博运营,让陈彤理解推荐合适的人或者信息给用户容易,但是让陈彤理解矩阵和图论,这事就麻烦点了。也许这个例子举的不好,貌似陈彤是学机械控制的,数学正好是长项也说不定,哈哈


这个话题就比较复杂了。大多数技术都能从一定程度上让普通人听得懂,另一方面,大多数技术即使技术人员也要费很大功夫才能真正弄明白。如果老板是技术出身,那么和技术人员沟通就少了一项障碍。但是技术显然并不是唯一可能影响沟通的障碍。
沟通永远都是最重要而又最具挑战性的工作。


赞楼上最后一句,“沟通永远都是最重要而又最具挑战性的工作。”


呵呵,可能因为沟通能力不足才有这种感觉,会沟通的人会不会觉得这个很轻松啊


我赞你最后一句,是因为只有这个我能插上一句,其他我都不懂。 掩饰而已!


这句话又掩饰了沟通能力不足
呵呵


Amazon.com上是美国人写的review吧。这个math phobia早就已经成了美国大众文化的一部分了。。。。任何时候数学少就等于好,数学多就等于艰涩难懂。搞得想找本对得起作者数学水平的书,有时还真是困难。没办法,那些作者也是被吓得~


当年美国高校悬赏经济教材,获奖的曼昆就是因为通俗易懂。经济学领域的大拿们有靠一堆数学公式与人沟通的,也有一个公式都没有的大家。
  
  而科斯无疑是最典型的个例。科斯是学数学的,没人能怀疑他的数学功力,但是科斯交易费用理论的论文数学很少。如果能够用更多人理解的方式描述,其影响范围自然更大,获取应用创造价值的机会就更多。
  
  美国的金融危机,原因也是金融工程的发展已经让多数人无法理解其产品,从而失去了市场矫正的机会。华尔街宽客门很多都有数学或者物理学博士学位,他们建立了越来越复杂的模型,最后精致的数学模型都可以用很美丽的数学去解释,但是就是没办法与真实的世界联系起来,结果大家都知道了。
  
  回过头来说推荐引擎,我的数学很差,是个新丁。但是以我的观察,商业推荐引擎成败算法只是其中一个因素。只有少数的推荐引擎要用到最尖端的数学算法。而多数推荐引擎成效的提升往往依靠对用户心理的了解,更合理的用户界面设计。
  
  比如推荐算法一个关键问题,数据噪音和数据稀疏性问题,可以用数学方式解决,也可以依靠用户行为的改善来矫正。
  
  我理解好的推荐引擎应该是这样的:一个高效率的算法+设计很好的用户行为。所以做产品规划的时候,一定要再这两个方面着力才行。


呵呵,先说明一下,我数学也很差,数学公式多了看着也头疼。用最少的数学公式,或者尽量不用,那是最完美的状态。反过来,数学这么让人头疼,却依然无处不在,就是因为它不可避免。
要实现有效的推荐系统,算法肯定不是唯一重要的东西。简单的算法往往已经能达到不错的推荐效果,至于是不是还需要更复杂的算法,取决于网站和用户对他的期待。


那这个做模型的惨了


纪念一下,这个述评挂了一个多月只有40多人阅读,昨天被挑灯看剑推荐了一下阅读量已经增加到150了


哈哈,我再来推一下,讨论的气氛很好


顶评论~ 同样不喜欢这本书。不敢想象有人拿书里的代码去实现某个算法……


我同意楼主的想法。讲得深入浅出很难,写满数学公式去解释一个理论的作者,也是没有办法才那样的


@ Chen_1st (大写西爱吃一嗯下划线1爱斯替)
  
你寫道:

但如果要根据不同的应用设计自己的算法,而不是仅仅拷贝别人的算法,那么掌握数学语言并进行更深入的学习显然是非常必要的。

那麼,請問需要深入學習哪些正宗的數學?統計學嗎?


@Info.Zeitgeist
统计学,矩阵分析,优化理论,还有泛函分析
不过最好还是用到什么学什么,不然很难坚持下来。哪里看不懂再去学可能好点。上面这些我也不是都认真学了。用到什么学什么的问题是基础总觉得不扎实。


@ Chen_1st
  
多謝指路。
  
你寫道:

用到什么学什么的问题是基础总觉得不扎实。

  
我個人有個比喻是:用到什麼學什麼好比是 top down(fundamental science 是 bottom, applied science 是 top),一步一步從基礎學好比是 bottom up。
  
同時做 top down 和 bottom up 的學習是最理想的。“止觀雙運”。但是,很難有足夠的時間。大悲大悲。


赞一个止观双运,没时间只能慢慢来了。
前面还没问题,后面章节里的一些公式和原理没细讲,等于magic,基本就只能看一个乐了


热帖留名~


严重同意,没有免费的午餐,深刻体会。现在觉得数学公式好坏都是浮云,效果和易操作是关键。吼吼,不知道是不是我从一个极端又走到另外一个极端了?


NFL本身就应该有个free lunch~


同意这个
统计学,矩阵分析,优化理论,还有泛函分析
不过顺序可能要变下 统计学的基础部分概率论可以分出来 先学 然后是矩阵分析 或者线性代数 接着可能就是泛函分析 走完前面的就可以再来更广义的统计(机器学习部分)和优化理论了


赞,这个讨论就已经足够有养分了。


做dimension reduction,难免会碰到manifold。
学manifold,一般会碰到topology
做Bayesian nonparametrics,难免会碰到measure theory。
做semi-supervised learning,可能会用到Spectra Graph Theory。
一开始还是先看看introductory real analysis比较好,可以给后面看稍微抽象的数学打个基础


所言甚是,看着简单说明教得不深入


书里太多篇幅讲基础代码,并且实现的也一般;类似k-means这种算法直接用SciPy包得了


为什么集体智慧编程不是java实现,而用python
对于后续会出2ed吗?


把抽象的数学推理的过程翻译成符合逻辑的简单步骤,足以证明作者对这些算法理解很透彻了,而且不是停留在理论上的理解,能在实践中加以改造。举个例子说:神经网络那一节,他没有按照理论的构造所有的隐藏节点,对参数的存储也加以改善,这种活学活用的思维方式在实际工程中帮助很大。再假如,如果要写一个产品的需求文档,如果写上一些数学推理的公式,显然不太合时宜。 但作为一本讲学习机器学习的书籍,书中最好还是加入理论学习的数目或者文章连接,这样对应学习的人深入理解要好点。


数学不好,的确是觉得此书真心很艰深
泪目路过


楼主,我感觉搞工程的完全没有必要看这本书,,,,,,,


请问您找到本书的课后习题答案了吗?


没有。。。


相关图书