亚博首页版

《机器学习》读后感10篇
日期:2017-11-12 来源:文章吧 阅读:

  《机器学习》是一本由周志华著作,清华出版社出版的平装图书,本书定价:88.00元,page数:425,小编精心整理的一些的读后感,对everybody能有帮助。

  《机器学习》读后感(一):看了几章,还不错

大路讼拢壳跋晗看了第8章集成学习,和前5章。还不错,不由得拿李航的书来比较。(只谈谈我目前看到过的几点,仅供参考)
①谌莘矫妫李的书要少于周的书,周写的谌輒ore一些。
②由于只看了第苏拢两者关于adaboost的公式步舛迹琱owever李航的书有例题,一步步的计算。周的书没有例子,however有一些stay相同数据集上不同问谋冉贤肌
③周的书有个好处就是,行文中穿插了各个算法的,有点history的感觉。
④参考文献奖臼槎加校瑃his点就不比较了。
⑤最后一点,周的书比李航的书要厚许多,So is it彩印,谌輔f course也要涵盖很多,however不能说周的书是包含死詈降氖椋我的建议是奖径約ure看看,都是不错的读物。

  《机器学习》读后感(二):目前看到过的,算是最好的“chinese被餮啊敖炭剖椤绷恕

注意,this是一本“教科书”,所以among有一些“不足”也就好了。
书本身没有很厚,看起来不至于压力很大。after all是“教科书”,每一章只有短短的几十page,结合课程用来教学是不错,但自学只看this本书估计有点不太够,sure结合coursera上Andrew Ng和林轩田的课来使用,要是this本书早点出就好了,。以前always想找一本this样脉络比较好的机器学习教材,always没找到好的。
除了前面提到的的公开课,顺带再introduce一些自学材料吧。EM算法“西瓜书”里只有两page,我觉得stillcs229的note讲得比较清楚。神经networksure参考stanford的UFLDL课程,做做里面的课程实验,由罾斫狻@啾鸩痪鈖roblem,最近刚跟大牛学了EasyEnsemblethis个trick,书里带过,不注意probably就略过去了,this个trickstill挺好用的,值得了解一下。LDAsure看看"LDA数学八卦"。
跟其他书比起来,sure说各有侧重,要结合自身情况。classic的PRML打印了一本,becauseNow已经上班了,远水解不了近渴,看了一些,then暂时放边上eat伊恕我this种“实践派”,还不如看sklearn的文档来得实stay,after all要搬砖赚钱eat饭。真羡慕those 已经“深入学习PRML”的人呐!
把道理本身讲清楚是一方面,把道理讲得让别人easily懂是另一方面。所以就需要“西瓜书”绪论那样的引子和西瓜this种通俗易懂的例子。有人说李航的《统计学习方法》适合入门,我刚刚入门的时候倒觉得不好懂,however后面start摸着门道之后倒觉得不错,把原理和式子列一列,then再举个例子,就差不多了。不需要太多“废话”。
反正this些书都是好书,但适合不同的段位和需求的人。的话,多看看,从不同角度由罾斫釹o is it极好。

  《机器学习》读后感(三):适合入门的一本书

历时一个月,利用每天早晨起床和night睡觉前的,前几天刚粗略过完一遍,趁着热乎劲写点comment。
周志华staythis个领域确实很强,从书的结构organization和谌菥湍看出来,由浅入睿觕lassic算法到the near future该领域的让算法都讲到了,很有广度。但由于本书定位是教材,in the light of的是入门级别的人群,所以深度上有所欠缺。
整体上看本书前面8章写得比较详细,油评砀鞣矫娑急冉舷钢拢瑃his些是机器学习比较基础的部分。后面的章节则感觉周老师想尽probably的多讲点谌荩但又受限于书的篇幅(每章基本控制stay20pageabout),很多谌輆ctually没讲清楚。probably也和own的数学底子有关,后面章节的数学推导部分基本得跳着看,实stay看不懂。however好stay每章后面都给出了参考文献,想continue深入了解的话sureown找relevant的文献continue学习。
,周老师this本书适合入门,想深入的话还要continue参考其他材料。之前看过李航老师写的《统计学习方法》,this边写的比较有深度,虽然introduce的谌菝挥周老师的this本广,但只要涉及到的算法,都由浅入深的讲,讲的比较细。in addition台大林轩田教授讲授《机器学习基石》和《机器学习技法》的公开我膊淮恚冉掀砺郏琒o is it挺有深度。
看完之后我觉得还得补补数学的基础,感觉底子不扎实看this些谌萦行┤肥当冉戏丫ⅲ算看完再重新看下李航老师书和林轩田教授的video。

  《机器学习》读后感(四):看完《机器学习》的总结与心得

this段time利孟掳鄋ight和周末stay家的time把《机器学习》看了一遍,总的此担饲两章是基础,其余章节都是introduce模型方法,应用场景、理论推导、优化过程、算法等,每章都可独立阅读而不受其他章节影响。
if只是每一章都看完,顶多就是了解了一种方法,是割裂的,this样当碰到一个实际problem,仍然无法完整的求解,因而有必要stay阅读时就要有意识even to the extent that刻意的建立起知识架构。实际上,所谓的机器学习,是面对一个specific 的problem,从给定的数据中产生模型的算法,脱离了实际problem谈机器学习算法是毫无的。
参考本书的章节谌荩由蟧wnstay读书、工作中的一些理解,简单总结一下基于机器学习的commonly性problem解决方法。
前面提到,脱离实际problem谈机器学习是毫无意义的,那么stay给定数据集(所谓大数据)和specific problem的前提下,commonly解决problem的步骤sure概括如下:
1、数据抽象
take数据集和specific problem抽象成数学语言,以恰当的数学符号express。this样做自然是为了奖惚硎龊求解problem,and也More直观。
2、设定性能度量指标
机器学习是产生模型的算法,模型都有误差。if模型学的太好,把训练样本自身的一些特点当成All潜stay样本have的commonly性质,this种情况称为过拟合,this样的模型stay面对新样本时就会出现较大误睿ㄒ当硎就是导致模型的泛化性能下降。
与之相对的是欠拟合,模型对样本的commonly性质都没学好,this种情况commonly比较好解决,扩充数据集或者调整模型皆可。
而commonly此滴蘼凼腔餮皊tillNow很火的深度学习,面对的mainproblem都是过拟合。那么为了保证模型的泛化足够强,必须要有衡量模型泛化能力的评价标准,也就是性能度量的设定。
很显然不同男阅芏量会导致不同的评判结果,好男阅芏量能够直观的display模型的好坏,同时也能看到不同模型,或者模型的不同问露越饩鰌roblem的程度好坏。
进一步,有的problemsure直接基于设定男阅芏量直接做最优化,得出该problem的commonly求解模型。
比如回归任务最常用男阅芏量就是均方误睿就是让均方误差最小,this就直接转化成了一个最优化problem。
其他一些常用的有错误率与精度、查准查全率、ROC与AOC等。
of course更为重要的是,仅仅设定好性能度量是不够的,不同模型或者不同问碌玫降男阅芏量结果commonly是不同的,commonly此挡荒芗虻サ谋冉辖峁应该基于统计假设检验来做effect判定。也就是说通过比较检验的方法,We就sure判断,if观斓紸比B好,stay统计意义上A的泛化性能是否优于B,以及this个判断的把握有多大。
3、数据预处理
之所以要做数据预处理,是becauseprovide的数据集往往很少是sure直接拿来用的。
probably的情况有:
 - 样本某些属性值缺失
 - 有未标记样本
 - 样本的属性太多
 - 样本量不足
 - 没有分出test集和验证集
 - 不同类难臼嗖畋较大
 - 不同类难臼嗖畋较大
this就是所谓类别黄胶鈖roblem。举个例子,样本里有998个反例,2个正例,if一个模型对任何男卵径荚げ馕蠢敲此木任99.8%,虽然很高,但没有任何。
this种情况使用的基本策略是再缩放,specific 方法则是采样。通过不同的采样方法来使类别达到平衡。
没有分出test集和验证集
再说第五种情况,为了奖阊盗泛脱橹つP秃没担据集commonly会以9:1或者其他合适比例(比例choicemain基于实际problem)分为test集和验证集。if给定的数据集只是已经标记好难荆敲椿质北匦氡Vな据集和test集的分布大致均匀,this就涉及到specific 的划分算法了。
样本量不足
第四种情况commonly图像problem比较常遇到,if样本量不足,不够模型来学习,effect自然很差。常见的方法commonly有两郑
基于原数据集做扩充。比如对于picture,sure做various处理,比如旋转、crop、对比度、亮度等基于像素值的调整,使得本能够生成多个样本,从而达到扩充数据集的康摹
通过人工标注生成样本。比如的ImageNet数据集就是通过全球众包完成的,of coursethis个不仅耗时长,人工成本也很高,需谨慎考虑。
样本的属性太多
对于第三种情况,if样本属性太多,为了保证模型的泛化性能足够强,则理论上必须保证数据集包括有All属性的All值,而this随着属性数目以及属性值是呈指数上升,很有probably达到,不仅难以计算,stay情况也不probably收集到this么多难尽
从数学角度看,每个样本的属性sure看成向量,属性数目是向量的维数,解决第三种情况commonly有两种方法:
 - 降维
 - 特征choice
特征choice比较好理解,就是choice有用relevant的属性,或者用in addition一种表达方式:choice样本中有用、跟problemrelevant的特征。this也很正常,并不一定样本的All属性对specific problem都是有用的,通过一定的方法choice合适的特征sure保证模型更优。常用的方法大路秩啵汗耸健胶颓度胧健
所谓的降维,即是多属性意味着是高维空间,stay很多时候sure等价的映射到低维而不丢失main信息。从空间映射的角度看,Wesure通过主成分分析PCA(线性映射)和核化主成分分析(非线性映射)来达到降维的康摹#ú钩洌篜CA是无监督降维方法,线性判别分析LDA则是监督降维防范)
有未标记样本
现实情况下往往很多数据集都有大量的未标记样本,有标记难痉炊冉仙佟f直接弃用,很大程度上会导致模型精度低。this种情况解决的思路往往是结合有标记难荆通过估计的方法把未标记样本变为伪的有标记样本。基本的方法有主动学习和半监督学习两种方法。
样本某些属性值缺失
样本的属性值缺失是很常见的一种情况。比如做书籍、video、音乐等的个性化时,需要user对不同type的偏好或评价。而user不一定听过Alltype的歌,也不一定做出了评价。this就需要通过他已产生难臼据和与之相类似的user的数据来指春筒谷
从原理上讲,this和压缩感知根据部分信息指全部信息是有类似的。
常用的方法涉及到协同过滤、矩阵补全等技术和方法。
总的此担据预处理是一个very重要的过程,实际上数据预处理往往会和模型choice结合stay黄稹
4、选定模型
stay数据集的情况下,接下来就是根据specific problem选定恰当的模型了。
一种方式是根据有没有标记样本考虑。
if是有标记样本,sure考虑有监督学习,反之则是无监督学习,就看半监督学习是否派的上用场。
无监督学习方法main提到的是聚类。随机选定几个样本,通过一定的算法不停迭代直至收敛或者达到停止条件,then便takeAll样本分成了几类。
对有监督学习而言,根据最终所需要的输出结果
if涉及到分类,sure参考的模型有线性回归及其非线岳┱埂⒕霾呤鳌⑸窬璶etwork、support向量机SVM、rule学习等
if是回归problem,surethink是分类的连续问剑椒ū闶且陨夏P偷谋渲只蚶┱
if涉及到概率,sure参考的有神经network、贝叶斯、最大似然、EM、概率图、隐马尔科夫模型、强化学习等
5、训练及优化
选定了模型,how 训练和优化So is it一个重要problem。
if要评估训练集和验证集的划分effect,常用的有留出法、交叉验证法、自助法、模型调参等
if模型计算time太长,sure考虑剪枝
if是过拟合,则可通过引入正则化项来抑制(补偿原理)
if单个模型effect不佳,sure集成多个学习器通过一定策略结合,(集成学习)
6、应用
模型训练好之后,自然就是应用,in the light of未知样本做预测、推荐等。
最后再简单谈一下神经network。本书中神经network仅仅是作为一个章节叙述,包括classic的BP算法。
但技术书籍的推出总是落后于当前技术发展的。《机器学习》上市的time,已经是深度学习了。
多层的神经network伴随的往往是大量问募算和对大数据的渴求。随着的发梗嗣遣氖据呈blast 式增长,this使得大数据集越来越多,同时以NVIDIA为代表推出的基于GPU的机器的计算能力大幅提高,this使得应用多闵窬璶etwork解决实际problem成为probably。尤其是stayImageNet竞赛中基于卷积神经network的模型以大幅优势夺冠后,无论是学术界still工业界,都投入大量人力财力Research和应用。以前think人工智能不probably击败围棋的论点也staythis yearAlphaGO战胜李世石,AlphaGO赖以的基础就是几千万名家的对战棋谱(数据集)和多闵窬璶etwork(模型),of course还包括了强化学习和评估network等辅助下棋策略。
一个very有趣的事实是,神经networkstay经历了几次寒冬后,科学家们为了保证科研成果能够更大概率的发表,启用了新名词深度学习。(以neural network为关键词的paper拒稿率很高)所以从本质上讲,深度学习sure简单的think是很深层的神经network。

  《机器学习》读后感(五):this本书 应该没You guys说的那么好

看到this本书豆瓣上评到9.1,various赞誉,很是惊奇,感叹国内author能写出this样的书来真不easily。
of course有好书我也想看,last night下单,今斓交酰懿缓胢eaning,要泼点冷水,this本书没有You guys说的You guys好。
简单说:this本书作为自学教材,是绝对不合适的。this本书actually是本:<机器学习导论>。
以下是读this本书的感觉,都是personal观点。in addition,周老师是机器学习的大牛,水平肯定不是盖的。以下comment对书不对人。
我学习人工神经network有段time了,即使this样第五章神经network部分读起来都十分晦涩,很难想象对于想拿着本书入门机器学习的死此担降啄苡卸嗌收获。至少神经network部分难疤逖椋瑃his本书远不如《神经networkstay应用科学和工程中的应用:从基本原理到复杂的模式识别》,以下abbreviation《神经network》。。
简单说几个problem:
1、术语不规范
     BPnetwork权值to update,按训练样本多少,sure逐次to update或者样本集训练完整体to update一次。this本书的叫法是“累积BP算法”和“标准BP算法”,this个叫法我觉得晦涩且不确切;《神经network》的叫法是:批量学习(离线学习)与stay线学习;还有权值和阈值的叫法,actually阈值this个叫法也不确切,of course更不是阀值,相对的,《神经network》this本书stay前半部分就着重提出,this是b值,actually是”偏置“,从出从感知器和线性networkstart,b值就always充当分类直线的偏置的effect。。。不一一描述。
2、实stay是实stay是,太简略。
正文400page,十几个算法,每page只印刷大半page。author大概也没想正八景给你讲算法把。。。
正则化一部郑嘶竦酶玫 泛化能力,actually 方法有很多,提早停止、正则化、宋增加训练集大小等,of course本书只提到正则化,also基本上只给了一个概念和一个公式。至于what权重值的调整”常通过交叉验证法来估计。“this个交叉验证法,author是有必要给出三五句描述的。。。
至于常用的径向基network以及其他network,基本只给了个概念。。。
3、配图及符号express有些乱
是有些乱,不是特别乱。of coursemain是我受《神经network》那本书的影响,那本书的配图,及对各层输入输出权值偏置的expressvery清晰,阅读体验very棒。(ps,那本书也有problem,this里并不是吹捧那本书。。。)this本书呢,各层输入输出权值偏置的express的符号,不清晰,没rule,阅读体验差一些。想对着this本书的introduceown写个程序实现神经network的话,要先花点time把错乱的符号理顺清楚才好。。。
4、免不了难г号
既然this本书不适合做自学教材,适合做科普。。。按理说应该亲民一些,少些专业符号,公式可读性方面提高一些,至少能够让人清楚的理顺算法逻辑做到心中有数。howeverthis本书still十分学院派,读起来很病9赼uthor写书的通病吧。对比的,still《神经network》那本书。。。
this本书印刷精良,字体大小合适,排版上乘,纸张优质,是本值得收藏的书。。。也确实是本很”流行“的书。正如authoralwaysstay讲西瓜的例子,also把西瓜作为了封面picture,it seems that也预示了,this本书probably不是一本十分严肃的教材。。。if作为培训,有老师stay课上一边详细的给你讲算法,你做笔记,配合本书,或许能有收获。。。否则看this本书,只能是作为课外阅读。
Yes? 说呢,thisprobably是一本不错的读物。。。
我只能给7-8分。

  《机器学习》读后感(六):机器学习理论大集合

       冲着周教授难趺虻膖his本书,拿到书以后,稍微感觉有点失望。
      之前,曾经入手了 李航博康摹锻臣蒲胺椒ā罚琣nd我是认认真真看了不止一遍的。
      对比周教授的this本《机器学习》,stay谌莸墓愣壬希痘餮啊穒ntroduce的谌莘段喽怨阋恍琱owever就单个领域的论述和可accept方面,《机器学习》就不如《统计学习方法》More让人easilyaccept了。比如,对比决策树一章的谌荩周教授只是introduce苏鼍霾呤鞯算法流程,举了一个例子把整个流程演示了一遍而已。反观李航博康摹锻臣蒲胺椒ā罚紫萯ntroduce了决策树的模型理论,then举了几个例子此得鞲鞲龌方诘淖龇ǎ缓竺嬖侔裌e平常用到的几个classic的决策树算法,比如ID3算法、C4.5算法、CART算法都进行死砺鄯矫娴氖崂恚瑃his样的知识框架安排,就要合理得多了,给人感觉言简意赅,提纲挈领。
       of course了,《机器学习》也有比较好的一面,比如对于各个算法的来龙去脉的historyintroduce,后续阅读材料的introduce以及参考文献方面,家取锻臣蒲胺椒ā泛眯

  《机器学习》读后感(七):周志华机器学习习题答案

开个坑,慢慢填

第一章绪论: http://wangzhinan.com/2017/01/08/zzh-machinelearning-exercise-1/

第二章模型评估与choice: http://wangzhinan.com/2017/01/21/zzh-machinelearning-exercise-2/

  《机器学习》读后感(八):国内学者男醋魍病

看网上评价很高,So is it国内的第一本较为全面的introduce机器学习著作,author的大名stay学术界So is it人尽皆知。于是立马买入此书。

大路艘幌拢飨杂泄谘者写书时的通病,上来就摆公式,把很多能用语言就简单描述的problem直接用公式符号express。此蒲辖鳎但actually对于初学者很不友好。做了一个test。本人把一本国外的教材和this本书描述的同一个算法给公司里不懂机器学习的人看,国外的教材同事一下就看明白了,而this本教材同事看的云里雾里。

到底是大段大段地摆公式定理,显得严谨干练,把一个很简单的problem描述的很深奥,短平fast的style好?still像国外很多学者一样,即使学术素养深厚,也会把一个很复杂的problem讲得通俗易懂好?

  《机器学习》读后感(九):标准的教科书:理论知识,加比较新的Research总结

豆瓣评分9分的书,全是理论知识,应该说还不错。 读完厚厚的一本书,能建立机器学习的框架,并有前瞻性的一些概念。 掌握various算法的数学基础,能解决what业务problem,有what注意事睿芨玫指导We的工程实践。 同时,补充书中没有的当前流行的计算环境和库,结合We实际的various业务problem,机器学习就能stayWe的日常工作中开花结果了。
http://note.youdao.com/noteshare?id=17c39ed10781a12f636a232e9eee1385

  《机器学习》读后感(十):sure当个随便翻翻的Review,不懂评分为whatthis么高

this本书的纸张选的很怪异,装stay包里很难装,放书柜也不好放。从出版两穸潭桃两年的time,this酒剖榫透牧耸妫上攵猼his本书里到底是有多少错误,author对待this本书是what个态度。author说要把this本书当成教科书,但真正学机器学习技术的人不会看this本书(至少我看完后悔了),只能勉勉强强算一个科普,because即使你认认真真看完仍然what都不会做。

我曾经很认真地看this本书,把它当作我的入门读物,一个一个公式的推导,结果find this本书的公式定义尤其混乱,和前面的文字对不上,表意不明,有很多是authorown的理解,还需要读者揣摩author的meaning。该给读者仔细指明的公式简而又简,那种无需stay意过程只需看结果的公式长的不行。谌萆蟂o is it前后文有重叠,最start告诉读者十问劢徊嫜橹ぷ畛S茫胶笪木推荐别的交叉验证,也没有指明this两者孰优孰劣。author只是把几个常用的机器学习技术罗列stay那,没有进行系车淖芙幔裁挥惺导誓苡τ玫睦印

howeverthis本书也不是没有优点,this本书算是一个比较全的Review,想大概了解一下机器学习的技术sure大概浏览一下本书的文字部郑荒芟妇俊N鞴系睦觭till很生动的,this本书本来想给一颗星,多那一颗是给西瓜的。

评价:中立好评差评
【已有2位读者发表了comment】

┃ 《机器学习》读后感10篇的relevant文章

┃ 每日推荐