文章吧-经典好文章在线阅读:《Python网络数据采集》读后感精选

当前的位置:文章吧 > 经典文章 > 经典美文 > 经典精选 >

《Python网络数据采集》读后感精选

2021-04-26 03:02:12 来源:文章吧 阅读:载入中…

《Python网络数据采集》读后感精选

  《Python网络数据采集》是一本由米切尔 (Ryan Mitchell)著作,人民邮电出版社出版的平装图书,本书定价:CNY 59.00,页数:200,特精心从网络上整理的一些读者的读后感,希望对大家能有帮助。

  《Python网络数据采集》读后感(一):用python3讲一个完整的数据爬取和清洗的过程

  最近刚学了python3,看了一些讲语法的书籍和练手的题目,感觉这本书是一个比较好的系统的利用python完成从数据爬取到数据清洗整个流程的实践过程。觉得自己很有必要实践一下。刚刚看了下试读章节,15年出的英文版,难得的用python3进行工程实践而不只是讲语法的书。

  《Python网络数据采集》读后感(二):学到的有用内容

  1.可以尝试使用Google API

  2.对于容易被封杀的站点使用tor来匿名

  3.使用Tesseract识别验证码,可以训练特殊字体提高识别率

  4.爬取整个网站的外链链接是件容易的事情

  5.使用selenium作为测试网站的框架

  6.注意cookie和request header的使用,努力让网站不把你当做爬虫对待

  《Python网络数据采集》读后感(三):真的很合适入门的同学

  诚然,这本书里面提到的一些python库不一定是最好的,但是整个爬虫的思路,还是非常值得大家借鉴。

  其实python的语法,以及爬虫的代码段,都不难,就是写爬虫的过程中,需要注意的事项和有可能踩到的坑,是我比较看中的。

  书中提到了一点,就是修改浏览器的header,默认貌似是个什么python的信息,要改成火狐的或者谷歌浏览器的,才能骗过网站。

  诸如此类的知识点,作者整理的很好,值得一看。

  《Python网络数据采集》读后感(四):似乎所有的“分号”都应该是“冒号”

  第三章有好几个地方出现“分号”,但又实在不明白哪里有分号,只好查了原文。

  原文是 colons,也就是冒号。

  写在这里,给其他同学提个醒。

  : 这是冒号

  ; 这是分号

  公平地说,原书中也有一些低级错误,比如第七章开始不久,有个函数里把 input 写成了content,中文版照抄了下来。第97页那段代码,如果你不明白它是怎么做到的,请翻到105页查看。

  《Python网络数据采集》读后感(五):很好的一本书

  作者显然是此行达人,踩坑踩多了都是直接上经验。

  书里的代码很优美、正规并且很简洁,运用了大量的递归算法和正则表达式。但是有些地方译者翻译的有误,比如第31页,倒数第六行冒号翻译成了分号,显然运行了源码并且对比了wiki网站才会知道这是误翻译。

  另外,作者源码也有错误的地方,比如,第35页,getNextExternalLink应该是getExternalLinks,否则编译器会报错undefined。但无论如何,这些小错并不妨碍这本书的精彩之处,有python基础的同学完全可以一边读一边纠错,相信认真读完并且仔细分析源码一定会有很多收获。

  至于给差评的那位,我觉得你可以在安装完python3之后运行pip3 install bs4试试

  《Python网络数据采集》读后感(六):**********《python3网络爬虫实战案例课程》免费下载**********

  推荐一门网络课程《 Python3.6网络爬虫实战案例5章(基础+实战+框架+分布式) 》, 免费下载学习https://pan.baidu.com/s/14YZBWGeoPduK3d3UnIG-eA,课程体系完全是从浅入深一点点讲解,从Python爬虫环境的安装开始,讲解了最最基本的urllib包如何使用,如何解析request请求内容,刷选有用数据,像ajax,post,html,json等等都非常细致的一一讲解,

  然后逐步深入到如何利用cookie,ip代理池的技术,来解决登陆验证与防止被封等等技巧,

  最后通过学习python爬虫框架与分布式技术来搭建一个高可用的爬虫系统,从一个小demo到一套完整系统需要的技术体系一点点就掌握了。

  同时老师也配合多个案例来实际演练操作,像猫眼、淘宝、今日头条等等

  无论移动端、PC端的内容爬去都有涉及,纯实战演练,我想这应该是最最适合同学学习的课程了。

  《Python网络数据采集》读后感(七):翻译勘误

  5.3.2 基本命令

  第二段第一句话:

  除了用户自定义变量名(MySQL 5.x 版本是不区分大小写的,MySQL 5.0 之前的版本是不区分大小写的),MySQL 语句是不区分大小写的。(wtf ???????

  5.4 Email

  查询圣诞节的代码缩进错误(sendMail函数和while都错了,会造成死循环!

  8.2 马尔可夫模型

  多云到下雨的箭头指反了

评价:

[匿名评论]登录注册

评论加载中……