scrapy使用xpath的text提取文字内容出现丢失

使用python库scrapy在提取html内容的时候,如果需要提取的标签中有em一类标签,这时候使用text进行提取就会出现内容丢失,比如<ahref="http://www.xxxx.xxx"target="_blank"><em>go</em>微架<em>go</em>-<em>micro</em>深度学园</a>这时候可以考虑手动提取,或者使用lxml库中的etreehtml=etree...

阅读全文

主机推荐

  • 搬瓦工

站点信息

  • 文章总数:655
  • 页面总数:1
  • 分类总数:11
  • 标签总数:2555
  • 评论总数:135
  • 浏览总数:3428471