正文
【爬虫】使用xpath与lxml移除特定标签
小程序:扫一扫查出行
【扫一扫了解最新限行尾号】
复制小程序
【扫一扫了解最新限行尾号】
复制小程序
移除标签的两种方式可以用xpath定位
for bad in html.xpath(".//table"):
bad.getparent().remove(bad)
参考:https://stackoverflow.com/questions/7981840/how-to-remove-an-element-in-lxml
直接删除相关标签
在使用xpath获取指定标签后,直接删除。
etree.strip_elements(f, 'r')
参考:https://stackoverflow.com/questions/5418201/how-can-one-replace-an-element-with-text-in-lxml#answer-5420500