阅读 55

lxml中的etree(待补)

待查看源码,为什么打印出来的类型是这样
类型集合返回如下:


  1. 2.
    3. # 这里就是普通字符串了,可以执行写入文件操作
import xlwt
import requests
from lxml import etree
import time


def getOnePage(url):
    html = requests.get(url)
    selector = etree.HTML(html.text)
    # 查询节点的话表格就要表格的节点,这里以ul节点查询为例//ul[@class="all-img-list cf"]/li
    # XPath定位节点返回的是节点集合
    infos = selector.xpath(‘//*[@id="book-img-text"]/ul/li‘) # //*[@id="book-img-text"]/ul/li[1]
    # 打印一些节点
    print(infos) 
    print(type(infos)) # 
    for info in infos:
        print(type(info)) # 
        print(info) # 
        print(‘\n‘)
        style_1 = info.xpath(‘div[2]/p[1]/a[2]/text()‘)[0]
        style_2 = info.xpath(‘div[2]/p[1]/a[3]/text()‘)[0]
        print(style_1,type(style_1)) # 
        print(‘\n‘)
        print(style_2,type(style_2))
getOnePage(‘https://www.qidian.com/all/page%7B%7D/‘) # 打印出来的尽然是内存地址列表

原文:https://www.cnblogs.com/wkhzwmr/p/15311502.html

文章分类
代码人生
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐