07-10 12:09 阅读 55

lxml中的etree(待补)

待查看源码，为什么打印出来的类型是这样
类型集合返回如下：

2.
3. # 这里就是普通字符串了，可以执行写入文件操作

import xlwt
import requests
from lxml import etree
import time


def getOnePage(url):
    html = requests.get(url)
    selector = etree.HTML(html.text)
    # 查询节点的话表格就要表格的节点，这里以ul节点查询为例//ul[@class="all-img-list cf"]/li
    # XPath定位节点返回的是节点集合
    infos = selector.xpath(‘//*[@id="book-img-text"]/ul/li‘) # //*[@id="book-img-text"]/ul/li[1]
    # 打印一些节点
    print(infos) 
    print(type(infos)) # 
    for info in infos:
        print(type(info)) # 
        print(info) # 
        print(‘\n‘)
        style_1 = info.xpath(‘div[2]/p[1]/a[2]/text()‘)[0]
        style_2 = info.xpath(‘div[2]/p[1]/a[3]/text()‘)[0]
        print(style_1,type(style_1)) # 
        print(‘\n‘)
        print(style_2,type(style_2))
getOnePage(‘https://www.qidian.com/all/page%7B%7D/‘) # 打印出来的尽然是内存地址列表

原文：https://www.cnblogs.com/wkhzwmr/p/15311502.html

推荐资源

(价值107)OpenCV图像处理-小案例实战教程-51CTO JFinal-layui极速开发企业应用系统源码 java源码百度云 2020年3月上海大数据191125数仓项目 15天资料齐全 2022抖音好物分享训练营，当下风口带货变现模式，从入门到精通上海Python培训 AID1803班传智黑马go与区块链基础班golang基础班视频（全套） 2021年Python 3.9全新教程 8天高强度极速入门再定义华为WLAN无线网络-构建企业级园区WLAN架构实战课程华为HCNA-WLAN认证与实战 Netty 入门与实战：仿写微信 IM 即时通讯系统视频教程龟课·闲鱼无货源电商课程第19期：操作好一天出几单，赚个几百块钱