Python

  • python
    01-29 07:20
    Python网络数据采集中文版 PDF电子书下载 内容简介 · · · · · · 本书采用简洁强大的Python语言,介绍了网络数据采集,并为采集新式网络中的各种数据类型提供了全面的指导。第一部分重点介绍网络数据采集的基本原理:如何用Python从网络服务器请求信息,如何对服务器的响应进行基本处理,以及如何以自动化手段与网站进行交互。第二部分介绍如何用网络爬虫测试网站,自动化处理,以及如何通过更多的方式接入网络。 作者简介 · · · · · · Ryan Mitchell 数据科学家、软件工程师,目前在波士顿LinkeDrive公司负责开发公司的API和数据分析工具。此前,曾在Abine公司构建网络爬虫和网络机器人。她经常做网络数据采集项目的咨询工作,主要面向金融和零售业。另著有Instant Web Scraping with Java。 目录 · · · · · · 译者序  ix 前言  xi 第一部分 创建爬虫 第1章 初见网络爬虫  2 1.1 网络连接  2 1.2 BeautifulSoup简介  4 1.2.1 安装BeautifulSoup  5 1.2.2 运行BeautifulSoup  7 1.2.3 可靠的网络连接  8 第2章 复杂HTML解析  11 2.1 不是一直都要用锤子  11 2.2 再端一碗BeautifulSoup  12 2.2.1 BeautifulSoup的find()和findAll()  13 2.2.2 其他BeautifulSoup对象  15 2.2.3 导航树  16 2.3 正则表达式  19 2.4 正则表达式和BeautifulSoup  23 2.5 获取属性  24 2.6 Lambda表达式  24 2.7 超越BeautifulSoup  25 第3章 开始采集  26 3.1 遍历单个域名  26 3.2 采集整个网站  30 3.3 通过互联网采集  34 3.4 用Scrapy采集  38 第4章 使用API  42 4.1 API概述  43 4.2 API通用规则  43 4.2.1 方法  44 4.2.2 验证  44 4.3 服务器响应  45 4.4 Echo Nest  46 4.5 Twitter API  48 4.5.1 开始  48 4.5.2 几个示例  50 4.6 Google API  52 4.6.1 开始  52 4.6.2 几个示例  53 4.7 解析JSON数据  55 4.8 回到主题  56 4.9 再说一点API  60 第5章 存储数据  61 5.1 媒体文件  61 5.2 把数据存储到CSV  64 5.3 MySQL  65 5.3.1 安装MySQL  66 5.3.2 基本命令  68 5.3.3 与Python整合  71 5.3.4 数据库技术与最佳实践  74 5.3.5 MySQL里的“六度空间游戏”  75 5.4 Email  77 第6章 读取文档  80 6.1 文档编码  80 6.2 纯文本  81 6.3 CSV  85 6.4 PDF  87 6.5 微软Word和.docx  88 第二部分 高级数据采集 第7章 数据清洗  94 7.1 编写代码清洗数据  94 7.2 数据存储后再清洗  98 第8章 自然语言处理  103 8.1 概括数据  104 8.2 马尔可夫模型  106 8.3 自然语言工具包  112 8.3.1 安装与设置  112 8.3.2 用NLTK做统计分析  113 8.3.3 用NLTK做词性分析  115 8.4 其他资源  119 第9章 穿越网页表单与登录窗口进行采集  120 9.1 Python Requests库  120 9.2 提交一个基本表单  121 9.3 单选按钮、复选框和其他输入  123 9.4 提交文件和图像  124 9.5 处理登录和cookie  125 9.6 其他表单问题  127 第10章 采集JavaScript  128 10.1 JavaScript简介  128 10.2 Ajax和动态HTML  131 10.3 处理重定向  137 第11章 图像识别与文字处理  139 11.1 OCR库概述  140 11.1.1 Pillow  140 11.1.2 Tesseract  140 11.1.3 NumPy  141 11.2 处理格式规范的文字  142 11.3 读取验证码与训练Tesseract  146 11.4 获取验证码提交答案  151 第12章 避开采集陷阱  154 12.1 道德规范  154 12.2 让网络机器人看起来像人类用户  155 12.2.1 修改请求头  155 12.2.2 处理cookie  157 12.2.3 时间就是一切  159 12.3 常见表单安全措施  159 12.3.1 隐含输入字段值  159 12.3.2 避免蜜罐  160 12.4 问题检查表  162 第13章 用爬虫测试网站  164 13.1 测试简介  164 13.2 Python单元测试  165 13.3 Selenium单元测试  168 13.4 Python单元测试与Selenium单元测试的选择  172 第14章 远程采集  174 14.1 为什么要用远程服务器  174 14.1.1 避免IP地址被封杀  174 14.1.2 移植性与扩展性  175 14.2 Tor代理服务器  176 14.3 远程主机  177 14.3.1 从网站主机运行  178 14.3.2 从云主机运行  178 14.4 其他资源  179 14.5 勇往直前  180 附录A Python简介  181 附录B 互联网简介  184 附录C 网络数据采集的法律与道德约束  188 作者简介  200 封面介绍  200
    • 636
  • python
    02-03 04:13
  • python
    01-23 03:48
    Python移动端APP自动化测试课程 App自动化Appium+Python自动化测试实战培训课程 课程目录 (0);目录中文件数:3个 (1) appium教程相关软件.zip (2) PPT和源码.zip (3) 移动端测试学习指南.pdf (1)第一章:App自动化测试概述;目录中文件数:6个 (4) 1-1 Appium自动化课程简介.mp4 (5) 1-2 课程大纲.mp4 (6) 1-3 移动设备操作系统兴亡简史.mp4 (7) 1-4 移动App自动化测试兵器发展历程.mp4 (8) 1-5 移动App自动化测试兵器发展历程.mp4 (9) 1-6 自动化测试流程与分类.mp4 (2)第七章:Appium并发测试;目录中文件数:10个 (10) 7-1 启动多个Appium服务.mp4 (11) 7-10 Appium自动化测试课程小结.mp4 (12) 7-2 多设备启动 .mp4 (13) 7-3 多进程并发启动设备.mp4 (14) 7-4 Python启动Appium服务 .mp4 (15) 7-5 多进程并发启动appium服务 .mp4 (16) 7-6 Appium端口自动检测 .mp4 (17) 7-7 Appium端口自动释放 .mp4 (18) 7-8 Appium并发测试综合实践(1) .mp4 (19) 7-9 Appium并发测试综合实践(2) .mp4 (3)第三章:测试工具简介;目录中文件数:15个 (20) 3-1 monkey简介.mp4 (21) 3-10 monkeyrunner简介.mp4 (22) 3-11 monkeyrunner API (1).mp4 (23) 3-12 monkeyrunner API (2).mp4 (24) 3-13 monkeyrunner API (3).mp4 (25) 3-14 monkeyrunner 脚本综合实战.mp4 (26) 3-15 本章小结.mp4 (27) 3-2 monkey事件 .mp4 (28) 3-3 monkey参数(1).mp4 (29) 3-4 monkey参数(2).mp4 (30) 3-5 monkey参数(3).mp4 (31) 3-6 monkey参数命令综合实践.mp4 (32) 3-7 monkey自定义脚本实践(1).mp4 (33) 3-8 monkey自定义脚本实践(2).mp4 (34) 3-9 monkey日志管理.mp4 (4)第二章:Android系统基础;目录中文件数:9个 (35) 2-1 漫谈Android系统.mp4 (36) 2-2 Andriod App类型简介.mp4 (37) 2-3 初识Android SDK.mp4 (38) 2-4 元素获取工具—UI Automator .mp4 (39) 2-5 Android模拟器安装与使用.mp4 (40) 2-6 adb命令实践(1).mp4 (41) 2-7 adb命令实践(2).mp4 (42) 2-8 adb命令实践(3).mp4 (43) 2-9 Package与Activity.mp4 (5)第五章:Appium进阶;目录中文件数:15个 (44) 5-1 数据配置—Yaml简介.mp4 (45) 5-10 Logging配置文件管理.mp4 (46) 5-11 PageObject设计模式简介.mp4 (47) 5-12 PageObject实践(1)—Capability封装.mp4 (48) 5-13 PageObject实践(2)—公共类封装.mp4 (49) 5-14 PageObject实践(3)—Login模块封装.mp4 (50) 5-15 PageObject实践(4)—unittest用例封装.mp4 (51) 5-2 Yaml数据类型简介.mp4 (52) 5-3 Yaml数据读取.mp4 (53) 5-4 Yaml数据转化.mp4 (54) 5-5 Yaml综合实战—Capability配置数据与代码分离.mp4 (55) 5-6 日志收集概述.mp4 (56) 5-7 Logging模块简介与应用(1) .mp4 (57) 5-8 Logging模块简介与应用(2).mp4 (58) 5-9 Logging模块综合实践.mp4 (6)第六章:Appium综合案例实践;目录中文件数:15个 (59) 6-1 Appium自动化测试框架概述.mp4 (60) 6-10 框架综合实践(9)—RegisterView用例封装.mp4 (61) 6-11 框架综合实践(10)—LoginView用例封装.mp4 (62) 6-12 框架综合实践(11)—用例执行&测试报告生成.mp4 (63) 6-13 框架综合实践(12)—Bat批处理执行测试用例.mp4 (64) 6-14 框架综合实践(13)—jenkins自动化测试平台搭建.mp4 (65) 6-15 本章小结.mp4 (66) 6-2 框架综合实践(1)—driver封装.mp4 (67) 6-3 框架综合实践(2)—公共模块封装.mp4 (68) 6-4 框架综合实践(3)—Login模块封装原理.mp4 (69) 6-5 框架综合实践(4)—Login模块封装实践.mp4 (70) 6-6 框架综合实践(5)—RegisterView模块封装原理.mp4 (71) 6-7 框架综合实践(6)—RegisterView模块创建.mp4 (72) 6-8 框架综合实践(7)—RegisterView模块封装调试.mp4 (73) 6-9 框架综合实践(8)—data数据读取方法封装.mp4 (7)第四章:Appium基础;目录中文件数:35个 (74) 4-1 Appium简介.mp4 (75) 4-10 Appium元素定位—id定位.mp4 (76) 4-11 Appiun元素检测(1).mp4 (77) 4-12 Appiun元素检测(2).mp4 (78) 4-13 id定位综合实践——自动登录(1).mp4 (79) 4-14 id定位综合实践——自动登录(2).mp4 (80) 4-15 Appium元素定位—name与classname定位.mp4 (81) 4-16 Appium元素定位——相对定位.mp4 (82) 4-17 Appium元素定位——xpath定位.mp4 (83) 4-18 Appium元素定位——List定位.mp4 (84) 4-19 List定位综合案例—用户注册(1).mp4 (85) 4-2 Appium组件.mp4 (86) 4-20 List定位综合案例—用户注册(2).mp4 (87) 4-21 Uiautomator元素定位.mp4 (88) 4-22 Appium元素等待.mp4 (89) 4-23 Toast元素识别(1).mp4 (90) 4-24 Toast元素识别(2).mp4 (91) 4-25 屏幕截图.mp4 (92) 4-26 H5元素定位—Context简介.mp4 (93) 4-27 H5元素定位—环境搭建.mp4 (94) 4-28 H5元素定位实践(1).mp4 (95) 4-29 H5元素定位实践(2).mp4 (96) 4-3 Appium环境搭建.mp4 (97) 4-30 Appium滑动操作.mp4 (98) 4-31 连续滑动操作—TouchAction.mp4 (99) 4-32 手势滑动—九宫格滑动实践 .mp4 (100) 4-33 多点触控操作—MultiAction.mp4 (101) 4-34 多点触控实战—百度地图缩放.mp4 (102) 4-35 本章小结.mp4 (103) 4-4 Appium-desktop界面简介.mp4 (104) 4-5 Capability配置简介.mp4 (105) 4-6 Capability配置与启动App.mp4 (106) 4-7 Appium元素定位相关操作.mp4 (107) 4-8 第一个Appium自动化脚本.mp4 (108) 4-9 Appium运行相关报错&解决方案.mp4
    • 625
  • python
    05-01 07:34
    Python数据分析+Python并发编程+Python分布式爬虫框架设计Python基础+Python进阶班 ===============课程目录=============== (1)\Python基础入门升级版 (2)\Python基础入门第三期 (3)\Python数据分析班 (4)\Python爬虫项目班 (5)\Python基础入门升级版\视频;目录中文件数:8个 ├─第1课 Python入门.TS ├─第2课 关键字,容器及访问,循环控制.TS ├─第3课-函数.TS ├─第4课 面向对象基础.TS ├─第5课 文件操作,并发编程及常用系统模块.TS ├─第6课 常用第三方模块及综合实战【Python大作业】.TS ├─第7课 Numpy高效数据处理.TS ├─第8课 Pandas 表格处理.TS (6)\Python基础入门升级版\资料;目录中文件数:9个 ├─lesson1 Python入门.zip ├─lesson2 关键字 容器.zip ├─lesson3 函数.zip ├─lesson4 面向对象基础.zip ├─lesson5 文件操作.zip ├─lesson6 常用第三方库.zip ├─lesson7 numpy数据处理.zip ├─lesson8 pandas表格处理.zip ├─第一课 Python基础入门.pdf (7)\Python基础入门第三期\视频;目录中文件数:9个 ├─第1课 Python入门及环境搭建.TS ├─第2课 Python编程基础(上).TS ├─第3课 Python编程基础(下).TS ├─第4课-函数基础.TS ├─第5课-高级函数.TS ├─第6课 面向对象基础.TS ├─第7课 面向对象高级.TS ├─第8课 文件操作及常用系统模块.TS ├─第9课 Python数据分析.TS (8)\Python基础入门第三期\资料;目录中文件数:7个 ├─Python1.ipynb ├─Python2.ipynb ├─Python3.ipynb ├─Python4.ipynb ├─Python5.ipynb ├─Python6.ipynb ├─Python7.ipynb (9)\Python数据分析班\视频;目录中文件数:10个 ├─第10课 Python深度学习入门.TS ├─第1课 Python和数据分析入门.TS ├─第2课 Numpy.TS ├─第3课 Pandas.TS ├─第4课 数据获取与处理.TS ├─第5课 Matplotlib与数据可视化.TS ├─第6课 Python文本分析.TS ├─第7课 机器学习库Scikit-Learn与应用.TS ├─第8课 Python社交网络分析igraph.TS ├─第9课 Python多线程.TS (10)\Python数据分析班\资料;目录中文件数:18个 ├─lesson7_Python社交网络分析igraph-2017.5.14.zip ├─lesson_4_ipython_notebooks.zip ├─lesson_9_数据比赛案例_codes.zip ├─Python入门.html ├─Python入门.ipynb ├─Python数据分析-第1课Python入门.zip ├─可视化代码.zip ├─第10课 Python分布式计算.pdf ├─第3课 pandas.pdf ├─第6课 使用NLTK进行Python文本分析.pdf ├─第7课 Python社交网络分析igraph.pdf ├─第7课-Python社交网络分析igraph.zip ├─第一课 Python入门.pdf ├─第三课-pandas_code.rar ├─第二课 numpy_code.rar ├─第二课 数据准备与numpy.pdf ├─第五课 数据可视化实战.pdf ├─第八课 Python机器学习scikit-learn.pdf (11)\Python爬虫项目班\视频;目录中文件数:8个 ├─第1课环境准备与入门.TS ├─第2课 Python编程入门.TS ├─第3课 爬虫基础知识与简易爬虫实现.TS ├─第4课 相关库使用与登录问题.TS ├─第5课 Scrapy及相关应用.TS ├─第6课 爬虫设计实战.TS ├─第7课 高级内容-并发编程.TS ├─第8课 分布式爬虫框架设计.TS (12)\Python爬虫项目班\资料;目录中文件数:17个 ├─douban.zip ├─douban_imgs.zip ├─lesson_01_code.zip ├─lesson_02_code.zip ├─lesson_03_code.zip ├─lesson_04_code.zip ├─lesson_07_code.zip ├─lesson_08_code.zip ├─代码.zip ├─第1课 环境准备与入门.pdf ├─第2课 Python编程入门.pdf ├─第3课 爬虫基础知识与简易爬虫实现.pdf ├─第4课 相关库使用与登录问题.pdf ├─第5课 Scrapy及相关应用.pdf ├─第6课 scrapy图片抓取.pdf ├─第7课 高级内容-并发编程.pdf ├─第8课 分布式爬虫框架设计.pdf
    • 617
  • python
    11-08 02:13
  • python
    11-10 05:24
  • python
    01-05 06:45
    《Python爬虫:核心技术、Scrapy框架、分布式爬虫视频教程》Python爬虫:核心技术、Scrapy框架、分布式爬虫视频教程 Java视频教程目录:https://www.237fa.com/ BXG-2018-5 8.95GB 高清视频! 第 一 章:解析Python网络爬虫:核心技术、Scrapy框架、分布式爬虫 1-1 初识爬虫 1-1-1 1.1-爬虫产生背景8 1-1-2 1.2-什么是网络爬虫6 1-1-3 1.3-爬虫的用途 1-1-4 1.4-爬虫分类9 1-2 爬虫的实现原理和技术 1-2-1 2.1-通用爬虫的工作原理1 1-2-2 2.2-聚焦爬虫工作流程2 1-2-3 2.3-通用爬虫抓取网页的详细流程 1-2-4 2.4-通用爬虫网页分类 1-2-5 2.5-robots.txt文件1 1-2-6 2.6-sitemap.xml文件 1-2-7 2.7-反爬应对策略 1-2-8 2.8-为什么选择Python作为爬虫开发语言 1-3 网页请求原理& ~+ \ Y5 K+ Q” @ 1-3-1 3.1_浏览网页的过程 1-3-2 3.2_统一资源定位符URL 1-3-3 3.3_计算机域名系统DNS‘ z* ?) e8 K: }- }7 d” F 1-3-4 3.4_浏览器显示完整页面的过程‘ U5 W- u” X8 L1 y. V- k+ m 1-3-5 3.5_Fiddler工作原理_备份‘ C p” D2 V4 z2 q# L& O0 f, R 1-3-6 3.5_客户端HTTP请求的格式 1-3-7 3.6_服务端HTTP响应格式4 U” O$ G. M4 L0 j 1-3-8 3.7_Fillder代理服务的工作原理– j4 z `% j3 [0 l: @. g1 T 1-3-9 3.8_fidder的下载与安装 1-3-10 3.9_Fiddle界面详解: e. b2 v( u% t 1-3-11 3.10_Fiddler_https配置 1-3-12 3.11_使用Fiddler捕获Chrome的会话 1-4 抓取网页数据3 M A! f. ~, e0 [5 S$ D 1-4-1 4.1_什么是urllib库” M% x’ q: G9 q 1-4-2 4.2_快速抓取一个网页 1-4-3 4.3_分析urlopen方法9 r3 Y/ A” k1 h$ R3 V% [. V) k5 s1 D 1-4-4 4.4_HTTPResponse对象的使用 1-4-5 4.5_构造Request对象 1-4-6 4.6_URL编码转换: m( t6 o( F( @: W 1-4-7 4.7_处理GET请求 1-4-8 4.8_处理POST请求+ X e) Q3 w+ X2 x: C/ ? 1-4-9 4.9_添加特定Headers—请求伪装; l’ y9 v* J2 ?/ N’ c, ^( p 1-4-10 4.10_简单的自定义opener 1-4-11 4.11_设置代理服务器 1-4-12 4.12_超时设置! D5 z4 {7 ?; d 1-4-13 4.13_URLError异常和捕获 1-4-14 4.14_HttpError异常和捕获; o# H. r$ h* N* x7 s’ z 1-4-15 4.15_什么是requests库2 r. H+ [; n/ k6 j” C 1-4-16 4.16_requests库发送请求( L9 H G x3 W’ h K5 k 1-4-17 4.17_requests库返回响应0 ?! f/ m4 ]! v% A 1-5 数据解析) P c: Z, t6 J” W: ^ 1-5-1 5.1_网页数据格式 1-5-2 5.2_查看网页结构 1-5-3 5.3_数据解析技术! Y/ `, Y- R( b0 ^# l 1-5-4 5.4_正则表达式备份* e0 i, G! s# j, E$ E7 q! Z 1-5-5 5.5_什么是Xpath备分) \+ D9 ?, D& M9 i# i! L3 x 1-5-6 5.6_XPath开发工具& H) h5 c2 f3 F# ]$ E, x. l 1-5-7 5.7_XPath语法0 _) {6 C& m2 Q2 |1 B 1-5-8 5.8_什么是lxml库( j. j3 X9 e4 { 1-5-9 5.9_lxml的基本使用+ b” I. i, a’ j: [. B9 j4 V 1-5-10 5.10_什么是BeautifulSoup3 1-5-11 5.11_构建BeautifulSoup对象, }9 q. `! ]’ i1 G7 c( e 1-5-12 5.12_通过操作方法进行解读搜索, x’ s/ |7 }7 B” R3 v 1-5-13 5.13_通过CSS选择器进行搜索 1-5-14 5.14_什么是JSON 1-5-15 5.15_JSON与XML语言比较+ w1 ?& X* R4 E 1-5-16 5.16_json模块介绍3 R& l K) I9 _1 \+ Y& y5 G& N 1-5-17 5.17_json模块基本使用 1-5-18 5.18_jsonpath介绍. u) D. _4 B2 L8 c( l3 H# N% x, M 1-5-19 5.19_JSONPath与XPath语法对比+ x/ z0 z- G5 w3 Y 7 o% X4 b( e: {$ [ 1-6 并发下载( q- p+ O% c2 |’ q5 ? 1-6-1 6.1_多线程爬虫流程分析6 y’ i0 O. w/ k+ Q) L7 | 1-6-2 6.2_queue(队列)模块简介 1-6-3 6.3_Queue类简介5 c0 o: H# i+ E, `+ k- Q* [! ~$ x 1-6-4 6.4_协程爬虫的流程分析6 b% C# J6 ]2 M’ z 1-6-5 6.5_第三方库gevent9 N- l2 F’ A, h1 z) E% _6 \5 m ( g. @- @” J3 X- } 1-7 抓取动态内容‘ T, z( U& y. O% j 1-7-1 7.1_动态网页介绍 1-7-2 7.2_selenium和PhantomJS概述 1-7-3 7.3_selenium_PhantomJS安装配置 1-7-4 7.4_入门操作” |9 C0 f# G2 u 1-7-5 7.5_定位页面元素 1-7-6 7.6_鼠标动作链 1-7-7 7.7_填充表单. J* R7 w4 l” Y0 p! i; ~; X 1-7-8 7.8_弹窗处理 1-7-9 7.9_弹窗处理 1-7-10 7.10_页面的前进和后退 1-7-11 7.11_获取页面Cookies 1-7-12 7.12_页面等待9 ^/ E3 T6 M% R- \2 C; @ 1-8 图像识别与文字处理2 ~+ M( k% ^5 L 1-8-1 8.1_OCR技术简介 1-8-2 8.2_tesseract下载与安装 {) T2 G$ H! u; @$ R0 B2 } 1-8-3 8.3_tesseract下载与安装‘ `% s9 T# {# U- e% ?: J5 Y 1-8-4 8.4_PIL库简介9 Y2 w$ j$ k# O1 z# G7 H% i M 1-8-5 8.5_读取图像中格式规范的文字2 Z$ B6 w8 c8 l8 `. Y) | 1-8-6 8.6_对图片进行阈值过滤和降噪处理1 A8 y; {7 R: w: Q 1-8-7 8.7_识别图像的中文字符8 G: \” n4 e6 `’ X4 K) H 1-8-8 8.8_验证码分类 1-8-9 8.9_简单识别图形验证码 1-9 存储爬虫数据 g8 @4 I+ j5 |/ w2 @) _ 1-9-1 9.1_数据存储简介4 V” F- L! {3 W5 t* v 1-9-2 9.2_什么是MongoDB+ q9 E- [4 R% j+ u% j4 n! }5 y 1-9-3 9.3_Windows平台安装MongoDB数据库 1-9-4 9.4_比较MongoDB和MySQL的术语‘ y+ k. c* G+ s& H h0 m2 L 1-9-5 9.5_什么是PyMongo9 C” u3 _* X3 \# g. B 1-9-6 9.6_PyMongo的基本操作 1-10 初识爬虫框架Scrapy 1-10-1 10.1_常见爬虫框架介绍 1-10-2 10.2_Scrapy框架的架构 1-10-3 10.3_Scrapy框架的运作流程 1-10-4 10.4_安装Scrapy框架” ]/ |2 y” X; {/ u; ^. M) i’ i% ~9 S 1-10-5 10.5_新建一个Scrapy项目; ~4 u6 a0 _, `, D 1-10-6 10.6_明确抓取目标 1-10-7 10.7_制作Spiders爬取网页& V” C; c0 C0 k 1-10-8 10.8_永久性存储数据 javazx.com 1-11 Scrapy终端与核心组件. @5 x5 u+ _3 S) s* E( X* N 1-11-1 11.1_启用Scrapy shell 1-11-2 11.2_使用Scrapy shell 1-11-3 11.3_Spiders—抓取和提取结构化数据 1-11-4 11.4_自定义Item Pipeline 1-11-5 11.5_Downloader Middlewares—防止反爬虫9 W$ t& O D8 Z7 Y” N) A 1-11-6 11.6_Settings—定制Scrapy组件, @! \) z5 C! F: f$ w 1-12 自动抓取网页的爬虫CrawlSpider 1-12-1 12.1_初识爬虫类CrawlSpider! X c# m( J a$ F9 M# e3 v/ [ 1-12-2 12.2_CrawlSpider类的工作原理6 B, h, I! I; ]1 ~- x: V4 z: J 1-12-3 12.3_通过Rule类决定爬取规则3 V3 G- a/ F8 y6 N+ v5 k! ], ~5 z 1-12-4 12.4_通过LinkExtractor类提取链接 2 G, F6 v’ ]& ?6 w. W+ B: i 1-13 Scrapy-Redis分布式爬虫9 \: Y4 u1 d8 ~; j: b$ Q 1-13-1 13.1_Scrapy-Redis简介 1-13-2 13.2_Scrapy-Redis的完整架构% _/ T7 {, s# [# Z3 m5 Z 1-13-3 13.3_Scrapy-Redis的运作流程- P; }! y( o6 n Z 1-13-4 13.4_Scrapy-Redis的主要组件 1-13-5 13.5_安装Scrapy-Redis 1-13-6 13.6_安装和启动Redis数据库& p# i. ~) \) X0 Y 1-13-7 13.7_修改配置文件 redis.conf; w2 P) a” P3 p) d- }2 Y 1-13-8 13.8_分布式策略 1-13-9 13.9_测试Slave端远程连接Master端 1-13-10 13.10_创建Scrapy项目和设置Scrapy-Redis组件 1-13-11 13.11_明确抓取目标 1-13-12 13.12_制作Spider爬取网页 1-13-13 13.13_执行分布式爬虫9 Q$ A3 R6 h/ s( S, b; Y# J 1-13-14 13.14_使用多个管道存储‘ c’ e& y’ |# n1 G! _5 K% u 1-13-15 13.15_处理Redis数据库里的数据5 J- L T2 p:
    • 606
  • python
    01-25 03:13
    Python3+Selenium3自动化测试视频教程unittest视频教程 视频教程详情描述: A0418《Python3+Selenium3自动化测试视频教程unittest视频教程》于Python语言的Selenium自动化测试。使用了目前流行的Python语言结合Selenium3.0技术,也算是填补一下目前培训行业的空白。 视频教程目录: │ webdriver下载地址.txt │ 自动化测试资料.zip │ ├─第 1 章自动化测试课程介绍和课程大纲 │ 课时1:自动化测试课程介绍.mp4 │ ├─第 2 章自动化测试相关软件安装 │ 课时3:自动化测试环境搭建之python3安装.mp4 │ 课时4:自动化测试环境搭建之selenium3安装.mp4 │ 课时5:自动化测试工具selenium验证安装.mp4 │ 课时6:前端知识讲解和工具安装使用.mp4 │ ├─第 3 章测试核心理论知识-(工作面试必备) │ 课时7:必备知识之软件开发生命周期.mp4 │ 课时8:测试相关知识分类讲解.mp4 │ 课时9:自动化测试和手工测试优缺点.mp4 │ ├─第 4 章自动测试selenium精讲实战 │ 课时10:selenium基础实战之定位网页元素技巧上集.mp4 │ 课时11:selenium基础实战之定位网页元素技巧下集.mp4 │ 课时12:selenium实战定位网页元素之CSS定位.mp4 │ 课时13:selenium实战定位网页元素之xpath定位.mp4 │ ├─第 5 章selenium实战之模拟事件处理 javazx.com │ 课时14:自动化测试实战之ActionChains模拟用户行为.mp4 │ 课时15:鼠标事件实战之hover菜单栏弹出.mp4 │ 课时16:多知识点综合实战之模拟用户登录.mp4 │ 课时17:自动化测试实战之网页等待时间.mp4 │ ├─第 6 章自动化测试进阶实战篇幅 │ 课时18:自动化测试实战进阶之网页单选性别资料实战.mp4 │ 课时19:自动化测试之页面常见弹窗处理.mp4 │ 课时20:高级知识点自动化测试之验证码常见解决方案.mp4 │ 课时21:自动化测试实战进阶之cookie操作.mp4 │ 课时22:实战系列之自动化测试错误截图.mp4 │ ├─第 7 章自动化测试必备框架 unittest 单元测试框架实战 │ 课时23:什么是单元测试unittest.mp4 │ 课时24:单元测试框架unittest入门.mp4 │ 课时25:测试套件TestSuite介绍.mp4 │ 课时26:高级实战系列之测试套件TestSuite生成测试报告 上集.mp4 │ 课时27:高级实战系列之测试套件TestSuite生成测试报告 下集.mp4 │ 课时28:Unitest中HTML测试报告优化.mp4 │ ├─第 8 章自动化测试selenium和unittest整合项目实战 │ 课时29:项目实战需求说明.mp4 │ 课时30:自动化测试实战之下单自动化测试.mp4 │ 课时31:分类列表整合unittest自动化测试.mp4 │ 课时32:必备技能之发送测试报告邮件.mp4 │ 课时33:使用python发送邮件实战.mp4 │ 课时34:实战系列使用python发送测试报告邮件和附件.mp4 │ 课时35:自动化测试项目实战整合发送测试报告邮件.mp4 │ └─第 9 章课程总结 课时36:课程总结和常见问题处理.mp4
    • 600
  • python
    02-04 03:42
  • python
    01-31 01:05