Python3网络爬虫课程2.1爬虫基础

Python3网络爬虫课程

爬虫基础

HTTP基本原理

响应状态码

响应头

响应体

请求方法

请求网址

请求头

请求体

打开凤凰新闻,查看更多高清图片

URI和URL

超文本

HTTP和HTTPS

HTTP请求过程

请求

响应

网页基础

html

css

javascript

网页的组成

网页的结构

节点树与节点间的关系

选择器

爬虫的基本原理

获取网页

提取信息

保存数据

自动化程序

概述

抓到怎样的数据

Javascript渲染页面

Session和Cookie

session

cookie

会话维持

属性结构

会话cookie和持久cookie

静态网页和动态网页

无状态http

常见误区

代理

基本原理

代理的作用

爬虫代理

代理分类

常见代理设置