diff --git a/config/base_config.py b/config/base_config.py index fe0d783..1493d15 100644 --- a/config/base_config.py +++ b/config/base_config.py @@ -6,7 +6,7 @@ COOKIES = "" CRAWLER_TYPE = "search" # 是否开启 IP 代理 -ENABLE_IP_PROXY = True +ENABLE_IP_PROXY = False # 代理IP池数量 IP_PROXY_POOL_COUNT = 2 diff --git a/docs/代理使用.md b/docs/代理使用.md index 66ffb24..cc9c729 100644 --- a/docs/代理使用.md +++ b/docs/代理使用.md @@ -1,3 +1,33 @@ -## 文档教程待补充 todo +## 代理 IP 使用说明 +> 还是得跟大家再次强调下,不要对一些自媒体平台进行大规模爬虫或其他非法行为,要踩缝纫机的哦🤣 +### 简易的流程图 + +![代理 IP 使用流程图](../static/images/代理IP%20流程图.drawio.png) + +### 准备代理 IP 信息 +点击 极速HTTP代理 官网注册并实名认证(国内使用代理 IP 必须要实名,懂的都懂) + +### 获取 IP 提取链接 +> 每个人注册并实名认证后都会送一定的余额。(当然有些网站上也有一些免费的IP,但失效时间极快,也体验过一些免费的 IP 代理池,轮询去找一个可用IP都得半天) + +在IP提取页面点击生成 API 链接,这样就会生成一个跟你账号相关的IP提取的链接,其中我们只需要关注2个参数
+`key`、`crypto`,比如下面这张图中`key=w3q**********` `crypto=2f945*********` + +![img.png](../static/images/IP_提取图.png) + +### 将提取密钥参数 key crypto 写入环境变量 +> 或者直接在代码中填写 `key` 和 `crypto` 的值 + +![img_1.png](../static/images/修改代理密钥.png) + + +### 将配置文件中的`ENABLE_IP_PROXY`置为 `True` +> `IP_PROXY_POOL_COUNT` 池子中 IP 的数量 + + +### 其他说明 +> 代理IP池使用了redis来缓存IP和记录过期时间 +> 使用 chatgpt 快速询问如何安装 redis 并设置密码 + + -#### 喜欢研究代码的,可以先结合代码以及极速HTTP代理配置 \ No newline at end of file diff --git a/static/images/IP_提取图.png b/static/images/IP_提取图.png new file mode 100644 index 0000000..e15de57 Binary files /dev/null and b/static/images/IP_提取图.png differ diff --git a/static/images/代理IP 流程图.drawio.png b/static/images/代理IP 流程图.drawio.png new file mode 100644 index 0000000..fefa563 Binary files /dev/null and b/static/images/代理IP 流程图.drawio.png differ diff --git a/static/images/修改代理密钥.png b/static/images/修改代理密钥.png new file mode 100644 index 0000000..d8b70d2 Binary files /dev/null and b/static/images/修改代理密钥.png differ