MediaCrawler/docs/常见问题.md

20 lines
919 B
Markdown
Raw Normal View History

2023-12-07 16:25:06 +00:00
## 常见程序运行出错问题
2024-03-19 14:48:39 +00:00
Q: 爬取抖音报错: `execjs._exceptions.ProgramError: SyntaxError: 缺少 ';'`
A: 该错误为缺少 nodejs 环境这个错误安装 nodejs 环境即可,版本为:`v16.8.0`
2023-12-07 16:25:06 +00:00
2024-03-19 14:48:39 +00:00
Q: 可以指定关键词爬取吗?
A: 在config/base_config.py 中 KEYWORDS 参数用于控制需要爬去的关键词
2023-12-07 16:25:06 +00:00
2024-03-19 14:48:39 +00:00
Q: 可以指定帖子爬去吗?
A在config/base_config.py 中 XHS_SPECIFIED_ID_LIST 参数用于控制需要指定爬去的帖子ID列表
2023-12-07 16:25:06 +00:00
2024-03-19 14:48:39 +00:00
Q: 刚开始能爬取数据,过一段时间就是失效了?
A出现这种情况多半是由于你的账号触发了平台风控机制了请勿大规模对平台进行爬虫影响平台。
2023-12-07 16:25:06 +00:00
2024-03-19 14:48:39 +00:00
Q: 如何更换登录账号?
A删除项目根目录下的 brower_data/ 文件夹即可
2023-12-09 05:56:18 +00:00
2024-03-19 14:48:39 +00:00
Q: 报错 `playwright._impl._api_types.TimeoutError: Timeout 30000ms exceeded.`
A: 出现这种情况检查下开梯子没有