MediaCrawler/media_platform/kuaishou/graphql.py

34 lines
1.4 KiB
Python
Raw Permalink Normal View History

# 声明:本代码仅供学习和研究目的使用。使用者应遵守以下原则:
# 1. 不得用于任何商业用途。
# 2. 使用时应遵守目标平台的使用条款和robots.txt规则。
# 3. 不得进行大规模爬取或对平台造成运营干扰。
# 4. 应合理控制请求频率,避免给目标平台带来不必要的负担。
# 5. 不得用于任何非法或不当的用途。
#
# 详细许可条款请参阅项目根目录下的LICENSE文件。
# 使用本代码即表示您同意遵守上述原则和LICENSE中的所有条款。
2023-11-24 16:02:33 +00:00
# 快手的数据传输是基于GraphQL实现的
# 这个类负责获取一些GraphQL的schema
2023-12-02 08:14:36 +00:00
from typing import Dict
2023-11-24 16:02:33 +00:00
class KuaiShouGraphQL:
graphql_queries: Dict[str, str]= {}
2023-11-24 16:02:33 +00:00
def __init__(self):
self.graphql_dir = "media_platform/kuaishou/graphql/"
self.load_graphql_queries()
def load_graphql_queries(self):
graphql_files = ["search_query.graphql", "video_detail.graphql", "comment_list.graphql", "vision_profile.graphql","vision_profile_photo_list.graphql","vision_profile_user_list.graphql","vision_sub_comment_list.graphql"]
2023-11-24 16:02:33 +00:00
for file in graphql_files:
with open(self.graphql_dir + file, mode="r") as f:
query_name = file.split(".")[0]
self.graphql_queries[query_name] = f.read()
def get(self, query_name: str) -> str:
return self.graphql_queries.get(query_name, "Query not found")