怎么获取电商平台商品评论信息？实战案例。_关于电商平台商品评价的代码分析和编译结果图片-CSDN博客

以淘宝和京东为例，官方API是获取评论数据的首选方案，具有数据完整、更新及时、合规性强的特点。

1. 淘宝API实战流程

权限申请：
- 注册淘宝开放平台/万邦开放平台账号，完成企业/个人实名认证。
- 创建应用，申请taobao.item.evaluate.get（商品评价获取）权限，需1-3天审核。

接口调用：

Python示例：

python

	`import requests, hmac, hashlib, time`
	`app_key = "YOUR_APP_KEY"`
	`app_secret = "YOUR_APP_SECRET"`
	`params = {`
	`"method": "taobao.item.evaluate.get",`
	`"app_key": app_key,`
	`"num_iid": "123456789", # 商品ID`
	`"page_no": 1,`
	`"page_size": 20,`
	`"timestamp": str(int(time.time())),`
	`"format": "json",`
	`"v": "2.0"`
	`}`
	`# 生成签名`
	`sorted_params = sorted(params.items())`
	`query_str = ''.join([f"{k}{v}" for k, v in sorted_params if k != "sign"])`
	`signature = hmac.new(app_secret.encode(), (app_secret + query_str + app_secret).encode(), hashlib.sha256).hexdigest()`
	`params["sign"] = signature`
	`# 发送请求`
	`response = requests.get("https://eco.taobao.com/router/rest", params=params)`
	`data = response.json()`
	`comments = data.get("item_evaluate_get_response", {}).get("evaluates", {}).get("evaluate", [])`
	`for comment in comments:`
	`print(f"用户: {comment['user_nick']} \| 时间: {comment['rate_date']}")`
	`print(f"内容: {comment['content']}\n")`

数据解析：
- 提取评论内容（content）、评分（rate_score）、时间（rate_date）等字段。
- 存储建议：结构化数据（如评分、时间）存入MySQL，文本内容存入MongoDB。

2. 京东API核心要点

调用示例：

python

	`import requests, time`
	`def get_jd_comments(sku_id, page_size=50):`
	`all_comments = []`
	`page = 1`
	`while True:`
	`params = {`
	`"skuId": sku_id,`
	`"page": page,`
	`"pageSize": page_size,`
	`"accessToken": "YOUR_TOKEN"`
	`}`
	`response = requests.get("https://api.jd.com/comment", params=params)`
	`data = response.json()`
	`all_comments.extend(data["data"]["comments"])`
	`if len(data["data"]["comments"]) < page_size:`
	`break`
	`page += 1`
	`time.sleep(1) # 避免高频请求`
	`return all_comments`

当API无法满足需求时，爬虫可作为补充，但需谨慎处理反爬机制。

1. 淘宝评论爬虫实战

技术要点：
- 动态参数解析：通过浏览器开发者工具定位评论加载URL，分析时间戳（_ksTS）、页码（currentPage）等参数规律。
- 请求头模拟：设置User-Agent、Referer等字段，避免被识别为爬虫。

Python代码示例：

python

	`import requests, time, json`
	`def get_taobao_comments(item_id):`
	`t_param = time.time()`
	`t_list = str(t_param).split(".")`
	`headers = {`
	`"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36",`
	`"Referer": f"https://item.taobao.com/item.htm?id={item_id}"`
	`}`
	`params = {`
	`"callback": str(int(t_list[1][3:]) + 1),`
	`"_ksTS": t_list[0] + t_list[1][:3] + "_" + t_list[1][3:],`
	`"currentPage": "1"`
	`}`
	`url = f"https://rate.tmall.com/list_detail_rate.htm?itemId={item_id}"`
	`res = requests.get(url, params=params, headers=headers).text`
	`res = res[len(params["callback"]) + 3:-1] # 去除冗余字符`
	`data = json.loads(res)`
	`comments = data["rateDetail"]["rateList"]`
	`for comment in comments:`
	`print(f"内容: {comment['rateContent']}")`

2. 反爬应对策略

适用于无开发能力或需快速获取数据的场景。

1. 服务类型

2. 调用流程