读取"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\特征数据\合并后的文件.xlsx"
中‘提问倾向’这一列为‘高阶提问’的行,
对这些所有行的‘行为类别’这一列的数据做前后序列的统计,画热力图,热力图横轴为先出现过的,纵轴为后出现的,热力图代码可以参考:
https://blog.csdn.net/qq_41517071/article/details/128764303
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib import rcParams
# 设置中文字体,确保显示中文
rcParams['font.sans-serif'] = ['SimHei'] # 使用黑体
rcParams['axes.unicode_minus'] = False # 解决负号显示问题
# Load the Excel file (上传数据文件以便处理)
file_path = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\特征数据\合并后的文件.xlsx"
data = pd.ExcelFile(file_path).parse("Sheet1") # 调整 sheet 名称为实际需要的
# 筛选“提问倾向”为“高阶提问”的行
filtered_data = data[data['提问倾向