三元和二元序列出现的频率降序病可视化条形图——统计excel某个分组列

读取"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\特征数据\合并后的文件.xlsx"
中‘提问倾向’这一列为‘高阶提问’的行,
对这些所有行的‘行为类别’这一列的数据进行扫描,
分别以每次两行和每次三行为窗口滑动扫描 得到二元的和三元的序列组,
再做降序排序平打印

import pandas as pd
from collections import Counter

# 读取Excel文件
file_path = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\特征数据\合并后的文件.xlsx"
data = pd.ExcelFile(file_path).parse("Sheet1")  # 调整 sheet 名称为实际需要的

# 筛选出“提问倾向”为“高阶提问”的行
filtered_data = data[data['提问倾向'] == '高阶提问']

# 提取“行为类别”列
behavior_sequences = filtered_data['行为类别'].tolist()

# 滑动窗口生成二元和三元序列
def generate_sequences(sequence, window_size):
    return [tuple(sequence[i:i+window_size]) for i in range(len(sequence) - window_size + 1)]

# 生成二元序列
bigrams = gene
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

东方-教育技术博主

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值