
NLP
自然语言处理
coco_1998_2
所有出自我手底下的东西,我自己收益最丰--侯俊杰
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python jieba分词模块的基本用法
jieba(结巴)是一个强大的分词库,完美支持中文分词,本文对其基本用法做一个简要总结。 安装jieba pip install jieba 简单用法 结巴分词分为三种模式:精确模式(默认)、全模式和搜索引擎模式,下面对这三种模式分别举例介绍: 精确模式 import jieba s = u'我想和女朋友一起去北京故宫博物院参观和闲逛。' cut = jieba.cut(s) ...转载 2019-01-13 14:15:22 · 268 阅读 · 0 评论 -
TextRank
TextRank与PageRank TextRank的灵感来源于大名鼎鼎的PageRank算法,这是一个用作网页重要度排序的算法。 这个算法是基于图的,每个网页可以看作是一个图中的结点,如果网页A能够跳转到网页B,那么则有一条A->B的有向边。这样,我们就可以构造出一个有向图了。然后,利用公式: 经过多次迭代就可以获得每个网页对应的权重。下面是公式每个元素的含义: 可以发现,...转载 2019-02-26 11:43:52 · 5556 阅读 · 0 评论