讲的是孔子后人的故事。一个老领导回到家乡,跟儿子感情不和,跟贪财的孙子孔为本和睦。 老领导的弟弟魏宗万是赶马车的。 有个洋妞大概是考察民俗的,在他们家过年。 孔为本总想出国,被爷爷教育了。 最后,一家人基本和解。 顺便问另一类电影,北京青年电影制片厂的。中越战背景。一军人被介绍了一个对象,去相亲。女方是军队医院的护士,犹豫不决,总是在回忆战场上负伤的男友,好像还没死。最后 男方表示理解,归队了。
不至于吧,离开这个破公司就没有课题可以做了? 谢谢大家的关心,她昨天晚上睡的很好。MM她自己已经想好了。见机行事吧,拿到相关的能出来做论文的材料,就马上辞职。 唉!看看吧,说不定还要各为XDJM帮出出找工作的主意呢。MM学通信的,哈尔滨工程大学的研究生,不想在哈碌碌无为的做设计,因此才出来的。先谢谢了啊。!!! 本人语文不好,没加标点。辛苦那些看不懂的XDJM么了。
生一个玩玩,不好玩了就送人 第一,你要知道,你们恋爱前,你爹妈对她是毫无意义的。没道理你爹妈就要求她生孩子,她就得听话。换句话说,你岳父母要未来孩子跟妈姓,你做的到吗?夫妻是平等的。如果你没办法答应岳父母,她干吗答应你爹妈呢? 第二,有了孩子你养不养的起?不是说想生就生,图你爹妈一个高兴,如果没有房子,没有充足的财力,生孩子只会带给你们更多的困难,生小孩容易,养小孩难啊。
微软中国研发啥?本地化? 新浪科技讯 8月24日晚10点,微软中国对外宣布说,在2006财年(2005年7月-2006年6月),公司将在中国招聘约800名新员工。 其中,一半以上的新聘人员将为研发人员,其他将是销售、市场和服务人员。同时,有近300个职位将面向新毕业的大学本科生、硕士研究生、MBA和博士生。 在2005财年,微软在中国的业务取得了骄人成绩,成为微软全球增长速度最快的子公司之一。
要是他老怕跟你说话耽误时间 你可得赶紧纠正他这个观点 标 题: Re: 今天晚上的事情,有点郁闷 这个...其实以前有问题的时候都是当面解决,后来他说你有什么想不通的可以到板上去 问问别人,然后你就知道是谁不对了,所以这次我就来问,我觉得挺好,避免正面冲突, 他最怕耽误他时间,这样正好也不耽误他时间,也解了我的心结 : 感觉这两人都不够坦诚 : gg郁闷了就找mm别扭 : mm别扭了就到版上哭诉 -- 淡泊以明志,宁静以至远
有病! 亲爱的全体清华MM: 你们好!我的个人情况,相信你们都已经熟悉了.如果有不熟悉的,可以在水木未明上找朋友们了解.总之,我的条件是不错的.应该属于又帅又有钱的那种类型吧. 久闻天下美女数北京,北京美女在清华。说实话,你们和我身边的那些北大mm是完全没有可比性的,说句不好听的,我身边的mm,除了是个女的,就什么也不是了.我生活在这样的环境里,是一种悲剧.希望众清华mm同情理解.
你以前是不是来发过贴子 我和我老婆是异地恋,差不多是第一代网恋吧,有5年多的历史了。去年年底登记结婚,最近发生的很多事情,突然让我觉得我们的婚姻和感情会不可靠。 我是一个乙肝病毒携带者,俗称小三阳。身体状态良好。本来没有什么,她打过乙肝疫苗,有抗体。什么情况都不会发生。 但是她妈妈无法接受,一次次吓唬她,一次次用极其极端的话来威胁她。
是生的啊...... 晕倒 标 题: Re: show一下今晚做的剁椒土豆泥 不好意思,我不是说土豆是蒸的,我是说葱花。 应该放生的,最多开水烫一下(烫葱花的操作没听说过吧?我发明的) : 我确实是蒸的土豆不是煮的,怎么看出来的啊...... : 后来是用锅下油炒的 -- 高尚的人追求事业与爱情 平庸的人渴望金钱与美女 卑鄙的人则充满铜臭和情欲 问题是:有区别吗?
记忆中教父笑过这么几次: 一次是女儿婚礼照相时, 一次是见到他的义子-那个歌手时, 一次是看到麦克在医院守护自己时, 一次是在和麦克的儿子,就是自己的孙子嬉戏时,就在这最开心的时刻死去 《教父》是十多年前在学校的录像厅看得,此后一直想再看一遍,可是一直没有看。忘得差不多了: 教父的那张从来不笑的脸。感觉他的下巴略微外突。 那个电影制片早上醒来看到他床上放着的马头。感觉教父解决问题真干脆利落
我公司为北京一高新技术企业,主要从事石油、石化设备、工艺技术研发,现想招一名化工工艺或化学工程、石油加工等专业工程师一名,待遇优厚。要求最好有两年以上石化炼厂工作经验,熟悉工艺计算和化工装置调试等,本科以上学历,有意者请发简历至:[email protected]或[email protected],勿回站内,电话:13321199559多谢,公司网址:www.newbaron.com 现在学工艺的真难找吗,不应该啊
北京售票员可厉害,嘿嘿,有专座的,会直接拉着脖子指着鼻子让上面的人站起来让 座的,呵呵,比较赞。。。 杭州就是很少有人给让座,除非司机要求乘客那样做。 五一去杭州一个景点玩,车上有两个不到一岁的小孩,就是没有人给让座,没办法家长只能在车上把小孩的推车打开让孩子坐进去,但是孩子还是闹,只能抱着,景点离市区很远,车上很颠,最后家长坐在地上抱孩子,就是没有一个人给让座,要是在北京,一上车就有人让座了
这其实是男女之间心理不同的缘故, 现实中男人们都在追到女人时通常都觉的高潮结束了, 认为自己已经成功了,不需要在付出太大努力了,只要维持住就行了。 不同的是女人在答应和男人交往的时候会认为一切才刚刚开始。 这一个开始一个结束便是造成这种局面的原因, 说到底还是男女的心理不同。 谈恋爱时一个样,恋爱后另一个样。 追你可能是和另一个竞赛,追到就成功了。 这个世上有没有真正爱一个mm的,一辈子?
其实北京人对外地人的歧视是客观存在的。 但这种存在是绝对不合理的。 歧视永远都不合理。 现在之所以还存在,只是因为还存在各种各样的问题。 但北京人在遇到了问题的时候, 总不想着如何去解决问题, 来一句“都是因为外地人!” 好了,这样就OK了,有了推卸责任的地方。 却不知问题却还在那里。 就象前些日子的所谓限制低素质人口政策。 还是你这位仁兄素质高 了不起 本来不太相信和认可楼主的话
除了sohu内部的部分员工对sohu了解,其他的人基本上不了解 发在这里产生不了很深入细致的讨论 另外想让sohu 领导看见很容易的,在这里不是最有效的办法 标 题: Re: 对搜狐公司的一些建议(原创) 因为这里可以引发大家的讨论,我想看看大家的意见 另外,我希望搜狐公司的领导能看到我的这篇文章 : 为什么发在这里阿 : ? --
不懂,无法理解。唉~ 也许我的智商太低了。 在一起三年了,我们走过了那么多的艰难困苦终于幸福的在一起了,然而却在最幸福的时候分手了。 好奇怪的感觉,彼此都能感觉到对方的爱,分手的话说到最后竟都变成了种种的嘱咐和担心,心里像被刀割,还是宁愿gg说他已经不爱我了,也许那样心里还会坦然一些。每天每时每刻一想到gg以后没有人照顾了,好多事情都要自己想办法我心里
基于SVM的中文邮件分类
需积分: 0 162 浏览量
更新于2022-04-19
3
收藏 1.24MB ZIP 举报
**基于SVM的中文邮件分类**
支持向量机(Support Vector Machine,简称SVM)是一种在机器学习领域广泛应用的监督学习算法,尤其在文本分类、情感分析和图像识别等方面表现出色。在这个“基于SVM的中文邮件分类”项目中,我们将深入探讨如何利用SVM来对中文邮件进行有效分类。
**一、SVM基础理论**
SVM的核心思想是找到一个最优超平面,该超平面能够将不同类别的样本点分隔开来,并且最大化两类样本之间的间隔。在二维空间中,这可以理解为找到一个直线或曲线,使得各类样本点分别位于直线两侧,且距离直线最远。在高维空间中,这个超平面则可能是一个超平面或高维的决策边界。
**二、中文邮件预处理**
在对中文邮件进行分类之前,需要对邮件内容进行预处理,包括:
1. **分词**:中文文本不同于英文,没有明显的空格分隔,因此需要使用分词工具,如jieba分词库,将连续的汉字序列切分成具有语义意义的词汇。
2. **去除停用词**:常见的停用词,如“的”、“是”等,对分类影响不大,需要被移除。
3. **词干提取和词形还原**:减少词汇变形的影响,如将“跑”、“跑步”、“跑了”都还原为词根“跑”。
4. **构建词袋模型(Bag-of-Words,BoW)**:将处理后的词汇转换为频率矩阵,表示邮件的特征。
5. **TF-IDF(Term Frequency-Inverse Document Frequency)**:进一步量化每个词汇的重要性,降低常见词汇的权重,提高稀有词汇的权重。
**三、SVM模型训练与优化**
1. **选择核函数**:SVM的性能很大程度上取决于所选的核函数,常见的有线性核、多项式核、高斯核(RBF)等。对于非线性可分的问题,RBF核通常表现较好。
2. **参数调优**:包括C(惩罚参数)和γ(RBF核的宽度)的选择,可以通过网格搜索或随机搜索等方法进行优化。
3. **训练与验证**:使用训练集训练SVM模型,然后在验证集上评估模型性能,如准确率、召回率、F1分数等。
4. **过拟合与欠拟合**:观察模型在训练集和验证集上的性能差异,避免过拟合(对训练数据拟合过度,泛化能力弱)和欠拟合(模型简单,无法捕捉数据本质)。
**四、测试与部署**
1. **测试集评估**:最终使用独立的测试集评估模型的泛化能力,确保模型在未见过的数据上也能有良好表现。
2. **模型部署**:将训练好的模型集成到实际应用中,对新邮件进行实时分类。
在“nlp-practices”这个压缩包文件中,可能包含了实现以上步骤的代码示例和数据样本集,你可以通过阅读和运行这些代码,更深入地理解和支持向量机在中文邮件分类中的应用。同时,这也为你提供了实践和学习机器学习、自然语言处理(NLP)以及人工智能相关技术的机会。

picacho_pkq
- 粉丝: 82
最新资源
- 毕设&课设:C++ 实现太阳系行星系统.zip
- 车辆安全距离触发的紧急换道模拟:MATLAB与Carsim联合仿真研究五次多项式换道轨迹控制效果
- 车辆状态估计模型EKFAEKF:基于Carsim和Simulink联合仿真的研究及应用
- 模拟IC设计:10100Mbps以太网PHY系统级电路及Cadence版图(Gpdk90nm与Gpdk180nm工艺)
- 光伏三相并网逆变器的MPPT控制与两级式并网模型仿真研究
- 基于多智能体算法的电力系统分布式经济调度策略:复现过程与实践效果探究(10个发电单元与19个柔性负荷单元的优化配置)
- 基于FLAC3D的随机裂隙网络模拟与力学行为分析
- 基于定子磁场定向矢量控制的异步电机磁链观测模型研究与应用 - 在线参数辨识
- 格子波尔兹曼方法(LBM)在多孔介质中甲烷吸附解吸过程研究及文献复现
- 纯电动汽车整车MatlabSimulink仿真模型(含电机、电池、变速器、驾驶员及整车动力学模型)——总成参数齐全,可直接运行仿真 · Simulink
- 基于TTC算法与五次多项式的车辆换道轨迹控制研究及Matlab-CarSim联合仿真 - CarSim
- 基于VSG的分布式能源并网仿真:并网逆变器、有功频率与无功电压控制及MATLAB2016b实现
- 光伏Boost电路与VSG控制策略的Simulink并网仿真模型及其应用 核心版
- 西门子PLC1500智能物流分拣系统仿真设计说明及编程解决方案(博图v16+CAD图纸)
- 吹胀式蒸发器的设计计算.docx
- JDK11Windows版安装包