
太普
太普太普
太普数据挖掘套件
数据挖掘套件数据挖掘套件
数据挖掘套件
(
((
(TIP DM Suite
TIP DM SuiteTIP DM Suite
TIP DM Suite,
,,
,TipDM
TipDMTipDM
TipDM)
))
)
用户手册
用户手册用户手册
用户手册
文件状态:
[ ]
草稿
[
√
]
正式发布
[ ]
正在修改
[ ]
作废
文件标识:
TipDM_011
当前版本:
1.3.0
作
者:
研发部
参
与
者:
完成日期:
2011-04-15
太普软件
太普软件太普软件
太普软件(
((
(www.tipdm.com
www.tipdm.comwww.tipdm.com
www.tipdm.com)
))
)

太普数据挖掘套件
(TIP DM Suite
,
TipDM)
文档编号
: TipDM_011
保密 太普数据挖掘套件(TIP DM Suite),在线网址:www.tipdm.cn 第
2
页
文档变更记录
文档变更记录文档变更记录
文档变更记录
序号 主要更改内容 版本号
更改人 更改时间
1 第一次发布 1.0.0 研发部 2010-03-18
2 增加误差分析,操作流程 1.1.0 研发部 2010-05-12
3 增加主成分分析、相关性分析等 1.2.0 研发部 2010-09-24
4 界面框架优化 1.3.0 研发部 2011-04-15
5
6

太普数据挖掘套件
(TIP DM Suite
,
TipDM)
文档编号
: TipDM_011
保密 太普数据挖掘套件(TIP DM Suite),在线网址:www.tipdm.cn 第
3
页
目录
1.
引言
............................................................................................................................... 4
1.1.
产品简介
................................................................................................................... 4
1.2.
技术支持
................................................................................................................... 5
1.3.
在线试用
................................................................................................................... 5
2.
操作指南
....................................................................................................................... 5
2.1.
创建一个简单的数据挖掘模型
............................................................................... 6
2.2.
如何创建一个数据挖掘模型
................................................................................. 11
2.3.
如何创建和打开一个方案
..................................................................................... 12
2.4.
如何在方案中加载数据
......................................................................................... 13
2.5.
当前方案该选用哪种算法
..................................................................................... 14
2.6.
如何进行预测建模
................................................................................................. 15
3.
操作说明
..................................................................................................................... 16
3.1.
操作流程
................................................................................................................. 16
3.2.
登录
......................................................................................................................... 17
3.3.
主界面
..................................................................................................................... 18
3.4.
快捷通道
................................................................................................................. 19
3.5.
菜单
......................................................................................................................... 19
3.5.1.
菜单用法
............................................................................................................. 19
3.5.2.
数据探索
............................................................................................................. 20
3.5.3.
预处理
................................................................................................................. 20
3.5.4.
预测建模
............................................................................................................. 20
3.5.5.
信息管理
............................................................................................................. 21
3.5.6.
系统管理
............................................................................................................. 21
4.
名词术语
..................................................................................................................... 22
4.1.
分类与回归
............................................................................................................. 22
4.2.
聚类分析
................................................................................................................. 22
4.3.
关联规则
................................................................................................................. 22
4.4.
时序模式
................................................................................................................. 22
4.5.
偏差检测
................................................................................................................. 23
4.6.
泛化能力
................................................................................................................. 23
4.7.
交叉验证
................................................................................................................. 23
4.8.
支持度和置信度
..................................................................................................... 23
5.
应用示例
..................................................................................................................... 24
5.1.
基于 C4.5 决策树的水质分类预测
....................................................................... 24
5.2.
基于 GM 灰色理论的基坑变形预测
....................................................................... 31
5.3.
更多应用示例
......................................................................................................... 36
6.
常见问题
..................................................................................................................... 36
6.1.
在地址栏中输入网址后,网页弹开之后马上自动关闭
..................................... 36

太普数据挖掘套件
(TIP DM Suite
,
TipDM)
文档编号
: TipDM_011
保密 太普数据挖掘套件(TIP DM Suite),在线网址:www.tipdm.cn 第
4
页
1.
1.1.
1. 引言
引言引言
引言
1.1.
1.1.1.1.
1.1. 产品简介
产品简介产品简介
产品简介
太普数据挖掘套件(TIP DM Suite,TipDM)是广州太普软件自主研发的一个数据挖掘工具,使
用 JAVA 语言开发,能从各种数据源获取数据,建立各种不同的数据挖掘模型(目前已集成数十种预
测算法和分析技术,基本覆盖了国外主流挖掘系统支持的算法,用户也可以嵌入其它自己开发的任
何算法),使用 TipDM 操作接口进行数据挖掘工作。工具支持数据挖掘流程所需的主要过程,完成包
括对数据进行预处理,包括空值处理、降维处理、离
散
处理,
因子
分析、主成分分析、
抽样
、过
滤
等,创建、
训练
、
评估
模型,预测,
修
改模型
参
数,误差分析等一系
列功
能。
TipDM 以数据挖掘技术
为核心
,
并提供
开
放
的应用接口,能
够满足企业复杂
的应用需
求
。
随着
企业
信息化建
设
的
深
入,TipDM
必将
成
为企业
数据分析的
得
力
助手
,
为企业带来很好
的
经济效益
和
社会效益
。
TipDM
提供
个人版、
企业
版、嵌入版和
教
研版等
四
个版本,以
满足
不同需
求
类型
客
户需要。
个人
个人个人
个人版
版版
版(
((
(TipDM
TipDMTipDM
TipDM-
--
-Per
PerPer
Per)
))
)
:
个人版
(
TipDM-Pe
rson)
即
数据挖掘在线(
www
.tip
dm
.
cn
),不用
安
装
系统,用户可
直
接在线使用,
适合有
数据挖掘研
究
需要的单
位及
个人。
利
用系统
提供
的
方案管理、数据管理、数据预处理、数据探索、预测建模、模型
评价
等
功
能,快
速
引
导
用
个人版
TipDM-Per
太普数据挖掘套件
TIP DM Suite(TipDM)
企业版
TipDM-Ent
教研版
TipDM-Res
嵌入版
TipDM-Plug

太普数据挖掘套件
(TIP DM Suite
,
TipDM)
文档编号
: TipDM_011
保密 太普数据挖掘套件(TIP DM Suite),在线网址:www.tipdm.cn 第
5
页
户
实现
数据挖掘建模,同时
结合
系统自
带
的数据挖掘
教
程
及参考
案例,可快
速
输
出
用户所
需的预测分析
报告
,是
辅助
用户进行
科学
研
究
和应用开发的
最佳
选
择
工具。。
企业
企业企业
企业版
版版
版(
((
(TipDM
TipDMTipDM
TipDM-
--
-Ent
EntEnt
Ent)
))
)
:企业
版
(
TipDM-
En
te
r
p
r
i
s
e
)适合有
数据挖掘分析需要的
企业
,
项
目
框架
来
源于目前太普数据挖掘
平台
的
B/
S版本,
即
在
此平台
框架
下
,
保
持
现有
应用框架、
核
心
算法、基本
功
能模
块
,增加
业务功
能,进行快
速二
次开发。对于
科
研单
位
,可
协助企业
完成
知识
产
权
、
专利
的
申请
。
嵌入版
嵌入版嵌入版
嵌入版(
((
(TipDM
TipDMTipDM
TipDM-
--
-Plug
PlugPlug
Plug)
))
)
:
嵌入版
(
TipDM-P
l
u
g
i
n)
适合
第
三
方集成
商有
数据挖掘应用需要,
但
本
身缺乏这
方面的技术
资
源,在
投
入
较少
成本的前
提下
,
利
TipDM
提供
的各类数据挖掘算
法
标准
接口,快
速实现
数据挖掘应用的开发。TipDM嵌入版
提供
降维处理、空值处理、数据
规
约
、
特征提
取、相关性分析、主成分分析,以
及
常用预测建模算法和误差分析方法等
标
准
接口,
并配备详细
接口开发
文档
。
教研
教研教研
教研版
版版
版(
((
(TipDM
TipDMTipDM
TipDM-
--
-
Res
ResRes
Res)
))
)
:教
研版
(
TipDM-
R
e
s
e
arch)
主要
适合高校及科
研
院
所
教学及科学
研
究
,
数据挖掘技术
近年来越来越受到
人
们
的
重视
,
她被认为
是21
世纪最
具
有
发
展
前
途
的
领域
。
因此
国内不
少高校将此
内容引入本
科教学
中,在自动化、
电子
信息、
金融
等
专业
开
设
了数
据挖掘技术相关的
课
程。
由
于
条
件和
学
时所
限
,
这些
内容的
教学
主要
限
于理论介
绍
。
因为
抽象
,
学生
理
解起来往往比较困难
,
教学效果
不
甚
理
想
。基于以上
原因
,
公司推出
了
适合
高校教学
的数据挖掘
教学
套件,该套件
除
了
提供
数据挖掘建模软件,同时
协助教师构
建
特
定专业
的预测模型
及编写
相应
实
验指
导书
。
1.2.
1.2.1.2.
1.2. 技术支持
技术支持技术支持
技术支持
感谢您
选
择
广州太普软件
公司
的数据挖掘产品,在系统的使用过程中如
果遇到
问题,
请
通过如
下
的方式与
我们
联系,
我们将为
用户
提供周到满意
的
服务
。
主页
主页主页
主页
:
http://www.tipdm.com
传真
传真传真
传真
:
020-28871586
电话
电话电话
电话
:
40068-40020
地址
地址地址
地址
:
广州
市经济
技术开发
区科学城科珠路
232 号 2
栋
410
邮编
邮编邮编
邮编
:
510663
邮箱
邮箱邮箱
邮箱
:s
e
rv
i
c
e
@
5i
a
i.
com
1.3.
1.3.1.3.
1.3. 在线试用
在线试用在线试用
在线试用
h
ttp
://www
.tip
dm
.
cn
2.
2.2.
2. 操作指南
操作指南操作指南
操作指南