博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Rattle :基于R的数据挖掘工具:功能概览
阅读量:4255 次
发布时间:2019-05-26

本文共 834 字,大约阅读时间需要 2 分钟。

Rattle的界面,依次排列的是菜单,工具栏和标签栏。

 

1.Rattle的标签栏


一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996)

(1) 理解问题

(2) 理解数据

(3) 准备数据

(4) 建立模型

(5) 模型评估

(6) 运用


基于这个流程,Rattle开发了一个方便的标签栏,可以便捷的完成操作。


这个标签栏从左到右依次排列,各自完成数据挖掘的一个相关步骤。


Data:选择数据源,输入数据。

Explore:执行数据探索,理解数据分布。

Test:提供各种统计检验。

Transform:变换数据的形式。

Cluster:数据聚类,包括系统聚类,k-均值聚类,和双聚类(biclustering)。

Associate:关联规则方法。

Model:内容最丰富的一个标签。包括多种方法:决策树,支持向量机,线性模型,

神经网络,随机森林,提升(Boost)。

 
Evaluate:模型评估,它会提供一个实际结果和预测结果进行比较的误差矩阵。

Log:数据挖掘过程的纪录。它可以给出所进行的Rattle操作的R代码,利用这个标签,可以学习R的数据挖掘过程,也可以把纪录以文本形式输出,在R 平台中实现R和Rattle的交互。


2.Rattle的工具栏和菜单

 Rattle工具栏上最主要的一个按钮是Execute按钮(执行)。所有的操作都要点击Execute来完成(对应的快捷键是F2)。


Report按钮,可以完成当前操作的格式化报告(以开放的标准ODT格式)。

Export按钮,可以输出来自Rattle的各种对象,特别的,完成Moel标签的相关操作后,它会以PMML格式保存当前模型。


Rattle工具栏和标签栏完成的大部分工作,使用菜单也可以完成。菜单很平凡,特别要指出的一点是,setting菜单中的Use Cario Graphics Device这一项要选中,这样图形才会以Rattle图形设备的形式输出,否则,会作为R图形输出。
你可能感兴趣的文章
【Ubuntu】ping: unknown host www.baidu.com
查看>>
【Qt】qss样式表之:QCalendarWidget,日历窗口样式表设置
查看>>
【Qt】qss样式表之:自定义属性实现动态切换样式
查看>>
【GStreamer】基本概念及安装
查看>>
【GStreamer】gstreamer工具详解之:gst-launch-1.0
查看>>
【GStreamer】gstreamer工具详解之:gst-inspect-1.0
查看>>
【GStreamer】gstreamer工具详解之:ges-launch-1.0
查看>>
【GStreamer】gstreamer工具详解之:gst-discoverer-1.0
查看>>
【Ubuntu】安装中文输入法
查看>>
【Cmake】执行cmake命令时报错:No XSLT processor found
查看>>
【数据库】sqlite中PRAGMA命令说明
查看>>
【Qt】Qt容器总结
查看>>
【C++】C++11 STL算法(一):非修改序列操作(Non-modifying sequence operations)
查看>>
【C++】C++11 STL算法(二):修改序列的操作(Modifying sequence operations)
查看>>
【C++】C++11 STL算法(三):分隔操作(Partitioning operations)、排序操作(Sorting operations)
查看>>
【C++】C++11 STL算法(四):二分查找法(Binary search operations)、合并操作
查看>>
【C++】C++11 STL算法(五):设置操作(Set operations)、堆操作(Heap operations)
查看>>
【C++】C++11 STL算法(六):最小/最大操作(Minimum/maximum operations)、比较运算(Comparison operations)
查看>>
【C++】C++11 STL算法(七):排列操作(Permutation operations)、数值操作(Numeric operations)
查看>>
【C++】C++11 STL算法(八):对未初始化内存的操作(Operations on uninitialized memory)、C库(C library)
查看>>