RapidMiner Studio官方版是一款相当高效的数据挖掘图形化软件,RapidMiner
Studio官方版功能强劲,具备数据挖掘技术和类库,在一个非常大的程度上有着先进技术,最大特色就是图形用户界面的互动原型。
软件介绍
RapidMiner
Studio官方版可以进行机器学习、数据挖掘、文本挖掘、预测性分析和商业分析的、具有拖拽功能的图形化工具。可以让分析师可以轻松地设计从混合到建模到部署的预测性分析流程,也可以让企业机构通过使用预测性分析来优化业务,从而获取竞争优势。提供了企业所需的高级分析功能,它可以用于提高市场回应率、降低客户流失、检测机械故障、计划预测性维护以及检测错误等。
软件特色
1、图形用户界面的互动原型
2、支持引导分析
3、支持可再用构建模块
4、有1500多台机器学习和数据预处理功能
5、易于集成R&Python脚本
6、拥有可靠的认证方法
7、能够访问所有类型的数据
8、在所有主流平台和操作系统上运行
9、云连接和存储库
10、支持群体智慧
11、支持预测性分析建模与验证
12、支持可视化操作环境
功能特点
1、数据访问:
①连接到任何格式,任何比例的数据源
②比任何其他可视化设计平台更多的数据连接器
③包括60多种文件类型和格式的结构化和非结构化数据
④非结构化数据访问,加载和提取信息
⑤80种文本,网络和多媒体挖掘和处理功能
⑥支持纯文本,HTML,PDF,RTF等
2、数据探索:
①强大的统计概述,快速探索和了解您的数据
②图形显示属性名称和类型
③快速识别缺失值
④强大的图表引擎提供了超过30种不同的可视化选项
⑤气泡图和三维散点图
⑥网络和树状图,以及更多
3、数据准备:
①提供大量的数据质量,集成和转换工具
②聚合、筛选和排序或连接数据的多个选项
③具备用于特征选择,创建和提取的算子
④确定最佳影响因素或产生新因素
⑤高级属性加权功能
⑥新属性生成选项
安装步骤
1、我们在下载之家下载该软件,获得一个压缩包,对其进行解压,得到这个exe文件,双击进入软件安装界面
2、我们可以点击“浏览”来更改安装位置
3、软件正在安装中,请耐心等待软件安装完毕
4、软件安装成功
使用教程
在Design视图中,界面主要分为五个部分:
左上角Repository。数据和Process的存储机制。 最佳做法是使用Repository进行数据存储,而不是直接从文件或数据库中读取数据。
如果使用Read Operator,元数据将不可用于RapidMiner,从而限制可用功能。
左下角Operators。按功能分组的构建模块用于创建RapidMiner Process。
Operator有输入和输出端口;对输入执行操作形成最终提供给输出的内容。Operator的参数用来控制这些操作。RapidMiner提供了超过1500个可用的Operator。
中间的Process。一组由相互连接的Operator表示的工作流设计,每个Operator用以操纵数据。
例如,一个Process可能会加载数据集,转换数据,计算模型,并将该模型应用到另一个数据集。
右上角的Parameters。其值决定了Operator的特征或行为, 分为常规参数和专家参数。
专家参数以斜体名称表示,通过单击面板底部的“显示/隐藏高级参数”链接来显示或隐藏。
右下角的Help。用以详细介绍每个Operator。
常见问题
如何处理缺少的值?
现实中很多数据集都存在缺失值的情况,缺失值处理是必不可少的一个步骤,根据属性下数据缺失的多少可以分为三种:
属性值大量缺失。这种情况下剩下的属性值可能包含的信息有限,所以可以直接删除该属性。
属性值部分缺失。通常对这些缺失值进行插补,Replace Missing Values Operator可以完成该操作。
属性值少量缺失。这种情况下,我们选择删除包含该缺失值的样本,在Filter Example Operator中选择显示高级参数,在‘condition
class’中选择‘no_missing_attributes’。
更新日志
1、增加了可挖掘的数据类型
2、增加了一些新增数据的管理功能
3、解决了一些格式上的已知问题
4、修复了一些bug,优化了软件界面
5、优化了软件性能