数据挖掘 - 系统

  • 简述

    有大量可用的数据挖掘系统。数据挖掘系统可以整合以下技术 -
    • 空间数据分析
    • 信息检索
    • 模式识别
    • 图像分析
    • 信号处理
    • 计算机图形学
    • 网络技术
    • 商业
    • 生物信息学
  • 数据挖掘系统分类

    数据挖掘系统可以根据以下标准进行分类 -
    • 数据库技术
    • 统计数据
    • 机器学习
    • 信息科学
    • 可视化
    • 其他学科
    数据挖掘系统
    除此之外,数据挖掘系统还可以根据 (a) 挖掘的数据库、(b) 挖掘的知识、(c) 使用的技术和 (d) 适应的应用程序的类型进行分类。

    基于挖掘的数据库的分类

    我们可以根据挖掘的数据库类型对数据挖掘系统进行分类。数据库系统可以根据数据模型、数据类型等不同的标准进行分类,数据挖掘系统也可以据此进行分类。
    例如,如果我们根据数据模型对数据库进行分类,那么我们可能有一个关系型、事务型、对象关系型或数据仓库挖掘系统。

    基于知识挖掘类型的分类

    我们可以根据挖掘的知识类型对数据挖掘系统进行分类。这意味着数据挖掘系统是根据功能分类的,例如 -
    • 表征
    • 歧视
    • 关联和相关分析
    • 分类
    • 预言
    • 异常值分析
    • 进化分析

    基于所用技术的分类

    我们可以根据所使用的技术类型对数据挖掘系统进行分类。我们可以根据所涉及的用户交互程度或所采用的分析方法来描述这些技术。

    基于应用的分类

    我们可以根据适用的应用对数据挖掘系统进行分类。这些应用程序如下 -
    • 金融
    • 电信
    • DNA
    • 股市
    • 电子邮件
  • 将数据挖掘系统与 DB/DW 系统集成

    如果数据挖掘系统没有与数据库或数据仓库系统集成,那么将没有可与之通信的系统。这种方案被称为非耦合方案。在这个方案中,主要关注数据挖掘设计和开发有效的算法来挖掘可用的数据集。
    集成方案列表如下 -
    • 无耦合− 在该方案中,数据挖掘系统不使用任何数据库或数据仓库功能。它从特定来源获取数据并使用一些数据挖掘算法处理该数据。数据挖掘结果存储在另一个文件中。
    • 松耦合− 在该方案中,数据挖掘系统可能会用到数据库和数据仓库系统的部分功能。它从这些系统管理的数据呼吸中获取数据,并对这些数据执行数据挖掘。然后它将挖掘结果存储在文件中或数据库或数据仓库中的指定位置。
    • 半紧耦合− 在该方案中,数据挖掘系统与数据库或数据仓库系统链接,除此之外,可以在数据库中提供一些数据挖掘原语的有效实现。
    • 紧耦合− 在这种耦合方案中,数据挖掘系统平滑地集成到数据库或数据仓库系统中。数据挖掘子系统被视为信息系统的一个功能组件。