0

我是数据挖掘的新手,所以如果这个问题对任何人来说都是一个显而易见的问题,我深表歉意。我知道那里有很多数据挖掘算法,例如顺序模式挖掘或先验算法。我想知道我实现的以下代码是否会被视为数据挖掘,特别是对于顺序模式,如果我有一个包含大约 20,000 名学生的数据库,或者我是否必须专门使用现有的数据挖掘算法之一?

String x = "SELECT STUDENTS.ROW, STUDENTS.MAJOR, STUDENTS.NAME " +
"CASE WHEN prior_row.NAME IS NOT NULL" +
"AND EXISTS(SELECT 'x' FROM STUDENTS prior_row " +
"WHERE STUDENTS.MAJOR = prior_row.MAJOR" +
"AND STUDENTS.ROW > prior_row.ROW + 1" +
"SELECT STUDENTS.MAJOR, STUDENTS.ROW, STUDENTS.NAME WHERE" +
"MAJOR < (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'MATH' 
"AND WHERE MAJOR > (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'SCIENCE' THEN 1 ELSE NULL          END Flagged_Values";

 st.executeQuery(x);

  String y = "SELECT STUDENTS.ROW, STUDENTS.MAJOR, STUDENTS.NAME" +
"CASE WHEN previous.NAME IS NOT NULL" +
"AND EXISTS(SELECT 'y' FROM STUDENTS previous" +
"WHERE STUDENTS.MAJOR = previous.MAJOR" +
"AND STUDENTS.ROW > previous.ROW + 1" +
"SELECT STUDENTS.MAJOR, STUDENTS.ROW, STUDENTS.NAME WHERE" +
"MAJOR < (SELECT THE_OUTCOME FROM STUDENTINFO WHERE MAJOR ='Math' +
"AND WHERE MAJOR > (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'SCIENCE'" +
"AND WHERE MAJOR > (SELECT MAJOR FROM STUDENTS WHERE MAJOR = 'Engineering'
"THEN 1 ELSE NULL END Flag ";

 st.executeQuery(y);
4

3 回答 3

1

您正在做的是SQL 选择语句。投影、选择和聚合。

你读过关于数据挖掘的维基百科文章吗?

实际的数据挖掘任务是对大量数据进行自动或半自动分析,以提取以前未知的有趣模式,例如数据记录组(聚类分析)、异常记录(异常检测)和依赖关系(关联规则挖掘)。这通常涉及使用数据库技术,例如空间索引。这些模式可以被看作是输入数据的一种总结,并且可以用于进一步的分析,例如,机器学习和预测分析。例如,数据挖掘步骤可能会识别数据中的多个组,然后决策支持系统可以使用这些组来获得更准确的预测结果。数据收集、数据准备、结果解释和报告都不是数据挖掘步骤的一部分,

术语“数据挖掘”经常被误用在任何类型的数据收集或选择中,但人们应该将这些任务称为“数据收集”和“数据库查询”,而不是随机抽取流行语。数据挖掘是统计、人工智能、机器学习和数据库的交集。如果缺少这些组件(除了数据库,我在您的查询中看不到它们),它应该被称为例如“数据库”、“机器学习”或“统计”。

于 2013-07-23T12:09:06.550 回答
0

一般来说,请记住,这本质上是基于意见的,数据挖掘是指获取相对不可用格式的数据并将其转换为更可用格式的过程。

例如,如果我有一个巨大的 .txt 非结构化文本转储,然后我提取相关部分(根据相关的一些正式定义)并将其放入 .bson 存储或类似的东西中,这将是数据挖掘,无论确切我如何进行提取。

但是,由于您的数据已经在 SQL 数据库中,我不会考虑这种数据挖掘。我会认为它是 SQL 开发,但同样,这在很大程度上是基于意见的。SQL 数据库已经是一种非常有用的数据存储方式,因此访问该数据不会引入尚未存在的功能级别。

tl;dr:我不会说这算作数据挖掘,但这是一个灰色地带。

于 2013-07-22T20:07:11.770 回答
0

在数据挖掘领域,执行 SQL 查询不会被视为数据挖掘。

于 2013-07-27T21:38:09.960 回答