发布网友 发布时间:2022-04-20 06:47
共1个回答
热心网友 时间:2022-05-13 03:20
分类过程中,相差不大的个体被归于同一类,它们的关系就是不可分辨关系(indiscernibility relation). 假定只用两种黑白颜色把空间中的物体分割两类,{黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的,因为描述它们特征属性的信息相同,都是黑色.
如果再引入方,圆的属性,又可以将物体进一步分割为四类: {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时,如果两个同为黑色方物体,则它们还是不可分辨的. 不可分辨关系是一种等效关系(equivalence relationship),两个白色圆物体间的不可分辨关系可以理解为它们在白,圆两种属性下存在等效关系.
基本集(elementary set) 定义为由论域中相互间不可分辨的对象组成的集合,是组成论域知识的颗粒. 不可分辨关系这一概念在粗糙集理论中十分重要,它深刻地揭示出知识的颗粒状结构,是定义其它概念的基础. 知识可认为是一族 等效关系,它将论域分割成一系列的等效类. 粗糙集理论延拓了经典的集合论,把用于分类的知识嵌入集合内,作为集合组成的一部分. 一个对象a 是否属于集合X 需根据现有的知识来判断,可分为三种情况: ⑴ 对象a 肯定属于集合X ; ⑵ 对象a 肯定不属于集X ; ⑶ 对象a 可能属于也可能不属于集合X . 集合的划分密切依赖于我们所掌握的关于论域的知识,是相对的而不是绝对的.给定一个有限的非空集合U 称为论域,I 为U 中的一族等效关系,即关于U 的知识,则二元对 K = (U,I) 称为一个近似空间(approximation space). 设x 为U 中的一个对象,X为U 的一个子集,I (x) 表示所有与x 不可分辨的对象所组成的集合,换句话说,是由x 决定的等效类,即I (x) 中的每个对象都与x 有相同的特征属性(attribute).
集合X 关于I 的下*近(Lower approximation) 定义为:
I* (X) = {x ∈U : I (x) 包含于X,实际上由那些根据现有知识判断肯定属于X 的对象所组成的最大的集合,有时也称为X 的正区(positive region),记作POS (X). 类似地,由根据现有知识判断肯定不属于X 的对象组成的集合称为X 的负区(negative region),记作N EG (X).
集合X 关于I 的上*近(Upper approximation) 定义为
I3 (X) = {x ∈U : I (x) ∩ X ≠ ∅}
I3 (X) 是由所有与X 相交非空的等效类I (x) 的并集,是那些可能属于X 的对象组成的最小集合. 显然,I3 (X) + N EG (X) = 论域U.
集合X 的边界区(Boundary region) 定义为
BND (X) = I3 (X) - I* (X)
BND (X) 为集合X 的上*近与下*近之差. 如果BND (X) 是空集,则称X 关于I 是清晰的(crisp) ; 反之如果BND (X) 不是空集,则称集合X 为关于I 的粗糙集(rough set).
下*近,上*近及边界区等概念称为可分辨区(discernibility regions),刻划了一个边界含糊(vague) 集合的*近特性. 粗糙程度可按按下式的计算
A1
=
I 3 (X)
I
3 (X),
式中 # 表示集合# 的基数或势(cardinality),对有限集合表示集合中所包含的元素的个数.
显然0≤A
1 (X) ≤1,如果A
1 (X) = 1,则称集合X 相对于I 是清晰(crisp) 的,如果A
1 (X) 0}
BND (X) = {x ∈U : 0 < LⅨ (x) < 1}
从上面的定义中,可以看出粗糙集理论中"含糊"(vague) 和"不确定"(uncertain ty) 这两个
概念之间的关系:"含糊"用来描述集合,指集合的边界不清楚; 而"不确定"描述的是集合中的
元素,指某个元素是否属于某集合是不确定的. 下面用一个具体的实例说明粗糙集的概念. 在粗糙集中使用信息表(information table) 描述论域中的数据集合. 根据学科领域的不同,它们可能代表医疗,金融,军事,过程控制等方面的数据. 信息表的形式和大家所熟悉的关系数据库中的关系数据模型很相似,是一张二维表格,如表一所示. 表格的数据描述了一些人的教育程度以及是否找到了较好工作,旨在说明两者之间的关系. 其中王治,马丽,赵凯等称为对象(objects),一行描述一个对象. 表中的列描述对象的属性. 粗糙集理论中有两种属性: 条件属性(condition attribute) 和决策属性(decision attribute). 本例中"教育程度"为条件属性;"是否找到了好工作"为决策属性.
表1 教育程度与是否找到好工作的关系 姓名 教育程度 是否找到了好工作 王治 高中 否 马丽 高中 是 李得 小学 否 刘保 大学 是 赵凯 博士 是 设O 表示找到了好工作的人的集合,则O = {马丽,刘保,赵凯},设I 表示属性"教育 程度"所构成的一个等效关系,根据教育程度的不同,该论域被分割为四个等效类: {王治,马丽},{李得},{刘保},{赵凯}. 王治和马丽在 同一个等效类中,他们都为高中文化程度,是 不可分辨的. 则:
集合O 的下*近(即正区) 为 I *(O) = PO S (O) = {刘保,赵凯}
集合O 的负区为 N EG (O) = {李得}
集合O 的边界区为 BND (O) = {王治,马丽}
集合O 的上*近为 I 3 (O) = PO S (O) + BND (O) = {刘保,赵凯,王治,马丽}
根据表1,可以归纳出下面几条规则,揭示了教育程度与是否能找到好工作之间的关系.
RULE 1: IF (教育程度= 大学) OR (教育程度= 博士) THEN (可以找到好工作)
RULE 2: IF (教育程度= 小学) THEN (找不到好工作)
RULE 3: IF (教育程度= 高中) THEN (可能找到好工作)
从这个简单的例子中,我们还可以体会到粗糙集理论在数据分析,寻找规律方面的作用.