粗糙集的基本概念

发布网友发布时间：2022-04-20 06:47

共1个回答

热心网友时间：2022-05-13 03:20

分类过程中，相差不大的个体被归于同一类，它们的关系就是不可分辨关系（indiscernibility relation). 假定只用两种黑白颜色把空间中的物体分割两类，{黑色物体},{白色物体},那么同为黑色的两个物体就是不可分辨的，因为描述它们特征属性的信息相同，都是黑色.
如果再引入方，圆的属性，又可以将物体进一步分割为四类： {黑色方物体},{黑色圆物体},{白色方物体},{白色圆物体}. 这时，如果两个同为黑色方物体，则它们还是不可分辨的. 不可分辨关系是一种等效关系（equivalence relationship），两个白色圆物体间的不可分辨关系可以理解为它们在白，圆两种属性下存在等效关系.
基本集（elementary set) 定义为由论域中相互间不可分辨的对象组成的集合，是组成论域知识的颗粒. 不可分辨关系这一概念在粗糙集理论中十分重要，它深刻地揭示出知识的颗粒状结构，是定义其它概念的基础. 知识可认为是一族等效关系，它将论域分割成一系列的等效类. 粗糙集理论延拓了经典的集合论，把用于分类的知识嵌入集合内，作为集合组成的一部分. 一个对象a 是否属于集合X 需根据现有的知识来判断，可分为三种情况： ⑴ 对象a 肯定属于集合X ; ⑵ 对象a 肯定不属于集X ; ⑶ 对象a 可能属于也可能不属于集合X . 集合的划分密切依赖于我们所掌握的关于论域的知识，是相对的而不是绝对的.给定一个有限的非空集合U 称为论域，I 为U 中的一族等效关系，即关于U 的知识，则二元对 K = (U,I) 称为一个近似空间（approximation space). 设x 为U 中的一个对象，X为U 的一个子集，I (x) 表示所有与x 不可分辨的对象所组成的集合，换句话说，是由x 决定的等效类，即I (x) 中的每个对象都与x 有相同的特征属性（attribute).
集合X 关于I 的下*近（Lower approximation) 定义为：
I* (X) = {x ∈U : I (x) 包含于X，实际上由那些根据现有知识判断肯定属于X 的对象所组成的最大的集合，有时也称为X 的正区（positive region），记作POS (X). 类似地，由根据现有知识判断肯定不属于X 的对象组成的集合称为X 的负区（negative region），记作N EG (X).
集合X 关于I 的上*近（Upper approximation) 定义为
I3 (X) = {x ∈U : I (x) ∩ X ≠ ∅}
I3 (X) 是由所有与X 相交非空的等效类I (x) 的并集，是那些可能属于X 的对象组成的最小集合. 显然，I3 (X) + N EG (X) = 论域U.
集合X 的边界区（Boundary region) 定义为
BND (X) = I3 (X) - I* (X)
BND (X) 为集合X 的上*近与下*近之差. 如果BND (X) 是空集，则称X 关于I 是清晰的（crisp) ; 反之如果BND (X) 不是空集，则称集合X 为关于I 的粗糙集（rough set).
下*近，上*近及边界区等概念称为可分辨区（discernibility regions），刻划了一个边界含糊（vague) 集合的*近特性. 粗糙程度可按按下式的计算
A1
=
I 3 (X)
I
3 (X),
式中 # 表示集合# 的基数或势（cardinality），对有限集合表示集合中所包含的元素的个数.
显然0≤A
1 (X) ≤1，如果A
1 (X) = 1，则称集合X 相对于I 是清晰（crisp) 的，如果A
1 (X) 0}
BND (X) = {x ∈U : 0 < LⅨ (x) < 1}
从上面的定义中，可以看出粗糙集理论中"含糊"(vague) 和"不确定"(uncertain ty) 这两个
概念之间的关系："含糊"用来描述集合，指集合的边界不清楚；而"不确定"描述的是集合中的
元素，指某个元素是否属于某集合是不确定的. 下面用一个具体的实例说明粗糙集的概念. 在粗糙集中使用信息表（information table) 描述论域中的数据集合. 根据学科领域的不同，它们可能代表医疗，金融，军事，过程控制等方面的数据. 信息表的形式和大家所熟悉的关系数据库中的关系数据模型很相似，是一张二维表格，如表一所示. 表格的数据描述了一些人的教育程度以及是否找到了较好工作，旨在说明两者之间的关系. 其中王治,马丽，赵凯等称为对象（objects），一行描述一个对象. 表中的列描述对象的属性. 粗糙集理论中有两种属性：条件属性（condition attribute) 和决策属性（decision attribute). 本例中"教育程度"为条件属性；"是否找到了好工作"为决策属性.
表1 教育程度与是否找到好工作的关系姓名教育程度是否找到了好工作王治高中否马丽高中是李得小学否刘保大学是赵凯博士是设O 表示找到了好工作的人的集合，则O = {马丽，刘保，赵凯},设I 表示属性"教育程度"所构成的一个等效关系，根据教育程度的不同，该论域被分割为四个等效类： {王治，马丽},{李得},{刘保},{赵凯}. 王治和马丽在同一个等效类中，他们都为高中文化程度，是不可分辨的. 则：
集合O 的下*近（即正区）为 I *(O) = PO S (O) = {刘保，赵凯}
集合O 的负区为 N EG (O) = {李得}
集合O 的边界区为 BND (O) = {王治，马丽}
集合O 的上*近为 I 3 (O) = PO S (O) + BND (O) = {刘保，赵凯，王治，马丽}
根据表1，可以归纳出下面几条规则，揭示了教育程度与是否能找到好工作之间的关系.
RULE 1: IF （教育程度= 大学） OR （教育程度= 博士） THEN （可以找到好工作）
RULE 2: IF （教育程度= 小学） THEN （找不到好工作）
RULE 3: IF （教育程度= 高中） THEN （可能找到好工作）
从这个简单的例子中，我们还可以体会到粗糙集理论在数据分析，寻找规律方面的作用.

声明：本网页内容为用户发布，旨在传播知识，不代表本网认同其观点，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。
E-MAIL:11247931@qq.com