Query:
Refining:
Year
Type
Indexed by
Colleges
Complex
Language
Clean All
Abstract :
基于序信息系统的知识粗糙熵,在系统中引入属性重要性的概念,利用该测度能度量序信息系统中属性集的不确定性,基于此,提出序信息系统中基于知识粗糙熵的启发式约简算法.通过实例对该方法的有效性进行检验,结果显示该算法可以作为一种有效的数据挖掘工具,为序信息系统的知识发现提供理论基础.
Keyword :
粗糙集 启发式算法 信息系统 优势关系
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 徐伟华 , 张晓燕 , 钟坚敏 et al. 序信息系统中属性约简的启发式算法 [J]. | 计算机工程 , 2010 , (17) : 69-71 . |
MLA | 徐伟华 et al. "序信息系统中属性约简的启发式算法" . | 计算机工程 17 (2010) : 69-71 . |
APA | 徐伟华 , 张晓燕 , 钟坚敏 , 张文修 . 序信息系统中属性约简的启发式算法 . | 计算机工程 , 2010 , (17) , 69-71 . |
Export to | NoteExpress RIS BibTex |
Abstract :
熵理论是信息系统中不确定性研究的有效工具之一.首先给出了集值信息系统的拟序关系,在此基础上引入了粗糙熵,讨论了粗糙熵的最大、最小值,并证明了粗糙熵的单调性.
Keyword :
粗糙熵 集值信息系统 拟序关系 信息粒
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 马建敏 , 张文修 . 集值信息系统的粗糙熵 [J]. | 计算机科学 , 2010 , (11) : 232-233,242 . |
MLA | 马建敏 et al. "集值信息系统的粗糙熵" . | 计算机科学 11 (2010) : 232-233,242 . |
APA | 马建敏 , 张文修 . 集值信息系统的粗糙熵 . | 计算机科学 , 2010 , (11) , 232-233,242 . |
Export to | NoteExpress RIS BibTex |
Abstract :
熵理论是信息系统中不确定性研究的有效工具之一.首先给出了集值信息系统的相容关系,在此基础上引入了粗糙熵.讨论了粗糙熵的最大、最小值,并证明了粗糙熵的单调性.
Keyword :
粗糙熵 集值信息系统 相容关系 信息粒
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 马建敏 , 朱朝晖 , 张文修 . 相容关系下集值信息系统的粗糙熵 [J]. | 计算机工程与应用 , 2010 , (7) : 29-31 . |
MLA | 马建敏 et al. "相容关系下集值信息系统的粗糙熵" . | 计算机工程与应用 7 (2010) : 29-31 . |
APA | 马建敏 , 朱朝晖 , 张文修 . 相容关系下集值信息系统的粗糙熵 . | 计算机工程与应用 , 2010 , (7) , 29-31 . |
Export to | NoteExpress RIS BibTex |
Abstract :
知识获取是机器学习领域的重要研究分支, 它在决策支持中发挥日益重要的作用,其主要思想是利用已知的数据或信息来提取有价值的概念或现象。自上世纪八十年代以来, 波兰数学家 Pawlak 首先提出的一种用于不确定性分析的数学工具,即粗糙集方法。 该方法在理论上不断完善, 在知识获取领域得到广泛的应用, 已逐渐成为知识获取方法研究的热点之一。 针对同时含有离散属性和连续属性的混合数据,目前大多数基于粗糙集的知识获取方法都需要首先对数据进行离散化预处理。然而知识获取方法对离散化处理的断点选取结果非常敏感,限制了粗糙集方法在混合数据上的应用。越来越多的学者开始研究利用数值属性的模糊软划分取代离散化产生的硬划分方式,但是如何选择合适的软划分模式用于混合数据上的知识获取方法仍然是探索中的问题。本论文研究基于粗糙集的混合数据知识获取方法,将各类型属性统一在模糊近似空间,研究混合数据上的属性约简和分类规则挖掘方法。所获得的研究成果不仅从理论上丰富和发展了粗集知识获取方法, 而且,由于粗糙集方法的广泛应用背景, 这些结果将同样具有重大的应用价值。本文的主要内容包括: 1) 提出一种混合数据上的多属性约简方法。通过模糊粗糙熵准则度量各类型属性的重要性,逐步将信息增益最大的属性添加到多个候选属性集合,最后得到多个属性约简结果供领域专家或学习算法选择。在此基础上结合权重模糊粗糙集模型,构造出可以结合先验知识的属性约简非平衡学习方法。 2) 提出一种基于模糊粗糙集的分类规则挖掘方法。该方法通过寻找近似最小覆盖避免了算法 LEM2 中严格的终止条件,从而更易于调节规则挖掘算法的泛化性能。 3) 基于经典决策表模型提出了补偿型决策表模型,该模型利用属性和值的不等式关系表达决策规则,可以为通常的规则挖掘算法提供获取含有不等式关系规则的功能。 4) 提出一种混合数据上分类规则挖掘的非平衡学习方法。该方法从用例的权重分配角度出发,修正用例的重要性以防止数据集倾斜对规则挖掘算法的影响。通过引入样例的代价加权,该方法适用于代价敏感的分类问题。 本论文工作的意义和价值主要表现在: 1) 混合数据上的多属性约简方法在保证算法约简效率的同时,可以获得多个属性约简结果供领域专家或学习算法使用,因此它可以作为机器学习方法有效的前端工具。通过对用例进行权重分配,约简算法可以改善分类器在非平衡数据集上的 AUC。与单个属性约简方法相比,多属性约简方法的属性约简结果在分类器上具有更高的分类精度。 2) 基于模糊粗糙集的分类规则挖掘方法能够兼顾规则获取结果的性能和信息融合应具备的功能,通过调节阈值参数可以控制生成规则的复杂程度。与目前流行的规则挖掘方法 LEM2 和 Datasqueezer 相比,基于模糊粗糙集的分类规则挖掘方法在混合数据上具有较高的分类精度。 3) 基于补偿型决策表模型可以为通常的规则挖掘算法提供挖掘含有不等式关系规则的功能, 使获取的知识可以更准确地描述数据集。实验结果表明,与传统的等式规则挖掘方法相比,挖掘含有不等式规则的方法在不降低分类精度的条件下,能够使生成的规则集更简洁明了。 4) 非平衡数据上的分类规则挖掘算法可以有效地缓解训练集中的两类样本数量悬殊的问题。通过代价敏感医学诊断实验表明,与基于权重粗糙集的方法相比,该方法的误分类代价显著降低了 15.5%。
Keyword :
模糊粗糙集混合数据知识获取属性约简规则挖掘
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 刘洋 . 基于粗糙集的混合数据知识获取方法研究 [D]. , . |
MLA | 刘洋 . "基于粗糙集的混合数据知识获取方法研究" . , . |
APA | 刘洋 . 基于粗糙集的混合数据知识获取方法研究 . , . |
Export to | NoteExpress RIS BibTex |
Abstract :
在序信息系统中引入了知识粗糙熵和粗集粗糙熵的概念,得到了它们的有关性质,并证明了二者都随着知识确定程度的增强而单调下降的结论,从而给出了序信息系统的信息解释.进一步通过讨论它们之间的联系说明了粗集的粗糙熵可以更精确地度量粗集地粗糙程度.这些结论为序信息系统的知识发现奠定了一定的理论基础.
Keyword :
粗糙度 粗糙集 序信息系统 知识粗糙熵
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 张晓燕 , 徐伟华 . 序信息系统的知识粗糙熵与粗集粗糙熵 [J]. | 计算机工程与应用 , 2007 , (27) : 62-65 . |
MLA | 张晓燕 et al. "序信息系统的知识粗糙熵与粗集粗糙熵" . | 计算机工程与应用 27 (2007) : 62-65 . |
APA | 张晓燕 , 徐伟华 . 序信息系统的知识粗糙熵与粗集粗糙熵 . | 计算机工程与应用 , 2007 , (27) , 62-65 . |
Export to | NoteExpress RIS BibTex |
Abstract :
在知识发现的诸多方法中, 利用粗糙集理论处理不确定性数据是一种非常有效的方法.该理论是由波兰数学家Z. Pawlak于1982年率先提出的, 起初Pawlak是以等价关系为基础建立的经典粗糙集理论. 然而, 在现实生活中存在相当一部分信息系统是基于覆盖、优势关系等其它二元关系, 并不是基于等价关系的信息系统. 为了使该理论有更大的应用空间, 必须对这些基于覆盖、优势关系等复杂的信息系统进行深入地研究和探讨. 基于上述出发点, 本文以覆盖广义粗糙集、优势关系下的信息系统以及认知过程为研究对象, 集中研究了覆盖广义粗糙集近似算子的修正、优势关系下覆盖广义粗糙集的知识刻画、优势关系下不协调目标信息系统的属性约简以及基于粒计算认知模型的建立等热门课题. 本文的主要成果及创新点如下: 丰富和完善了覆盖广义粗糙集理论. 在Z.Bonikowski的覆盖广义粗糙集模型的基础上, 我们对覆盖近似算子做了适当的修改, 并详细地研究了它们的性质. 通过与Bonikowski的覆盖广义粗糙集对比, 发现修改后的近似算子具有对偶性, 且许多结论与Pawlak经典粗糙集的情况相一致. 此外, 我们还讨论了新的覆盖广义粗糙集的约简和公理化问题 提出了覆盖广义粗糙集粗糙度的概念, 并给出了其在不完备决策表中的应用. 研究了优势关系下覆盖广义粗糙集的知识度量问题. Shannon熵在粗糙集理论中有着重要的应用, 梁吉业等成功地建立了经典粗糙集下信息系统的熵理论. 在此基础上, 我们把知识粒度、知识分辩度、信息熵、粗糙熵以及粗糙集的粗糙熵等不确定性概念引入到基于优势关系下的信息系统中, 并研究了它们的重要性质 讨论了它们之间的关系 证明了知识粒度和粗糙熵随着知识确定程度的增强而单调下降的结论, 从而给出了基于优势关系下信息系统的信息解释. 另外结合知识的粗糙熵与粗糙集的粗糙度提出了粗糙集粗糙熵的概念, 并证明了粗糙集粗糙熵也是随着知识确定程度的增强而单调下降的结论, 该结论充分地说明了粗糙集的粗糙熵比粗糙度可以更精确地刻画粗糙集的粗糙程度. 这些结果为这 种复杂的信息系统进行数据分析提供了理论基础. 给出了优势关系下信息系统属性约简的具体方法. 利用吴伟志、米据生等提出的经典等价关系下不协调目标信息系统属性约简的类似方法, 在基于优势关系下的不协调目标信息系统中引入了分布约简、最大分布约简、分配约简、部分一致约简以及上下近似约简的概念, 通过分析其性质得到了这些约简的判定定理以及辨识矩阵, 建立了优势关系下不协调目标信息系统属性约简的具体方法, 并通过实例验证了该方法的有效性. 同时, 还讨论了上述几种属性约简之间的关系, 证明了优势关系下不协调信息系统的分布约简一定是最大分布约简等主要结论. 该方法和理论为优势关系下信息系统的知识发现提供了有利工具. 基于粒计算的观点对认知过程作了系统的研究. 结合粒计算和形式背景分析的理论, 提出了认知的具体数学模型. 进一步, 给出了充分信息粒、必要信息粒、充要信息粒等基本概念, 建立了这一模型中认知的具体粒化描述 详细地讨论了认知系统中的矛盾粒, 并给出了其析化方法. 此外, 通过详细的论证给出了如何将充分信息粒和必要信息粒转化为充要信息粒的具体方法, 从而说明了认知过程的数学解释.
Keyword :
信息系统覆盖广义近似优势关系粒计算认知过程
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 徐伟华 . 覆盖广义粗糙集的理论与应用研究 [D]. , . |
MLA | 徐伟华 . "覆盖广义粗糙集的理论与应用研究" . , . |
APA | 徐伟华 . 覆盖广义粗糙集的理论与应用研究 . , . |
Export to | NoteExpress RIS BibTex |
Abstract :
粗糙集理论是一种有效处理不精确、不确定含糊信息的数学理论,近年来已被广泛应用于机器学习、数据挖掘、智能数据分析.该文结合知识粗糙性与信息熵给出了一种关于粗糙模糊集(RF集)的不确定性度量.
Keyword :
不确定性 粗糙模糊集 粗糙熵 信息熵
Cite:
Copy from the list or Export to your reference management。
GB/T 7714 | 王虹 , 张文修 , 李鸿儒 . 粗糙模糊集的不确定性度量 [J]. | 计算机工程与应用 , 2005 , (2) : 51-52,186 . |
MLA | 王虹 et al. "粗糙模糊集的不确定性度量" . | 计算机工程与应用 2 (2005) : 51-52,186 . |
APA | 王虹 , 张文修 , 李鸿儒 . 粗糙模糊集的不确定性度量 . | 计算机工程与应用 , 2005 , (2) , 51-52,186 . |
Export to | NoteExpress RIS BibTex |
Export
Results: |
Selected to |
Format: |