正规概念分析法

科技工作者之家 2020-11-17

正规概念分析是个非监督式机器学习技巧和资料分析方法。透过正规概念分析建立一个概念点阵,可以将所有的正规概念组织起来。这个点阵是由一群"自然"物件和"自然"属性所组成。

简介正规概念分析是一种将物件概念和其属性自动依造本体论进行分析的方法。这个词汇最早是由Wille于1984所提出。它应用了格理论将物件和其所对应的属性互相关联。所应用到的格理论则是由Birkhoff等人于1930年代所发展的。1

历史正规概念分析的最初动机是寻找数学秩序理论的现实意义。一般性的一种可能性是数据表可以转换为称为完全格子的代数结构,并且这些可以用于数据可视化和解释。表示对象和属性之间的二元关系的数据表,因此将“对象g具有属性m”形式的表格列表,被认为是基本数据类型,并且被称为正式上下文。在这个理论中,形式概念被定义为一对(A,B),其中A是一组对象(称为范围),B是一组属性(意图),这样

范围A由在B和dually中共享属性的所有对象组成

意图B由A中对象共享的所有属性组成。

通过这种方式,形式概念分析形式化了扩展和内涵的语义概念。

任何形式背景的形式概念可以-作为解释如下-be下令在一个名为更加正式的上下文的层次结构“概念格”。概念格可以图形方式显示为“线图”,这可能有助于理解数据。然而,这些晶格通常太大而无法实现可视化。然后,形式概念分析的数学理论可能是有帮助的,例如,用于将晶格分解成没有信息损失的较小块,或者用于将其嵌入到更容易解释的另一结构中。

目前形式的理论可以追溯到20世纪80年代早期,由达姆施塔特工业大学的Rudolf Wille,Bernhard Ganter和Peter Burmeister领导的研究小组。然而,它的基本数学定义在20世纪30年代由Garrett Birkhoff作为一般晶格理论的一部分引入。其他以前采用同一理念的方法来自法国的各种研究小组,但达姆施塔特小组对该领域进行了规范化,并系统地计算出其数学理论及其哲学基础。后者特别提到了Charles S. Peirce,但也提到了Port-Royal的逻辑。2

本体在计算机科学与信息科学领域,理论上,本体是指一种“形式化的,对于共享概念体系的明确而又详细的说明”。本体提供的是一种共享词表,也就是特定领域之中那些存在着的对象类型或概念及其属性和相互关系;或者说,本体就是一种特殊类型的术语集,具有结构化的特点,且更加适合于在计算机系统之中使用;或者说,本体实际上就是对特定领域之中某套概念及其相互之间关系的形式化表达(formal representation)。本体是人们以自己兴趣领域的知识为素材,运用信息科学的本体论原理而编写出来的作品。本体一般可以用来针对该领域的属性进行推理,亦可用于定义该领域(也就是对该领域进行建模)。此外,有时人们也会将“本体”称为“本体论”。

作为一种关于现实世界或其中某个组成部分的知识表达形式,本体目前的应用领域包括(但不仅限于):人工智能、语义网、软件工程、生物医学信息学、图书馆学以及信息架构。1

格物论在数学中,是其非空有限子集都有一个上确界(叫)和一个下确界(叫)的偏序集合(poset)。格也可以特征化为满足特定公理恒等式的代数结构。因为两个定义是等价的,格理论从序理论和泛代数二者提取内容。半格包括了格,依次包括海廷代数和布尔代数。这些"格样式"的结构都允许序理论和抽象代数的描述。

考虑任意一个偏序集合(L,≤),如果对集合L中的任意元素a,b,使得a,b在L中存在一个最大下界,和最小上界,则(L,≤)是一个格。

这里对于取a,b的最大下界的操作用表示;

对于取a,b的最小上界操作用 表示。

有界格有一个最大元素和一个最小元素,按惯例分别指示为1和0(也叫做)。任何格都可以通过增加一个最大元素和最小元素而转换成有界格。

使用容易的归纳论证,你可以演绎出任何格的所有非空有限子集的上确界(并)和下确界(交)的存在。一个很重要的格的种类是完全格。一个格是完全的,如果它的所有子集都有一个交和一个并,这对比于上述格的定义,这里只要求所有非空有限子集的交和并的存在。2

本词条内容贡献者为:

王沛 - 副教授、副研究员 - 中国科学院工程热物理研究所

科技工作者之家

科技工作者之家APP是专注科技人才,知识分享与人才交流的服务平台。