电子文件管理元数据结构分为宏观结构和微观结构,所谓宏观结构就是电子文件管理元数据顶层框架的架构,而微观结构是指电子文件管理元数据元素的构成。本文主要研究的是电子文件管理元数据宏观结构的分面化问题。本文通过对电子文件管理元数据单一线型化宏观结构和多维分面化宏观架构理论及分面架构本质的研究,从而看出分面化宏观架构具有特有的优势,进而得出分面方法对指向电子文件管理元数据标准化方面具有深刻意义,值得我们研究。
《信息系统工程》电子信息期刊,为科技类月刊,国内外公开发行,由天津市发展和改革委员会主管、天津市信息中心主办、国家信息中心及各省市信息中心全力支持的国家经济信息系统核心期刊。本刊以信息化管理为核心内容,以信息技术的前瞻性、实用性、创新性为特色,面向信息系统管理和网络管理人员。自1988年创刊以来,已拥有众多国内外读者并获得业内人士的关注与好评。她已经成为我国重大信息工程建设的参谋、展示系统集成技术的窗口、交流我国信息化进程的园地、沟通国内外信息产业的桥梁。
所谓“分面”,是指可以表征一类事物某一方面属性的一组简单概念元素。对于同一类事物,可以用多种属性作为划分标准,形成多个面——分解[1]。在所形成的多个分面之间,是相互独立并行的,因此各分面内的元素就可以进行组合——组配。这种组配由于有“多个面”参与,所以可以多维地、全面地揭示事物的属性;由于参与的“多个面”是组配的,所以又可以灵活地、方便地揭示事物的属性。
而所谓的“分面化”,则是指从系统角度出发,运用分解和组配的方法建立电子文件管理元数据宏观结构的架构过程。分面化往往是相对于单一线型化而言的。由于在电子文件管理元数据的宏观结构的架构上存在着多维分面化架构与单一线型化的架构,而且,在时间上,单一线型化的架构产生于多维分面化的架构之前,所以,研究电子文件管理元数据宏观结构的多维分面化,首先应该研究电子文件管理元数据单一线型化的架构。
电子文件管理元数据单一线型化架构的分析
所谓的电子文件管理元数据单一线型化架构,就是指在架构电子文件管理元数据的宏观结构时,将电子文件作为一个固定的实体,然后,按照文件管理流程一维地将电子文件划分为不同的类型的元数据,然后再依次对所划分出的不同类型元数据再进行细分,由此所形成的单一线型的结构。这种单一线型化的架构方式,典型的是以澳大利亚维多利亚州《电子文件管理元数据标准》为代表,该标准首先是将电子文件依据文件管理流程划分成几个不同类型的元数据,即划分为“文稿、文件、文件组合、文件集”等类型的元数据,然后在这基础上,再进一步对“文稿、文件、文件组合”进行细分,从而在“文稿”下再列出文稿的特征元数据、在“文件”下再列出文件的特征元数据、在“文件组合”下再列出文件组合的特征元数据及在“文件集”下再列出文件集的特征元数据,由此便形成了单一逐级划分的线型框架架构。
具体来看,该标准对“文稿”细分出了“责任者”、“描述”、“语种”、“题名”、“主题”、“来源”、“功能”、“日期”、“关系”、“权限管理”、“内容范围”十一个特征元数据,这些特征元数据,都是描述“文稿”所应有的;对“文件”的细分,也是分出了与“文稿”相同的十一个特征元数据,这是因为文件与文稿都是具有相同性质的电子文件,所以,描述它们特征的元数据也就必然是相同的,同样,“文件组合”、“文件集”也是与“文稿”、“文件”具有相同性质的电子文件,其差别仅仅是文稿、文件、文件组合和文件集是电子文件表现的不同形式和级次而已。所以,在对“文件组合”、“文件集”的细分,其细分出来的特征元数据也与文稿和文件的相同。
由此可看出这种单一线型化宏观结构中隐含着大量的相同的元数据元素,即元数据元素的冗余度很大,这种冗余度而且会随着对元数据不断细分,会呈几倍或几十倍的倍率增加,其结果相同元数据元素的数量极其庞大。
再对电子文件的文稿中的“责任者”进行细分,又分出10个描述文稿“责任者”的特征元数据元素,分别为“责任者类型”、“个人ID号”、“个人姓名”、“部门名称”、“职务名称”、“联系方式”、“电子邮箱”、“数字化签名”、“机构标识符”、“机构名称”,同样对文件、文件组合、文件集中“责任者”进行细分,分出来的特征元数据元素与文稿中的“责任者”下的特征元数据元素也完全相同。由此可见,电子文件管理元数据单一线型化的宏观架构会导致元数据严重冗余,数量庞大,十分不科学。
为了降低冗余度,澳大利亚维多利亚州《电子文件管理元数据标准》采用了减少对元数据元素细分的方式来减少相同的元数据元素,其具体做法是对“文稿”下特征元数据元素都没有进一步细分,仅有如“责任者”、“题名”、“权限管理”、“主题”等特征元数据,而对“文件”、“文件组合”和“文件集”下的特征元数据都进行了进一步的细分。采用这种方式,可以减少“文稿”下特征元数据元素的冗余。但也有其局限性,就是降低了元数据元素的专指度,仍以“文稿”的“责任者”为例,如不对其进行细分,那么这个“责任者”元素就很不专指,就很难确切地表达责任者的类型,是机构团体责任者还是个人责任者,以及责任者的部门名称、职务、联系方式、数字签名等具体含义。
由此可见,单一线型化宏观架构局限性是:
(1)因其对电子文件是按照单一线型的逐级划分方式进行的,使得元数据冗余呈倍数上升,冗余度十分大;
(2)为降低冗余度,减少细分级次,又降低了电子文件管理元数据元素的专指度,表达语义不具体;
(3)因其是一维展开的,难以多维、灵活地揭示电子文件的特征。
正因电子文件管理元数据单一线型化架构存在以上的缺点,才促使人们努力完善电子文件管理元数据宏观架构,因而才有分面架构的出现。
电子文件管理元数据多维分面化架构的分析
所谓的电子文件管理元数据多维分面化架构,就是指在架构电子文件管理元数据的宏观结构时,利用分面的方法,将电子文件划分成多个分面,各个分面内的元数据元素可互相进行组配,从而形成满足各种需求的电子文件管理元数据,电子文件管理元数据的多维分面化架构典型的是以《澳大利亚文件管理元数据方案》[2]标准为代表,该标准采用分面的方法,将电子文件实体分为“文件”面、“责任者”面、“业务处置”等面,其中,每一个分面之下,再细分成亚面——类型面和依附于类型面的亚面—特征描述面,这样面和面之间可以组配,亚面和亚面之间也可以组配,便形成电子文件管理元数据多维分面化架构。如以这样的结构同样表示“文稿”、“文件”、“文件组合”和“文件集”的责任者特征,就可以将文件分面与责任者分面进行组配来表达,见图1所示。
图1电子文件管理元数据的文件分面与责任者分面的组配
从图1可以看出,文件分面下的“文稿、文件、文件组合、文件集”它们分别可与责任者分面进行组配,从而可以形成多种责任者类型——如文稿责任者类型(内部责任者和外部责任者)、文件责任者类型(内部责任者和外部责任者)、文件组合责任者类型(内部责任者和外部责任者)、文件集责任者类型(内部责任者和外部责任者),也就是说采用多维分面化架构可以达到同样的单一线型架构细分的效果,但是其结构却更简洁明了,元数据元素的冗余度也大大减少。由于多维分面化结构是可以多维组配的,因此,除了分面与分面之间的组配外,还可以在各分面内进行亚面与亚面的组配,也就是各分面下的子分面与子分面进行组配,如图2所示。
从图2可以看出,当责任者的“内部责任者”亚面与责任者的“特征”亚面组配时,就可以形成“人员责任者的ID,人员责任者名称、人员责任者时间、人员责任者授权、人员责任者联系方式、人员责任者关系、人员责任者概况”等一系列表示人员责任者的元数据元素,同样,将单位责任者、机构责任者、组织责任者分别与责任者的特征亚面组配,也可以形成单位责任者、机构责任者和组织责任者一系列表示责任者特征的元数据元素,其达到的效果也如前电子文件管理元数据单一线型架构细分所列举出的责任者特征效果一样,同样,采用这种多维分面化架构,不仅元数据元素的冗余度大大减少,而且也使元数据的宏观结构的安排更合理。
图2 电子文件管理元数据的责任者亚面之间的组配
电子文件管理元数据多维分面化架构的本质
从上面对电子文件管理元数据多维分面化架构的分析,似乎“组配”是多维分面化架构的本质,其实“组配”仅仅是其的表面现象,而其本质却是对电子文件管理元数据系统的分解。
从系统论的角度看,电子文件管理元数据也是一个系统,而多维分面化则正是通过对该系统科学分解而架构起来的,即通过对电子文件管理元数据综合分析,通过分解,建立起多维分面,而分面组配仅仅是对电子文件管理元数据系统的分解在结构上所进行的还原。由此可见,“组配”现象下隐含着“分解”。
因此,多维分面的分解必须科学,必须具有理论的指向,否则为分解而分解。
缺少目的性。目前在国际电子文件管理领域,电子文件管理元数据多维分面化架构其分解都是基于电子文件管理连续体理论来进行的。如前所述,将电子文件元数据系统,分解为文件面、责任者面和业务处置面,其理论根据主要是依据电子文件管理连续体理论的三个实体来划分的,即依据文件管理连续体理论的文件实体轴形成文件面、责任者实体轴形成责任者面、业务处置实体轴形成业务处置面,所以,将电子文件管理元数据分解为文件面、责任者面和业务处置面是具有其内在的科学性的。不仅如此,由于多维分面化架构的科学性,因而其形成的分面架构又被国际电子文件元数据管理领域所共同认可,并进而被国际标准化组织(ISO)所制定的国际标准《ISO 23081-1信息与文件—文件管理过程—文件元数据—第一部分:原则》所采纳,从而成为国际标准的多维分面架构。
由此可见,电子文件管理元数据多维分面化架构具有很明显的优势:
(1)依据电子文件管理连续体的基本理论进行面的多维分解,符合电子文件管理的规律,具有科学性与理论基础。
(2)采用面的多维组配,可灵活地组配形成所需的各种电子文件管理元数据,从而可多维地、全面地反映电子文件特征,因而功能更加强大。
(3)采用多维分面架构,优化了电子文件管理元数据的宏观架构,促进了电子文件管理元数据的宏观架构的标准化,因而十分有益于电子文件真实性、可靠性、完整性和可利用性及法律凭证价值的实现。
综上所述,通过以上对电子文件管理元数据单一线型结构和多维分面结构的比较分析可看出,单一线型结构存在数据冗余、体系庞大、专指度不高等缺陷,还需要进一步完善,而多维分面架构却有显著的优点,其采用分面的方法,使得电子文件管理元数据能更加灵活地运用,能更加多维地全面地揭示电子文件的属性,能更加完整地反映电子文件之间的关系,因此,在电子文件领域,多维分面方法是值得充分重视与研究的,同样,在我国电子文件管理元数据宏观架构的制定过程中,也应积极采用多维分面化架构,从而提高我国电子文件管理元数据标准化程度,提高对电子文件资源开发与利用的效率.
【参考文献】
[1]张琪玉,《情报语言学基础》,1987年
[2]童时中,《模块化原理设计方法及应用》,2000年