知识文档分类(精选4篇)
知识文档分类 篇1
摘要:采用多维标签式分类方法, 为某单位知识管理系统建立符合自然管理习惯的动态可维护的知识分类体系, 使用非模式的面向文档的MongoDB数据库技术实现了该分类体系以及海量知识文档文件的存储。
关键词:知识管理系统,知识文档分类,MongoDB数据库
0 引言
知识分类任务是把知识表现要素划分到预先定义分类体系的一个或多个类别中去, 是建立企业知识管理系统的关键问题之一。科学的知识分类体系的建立有助于用户在海量的知识文档中快速检索、定位所需的知识内容。
在建设某电力行业单位的知识管理系统时, 经过调研发现, 该单位80%左右的知识数据是以文档、视频、图片等非结构化数据文件存在, 这些文档来源广、内容庞杂, 并且该单位现有资料室缺乏对统一的分类体系来进行有效的知识管理。
1 常见的分类方法
最常用的方法是基于知识工程技术的, 它通过人工定义一组逻辑规则将专家分类思想融入其中。
以知识内容为依据, 通常可以将知识粗略分为四个大类:流程知识、事实知识、编目知识以及专业文化知识。流程知识是描述如何将工作做好的知识, 这类知识可以通过基准管理和最佳实践两种管理活动来获得, 通过对流程知识的应用, 有助于企业优化流程和提高效率。事实知识是指存在于个人头脑中的关于人和事的最基本知识。通常来讲, 事实知识是较易被文档化的, 但是如果对这类知识不进行综合整理, 其附加值会逐渐降低。编目知识可以使人知道事物置于何处。在企业里, 编目知识通常被分类整理成为黄页。虽然很多编目知识可以被整理成黄页, 但是随着现代化社会工作节奏的加快, 企业组织的快速变化, 越来越多的编目知识已经成为了个人知识的一部分。专业文化知识包含了一个具体的任务应当怎样在特定的组织中完成的知识, 这是企业的无价资产。
2 多维度标签分类方法
在综合分析了该单位的非结构化文档特征和业务流程特征的基础上, 本文采用多维标签式分类方法, 为该单位知识管理系统建立符合其自然管理习惯的动态可扩展的知识分类体系, 并采用非模式的面向文档Document的MongoDB数据库技术实现该分类体系和文档文件的存储。
该分类体系具有多维度的视角, 即一篇文档从用户需求角度可属于多个维度。按照该单位目前的知识文档情况, 整理出了如下分类体系。
维度一:按照文档所属业务任务来源分国网、省公司、电科院内和其他等, 如图1所示。
维度二:沿用传统档案管理的“内容的功能性”分类方法, 即将文档分为报告类、方案类、专利类、学术论文类、工作总结类、规章制度类以及证书类等, 如图2所示。
维度三:按承担业务任务的承担部门、业务工作性质以及业务设备对象类别构建层次分类, 第一层次为承担部门, 分别为技术监督室、状态检测室、状态评价室和实验室等;第二层次按工作性质划分为现场试验、带电检测、电力抽检、设备校准、运行分析等;第三层次按业务设备对象类别划分为如变压器、互感器等。图3给出一个分类示例描述。
上述分类体系只是目前在我们认知水平下的一个描述, 我们希望这个分类体系不是固定不变的, 是动态可维护的, 具有可扩展性和可编辑性, 在认知水平提升后需要增加新的分类维度或类别时, 或者需要修改类别和删除类别时能方便完成维护, 以适应人们认知水平自然发展规律。
3 实现方法
本文采用非模式的面向文档模型的MongoDB数据库技术, 实现了知识管理系统中的知识文档的存储和分类体系的建立。有关MongoDB的技术可以参考文献[4], 本文中不赘述。
3.1 知识文档存储模型
我们采用MongoDB数据库的文档数据模型对非结构化文档文件进行存储逻辑结构设计, 实现文档文件包括标题、所有者、提交时间、文件大小、文件类型、分类标签子文档列表等元数据存储。其中文档的类别属性是通过在文档存储时在其文档表结构的分类标签子文档列表中追加一个标签子文档 (Sub-Document) 即可。文档存储的表 (Collection) 结构描述如表1所示。
其中, “文档所属分类标签数组”采用引用链接数据模型的方式实现, 其基本结构描述如下, 其中Category_Tree是为存储分类树的表名。
3.2 分类树模型
本文采用MongoDB技术实现分类树Category_Tree的建立, 以维护分类体系的动态变化。我们设计一个分类树的表存储结构来建立本文第二节中的多维分类体系模型, 具体采用先序序列组织 (Array of ancestors) 技术[5]建立基于MongoDB的分类树, 先序序列组织将节点存储在一个MongoDB文档结构中, 在这个MongoDB文档的ancestors域中存储了节点的所有的先序节点ID以及在parent域中这个节点的直接父类ID, 下面列出创建分类树的部分代码。
这个分类体系维护操作页面很简单, 可以用Extjs的树控件在页面创建一个树结构, 通过控件上的小按钮对树进行添加、删除以及修改等操作, 比如, 直接单击树节点对节点文字进行修改即可完成分类名称的修改。
4 结语
针对某电力单位的知识文档特点, 本文采用的多维分类方法符合该单位的自然管理习惯。非模式的面向文档模型的MongoDB数据库技术不仅可以满足海量知识文档的存储, 还能实现可扩展可维护的多维分类体系。
参考文献
[1]陈庆章, 李义冬, 方硕璟, 周辉.浙江省电力试验研究院知识管理系统的设计和实现[J].计算机研究与发展, 2010 (47) :193-198
[2]张玲玲, 汪寿阳.业务流程导向的知识管理[M].北京:科学出版社, 2010
[3]杨娟娟, 武忠.面向业务流程的知识管理系统建模研究[J].情报杂志, 2009, 28 (3) :121-125
[4]李成华, 江小平, 等.面向管理实体对象的海量工程项目数据模型及实现[J].计算机应用, 2013, 33 (4) :10-1014
[5]MongoDB, Inc.Model Tree Structures in MongoDB, http://docs.mongodb.org/manual/tutorial/model-tree-structures/, 2014-8-28
基于聚类分析的图模型文档分类 篇2
文档分类是一个复杂的过程,包括文档预处理、文档表示、分类算法设计、性能评估等主要步骤,文档分类的主要任务有文档的形式化表示以及在此基础上的分类算法设计。目前,一系列分类算法被应用于文档分类,如KNN(K-Nearest Neighbor)、支持向量机(SVM)、决策树、贝叶斯分类算法(Bayes)以及神经网络方法,都取得了较为理想的分类效果。然而,在如此众多的方法中,它们大都是基于向量空间模型。VSM对模型中的特征词进行权重估计过程中不考虑特征词之间的相关性,直接用特征词作为维度构建文档向量,降低了文档向量对文档概念表达的准确性以及对不同类型文档的区分能力[1]。为了取得更好的文档分类效果,本文尝试对文档表示模型进行探索性的研究。另外,为了将文档表示成合适的模型,还必须完成文档的特征降维。文档特征向量的高维性是文档分类的难点之一, 文档特征降维是文档分类面临的主要问题。特征聚类是文档特征降维的一种非常有效的方法。文献[2]首次提出特征分布聚类,根据特征在不同文档中的分布情况对特征进行聚类。文献[3]最早将基于信息瓶颈特征聚类的方法应用在文档分类领域,取得了等同甚至优于其它方法的结果。文献[4]使用K-means、密度聚类方法对特征项进行聚合,取得了较好的特征选择效果,提高了文档分类的效率。文献[5]根据特征间的相似度,对特征进行聚类,在每个簇中选择一个特征代表整个簇,大大减小了特征集的冗余性。本文在基于特征项相关性的前提下,从特征项对于文档类别分布的角度考虑,提出了一种新的特征聚类算法同时实现特征降维和分类器增强。
1特征聚合理论
文档类属判定与文档特征选取的数量和质量相关,若选取特征的数量过大,文档向量的维数太高,则计算开销过大,并且许多特征项对类别归属所能提供的信息很少;而大量减少特征词数量又会丢失许多重要的分类信息。因此,将文档表示成向量后,文档相似度计算常常不能体现特征项之间的内在联系,特征项“各自用力”,不能确切体现文档间的相似程度。
1.1基于相关信息的特征项选择
文献[6]对文档频率(DF)、χ2统计量(CHI)、信息增益(IG)、互信息(MI)等常用的特征选择函数进行了研究,发现IG与CHI的性能最好,类别区分性因子(如IG、CHI)在选择的特征数超过某阈值后,性能基本保持不变,具有非常好的抗噪音能力。其中χ2统计是更加有效的方法,它不仅可以去除冗余信息,而且还可以取得更好的性能。
χ2统计量(CHI)体现了特征与特征之间的相关信息及特征与文档类别之间的相互关联程度。A表示包含特征t且属于类别c的文档频数;B为包含t但是不属于类别c的文档频数;C表示属于类别c但是不包含t的文档频数;D表示既不属于c也不包含t的文档频数;N表示语料中文档总数。特征t与某类别c的CHI如式(1)所示:
考虑到N、A+C、B+D均是常数,我们只关心特征词对某个类别的χ2值的大小顺序,而不关心具体的值,故实际计算的时候可以简化为式(2):
χ2统计值用来衡量特征t和类别c之间的统计相关性。其值越高,特征和类别之间的独立性越小,相关性越强,特征对该类别的贡献越大。特征词的χ2统计值比较了特征项对一个类别的贡献和对其他类别的贡献,利用χ2统计计算特征t和类别c之间的相关性,确定该特征t是否可以代表这个类别。由于χ2统计值很好地体现了特征和类别之间的相关性,因而CHI方法在特征选择中得到了广泛的应用。
1.2特征项聚类
CHI方法在特征选择中效果很好,但在目前的分类算法中,CHI值并没有得到充分的利用。在特征选择过程中,我们计算了每一个特征与所有类别之间的χ2统计量,但是由于对CHI的取值通常只是特征和所有类别的χ2平均值或者最大值,丢弃了很多信息,而在特征选择后CHI值也没有得以利用。如果在分类过程中充分利用特征的CHI值,就有可能得到更好的分类结果。
由于语言表达形式的多样性,能表达同一概念,体现一个类别特点的特征词往往有多个。另外,词与词之间往往存在较强的语义关联。单单依靠特征词的重复而产生的频率信息缺乏统计价值,容易被噪音所淹没。特征项过高的维度通常使得基于距离的相似性度量不再那么有效,而且容易引起较大的计算误差[7]。因此,如果将特征项映射到概念级,将有助于加强同一类别文档的聚合能力。
定义1 当文档被简单地看成是它所含有词或短语组成的集合时,这些词称为项,即文档可以表示为特征项的集合d(tl,t2,…,tn),(1<=k<=n),其中tk代表特征项。
定义2 在文档集合中可以把tl,t2,…,tn看成n维空间的坐标系,每个t得到c(cl,c2,…,cj)个CHI值,表示为χ2 (t,i),(1<=i<=j)。根据tk在c个类别的CHI分布值采用相关算法对相似度进行聚类, 得到m维特征聚类簇。
在大样本条件下,具有相似CHI分布的特征项对文档分类具有相似的贡献。因而我们对CHI分布相似的特征项进行聚类。虽然对分类贡献相同的特征项具有不同的权值,但对分类贡献相近的特征应归属于同一个新特征簇,这个新特征簇包含多个或一个特征词条。
每个特征词t都能得到c(类别总数)个CHI值,每个词都可得到一条对分类的贡献分布曲线,如图1所示。可认为那些有相同分布曲线的特征词是相互关联的,对分类有相同的贡献。因此,我们可以将分类贡献分布相同的词聚合为一个簇,从而最终得到m个不同的分布簇,使用单个簇作为文档向量的一维[8]。
传统的文档特征选择方法通过某种评价函数分别计算单个特征对类别的区分能力,由于没有考虑特征间的关联性,这些方法选择的特征集往往存在着冗余。通过对CHI分布相似的特征项聚类后,类别区分能力强且语义相关的特征被聚集成一组,聚类后的新特征簇具有比较直观的实际意义;包含原始特征空间较多的信息,使得在新特征空间上的统计信息更加可靠;对特征间的冗余性进行裁减,消减特征空间的维数,从而减少分类模型的训练时间与模型规模。
1.3基于类别分布的特征聚类算法
基于类别的统计语言模型是解决统计模型数据稀疏问题的重要方法。目前我们很难找到一种比较成熟且运算量适中、收敛效果好的特征聚类算法。传统的聚类方法以训练语料的困惑度为指导,聚类结果语义信息不明显[9]。
K-means是常用的聚类方法,有较高的执行效率,簇与簇之间有明显区别时,聚类效果较好。但对初值敏感,当存在非凸面形状或差别很大的簇时,聚类精度较低。而凝聚层次聚类的突出优点是它比较符合数据的特性,能够生成比较规整的簇集合,聚类结果不依赖元素的初始排列或输入次序,与聚类过程的先后次序无关,聚类结果比较稳定,有较好的聚类质量,准确度较高。但计算开销较大,对异常数据比较脆弱,容易出现大类现象,不适合大量文件的集合。因而,本文将K-means算法和凝聚层次算法结合起来对特征进行聚类,即能使两种算法的缺点得到部分克服,又能充分发挥两种算法的优势。这种基于K-means和层次聚类的混合算法既能降低聚类时间,在一定程度上又得到较好的聚类结果[10]。
总结起来,可以将该算法步骤表示如下:
1) 应用特征提取理论选取N个特征词条。这N个特征词条满足条件:按照从大到小取前N个相应的特征项的CHI值Zj>阈值θ,由此得出词条具有N个初等模式。阈值θ的选取应根据CHI值的大小,由经验选取。
2) 统计每个初等模式的χ2值。设有C个类别,则每个初等模式都可达到C个χ2值。对每个初等模式的C个χ2值进行统计,可以得到各个初等模式对分类贡献的分布曲线。将各个初等模式对分类贡献的分布曲线标准化。公式如式(3)所示:
BZj = χj2/A (3)
其中BZj表示某一初等模式标准化后的统计值;χj2表示此初等模式的实际统计值;A表示由统计意义上得出的阈值[11]。公式如式(4)所示:
其中P表示小于A的χ2值的个数;C为类别个数;N为初等模式的个数;λ可以取60%、70%、80%、90%等值。
3) 利用K-means算法在整体数据集上进行聚类。由于特征数据集合规模太大,先利用K-means算法在整体数据集上进行聚类。将聚类输出作为下一次聚类的输入,反复进行多次,从而消除初始值对聚类结果的影响,此方法在一定程度上能够将较大或呈延伸状的簇分成若干个小类。
4) 使用K-means方法所产生的类来约束凝聚层次法的凝聚空间,整合可以合并的小类。在层次聚类中,通过在每一步选择相似度最大的来进行聚类。当相近分布的特征聚为一个类别时,由于其在各个类别的频率分布较为接近,聚合后的特征模式分布不会有很大的变化,因而平均信息量(熵)的变化较小。不同类别的特征混合时(即错误的分类),聚合后的特征分布将显著变化,分布更加趋向均匀,使平均信息量增大较大。
聚类和特征选择是相互加强的。一方面,良好的聚类结果将提供良好的类标签,为每个类别选择更好的特征;另一方面,较好的特征选择方法将有助于提高集群性能,提供较好的类标签[12]。我们通过聚类,将相近的特征词映射到了相同的概念簇上,降低了文档向量的维度,即将n个特征项聚合为m个簇,认为每个簇中的所有特征项具有同一个特征属性。约简后的特征加强了特征之间的语义联系,降低了特征的维度。约简后的算法在速度上和性能上都有所提高。本算法的计算复杂度为O(m(n/m)2log(n/m)+m2logm),其中m是约束类的数目。
2图模型文档向量表示
传统的文档分类和聚类算法主要采用向量空间模型(VSM)进行文档表示,向量空间模型将文档表示成一个向量,向量的每一维表示一个特征。根据特征对文档内容表达的重要性每个特征可以获得一个权重,文档每一维特征的权重用TF-IDF[13]公式计算。
在几乎所有真实的文档集中,某一属性在一个类别中的分布与在其它类别中的分布相差甚远,同一属性在不同类别中的重要性(或称相关性)也是不同的。所以,仅仅使用TF-IDF权重公式并不足够,它不能表示出每个属性在特定类别中的重要性大小,而只是从全局的角度衡量了每个属性对于所有类别的区分能力,对某些特定类重要性高的属性不能体现其在这些类中的代表作用,重要性低的属性亦可能极大程度地降低算法的性能。文献[14]针对这个问题,引入信息论中信息增益的概念,提出一种对TF-IDF的改进方法TF-IDF-IG文档表示方法。改进后的方法兼顾了词语在文档集合中的分布情况以及词语在文档集合中的比例分布情况,能较好地表现文档的内容。但无论是TF-IDF还是TF-IDF-IG方法,特征选择及权重计算都是基于频度这个因素考虑的,这样会掩盖一些重要的特征。
图模型是近年来的一个研究热点,它可以形象地描述事物之间的相互联系且便于理解。该方法克服了传统向量空间模型文档表示中词和词之间相互独立、忽略上下文的缺陷。在文档图的表示中,将文档提取的特征项作为表示文档图中的结点,特征词条之间的关系构成文档图中的边,用边上的权值表示相关联的两个特征项之间的共现程度。用图模型表示文档可以反映特征项之间的共现程度以及特征项之间的关联。两个特征经常共同出现在文档的同一个窗口单元(如一句话、一个自然段、一篇文档等),则认为这两个特征在意义上是相互关联的。文档分类的要求是找到类别特征,主要考虑的是特征和类之间的关系,特征和特征之间的关系实际上是由特征和类别之间的关系引申而来。而且一般情况下,一篇文档阐述一个主题,关于同一个主题的特征在一篇文档中同时出现的几率比较高,因此在文档分类应用中,我们选择整篇文档作为窗口单元构造图模型会更加有效。即对每一篇文档构造一个词与词的共现概率矩阵。这里的共现词可以是习惯搭配关系的词对,也可以是属于同一词类的词对,或者是在同一话题中经常出现的词对[15]。它们共现的频率越高,两个特征词的权值也就越大,特征的权值如式 (5)所示:
其中:W(tij,d)为共现的特征词tij在文档d中的权重;tf(tij,d)为特征词条i和特征词条j在某一窗口单元内的共现频率;IGij为共现的两个特征词条i、j的互信息值;N为文档训练集合的数目;Ntij为文档集合中含有特征词i、j的文档数量;a是一个常量(一般取0.01);log2(N/Ntij+a)为共现的两个特征词条i、j的逆文档频率函数。式(5)权重计算综合了词语位置、词语关系和词语频率等信息,挖掘了隐含的或潜在的关联特征,更加充分地表达文档的语义信息,与人的思维习惯相符,比传统的相互独立的词更有意义。
3文档分类方法
现有的文档分类方法主要有KNN、支持向量机、决策树、线性最小二乘法估计(LLSF)、贝叶斯分类算法以及神经网络等。其中,KNN分类方法是一种稳定而有效的文档分类算法,在现有文档分类方法中应用得比较广泛。它是一种基于实例的文档分类算法,其原理是对于某一给定的测试文档d,在训练文档集中通过相似度找到与之最相似的k个训练文档。根据这k个训练文档的类别来判断待分类文档的类别值。相似度的判定可以使用欧氏距离或向量间余弦夹角来度量。而最相似的k个训练文档按其与测试文档d的相似度高低对类别值加权,将文档分到权重最大的那个类别中从而预测测试文档d的类别值。
文档分类除对文档进行表示外,还必须对文档进行相似度度量。不同的相似度度量方法会出现不同的分类结果。一个文档中的所有特征,构成了文档的整个语义,特征之间的相互关联和共现,对于文档相似度来说是很有意义的[16]。针对传统KNN不涉及向量中各特征间的关系,使得距离计算不精确的不足,提出了一种改进KNN方法,它主要考虑到文档间不同特征项的属性关联与共现对相似度的作用,用两文档之间的匹配系数调整相似度,如式(6)所示:
其中:n是文档向量dx与di共现的特征项的个数;α为常量,其值反映关联与共现的重要度,该值有一个优选范围;|dx|、|di|是文档d中的特征词总数。
本文结合χ2统计量和特征聚类降维方法对特征空间进行降维处理,每篇文档根据聚类后的特征分布模式构造成一个m维的向量;采用图模型表示关联文档特征,建立文档分类样本空间,用图模型TF-IDF-IG权重式(5)计算特征词的权重并将属于同一模式的所有特征词的权重相加,其和作为m维向量中一维的权重;利用式(6)计算测试文档dx与训练集中所有文档的相似度;对计算出的相似度排序,选出K个最大值,作为dx的最近邻;根据K个最近邻判断dx所属类别,按照式(7)计算每类的权重P,将待分类样本归属为权重最大的类别。
其中:dx表示测试文档;simn为dx与di之间相似度;d1…di…dn为训练集合中与dx相似度最大的k个文档向量,y(dx,cj)为类别属性函数,即如果dx属于类别cj,那么函数值为1,否则为0。
4实验设计
搜狗实验室的互联网语料链接关系库(SOGOU-T)提供了一个大规模互联网语料链接关系对应表,用于验证各种链接关系分析算法的有效性和可行性。实验里我们选择语料关系库中的五大类(C000008财经,C000010 IT,C000013健康,C000014体育,C000024军事)中 5000篇短文用作训练样本,随机抽取1000篇用作测试样本实现文档分类。
训练步骤如下:1) 采用中科院分词工具ICTCLAS对选择的5000篇短文进行预处理。这些短文经过分词处理,统计得到33028个特征词条;2) 对样本语料进行进一步处理,先去除文档频率小于5的词,然后使用开方检验(CHI)算法进行计算,选择出10000多个特征词条;3) 统计出这些特征分别在五个类中的分布值,当λ=80%时统计表明A值应取100,CHI特征提取后选出7465个特征词条;4) 利用基于类别分布的特征聚类算法将7465个(对分类作用相同的词聚合成一个簇)词条聚合成1000个簇,聚类后的部分特征词如表1所示;5) 对语料库中的文档建立图模型,构建求相似度的统一向量模型;6) 最后应用KNN算法对将要分类的文档进行分类,相似度中α=1时优化效果最好,文档d中的特征词总数|dx|、|di|取值为30,KNN中的K=25时,分类效果较好。
我们对这7465个特征词进行了大量的实验,由于没法进行召回率的测试,因此对词汇聚类进行评价的最简单指标是准确率。分别采用K-means和凝聚层次聚类方法将其分为2000、1500、1000、800、700个簇,发现凝聚层次聚类容易出现大类的情况,最大的类有上千维,K-means也存在初值确定的问题。用本文的聚类分析方法得出总词数准确率。特征词聚类维数和准确度的关系如图2所示。
本文采用评估文档分类的主要三个指标:查准率P、查全率R和测试值F1。
为了比较在同样的分类语料条件下不同分类方法的分类效果,我们用KNN方法分别对基于图模型的特征向量和基于聚类分析的图模型特征向量进行了分类测试。分类结果如表2和表3所示。
5结语
本文通过χ2统计和特征聚类对特征项个数进行了两次压缩,提出的特征聚类方法选择具有相同分布模式的多个(一组)特征词代替传统算法中单个词来表示向量一维。图模型文档表示方法引入了语义因素在一定程度上解决了关联特征维的提取和向量空间维数高的问题,使得语法语义上具有相同特征的词构成概念簇。特征约简后的文档向量对概念表达更加完善,文档区分度更加显著。实验证明,本文算法对提高分类的精度和速度具有重要的意义。
摘要:针对传统向量空间模型中的特征项孤立处理问题,首先通过χ2统计和特征聚类相结合的模式实现特征降维,然后使用图模型来建立词和词之间相互关联信息,最后运用KNN方法进行文档分类测试。该算法提高了稀有词对分类的贡献,强化了关联词的分类效果,并降低了文档向量的维数。实验证明,该算法提高了分类的准确率和召回率。
知识交易视角下知识分类的研究 篇3
随着知识经济时代的到来,知识成为经济和社会发展中不可缺少的资源,知识管理成为一种重要的管理思想,知识交易的现象越来越多,知识交易问题成为知识经济和知识管理中必须研究的问题。
知识交易指知识拥有者通过对知识转移进行排他性控制进而获得经济利益的过程[1]。更简单地说,知识交易是买卖双方以知识为交易对象、以货币为媒介的价值的交换。交易的买方要获得知识的使用价值,卖方要获得知识及知识相关劳动的价值。
在知识交易相关的研究中,对知识交易相关问题的研究时经常会出现不完全相同的结论,甚至完全不同的结论。如关于知识是否可以交易的问题不同学者就会有不同的观点。Nelson、Arrow等经济学家认为将知识等同公共品来处理,认为知识只能通过政府供给,不存在知识交易的问题[2,3],Teece等认为知识具有公共品属性,知识难以定价,知识转移存在障碍,市场也不是生产和配置知识的可行机制,知识不可交易[4]。但Romer提出了知识交易的概念[1];Simon认为知识属于经济系统中频繁交易的商品类型之一,知识生产需要成本,知识获取需要价格,知识市场广泛存在[5];Davenpor等认为知识活动与传统的、有形的商品有相同之处,知识可以交易、购买、交换、寻找与制造[6]。
这些不统一的观点的出现,是因为不同类型的知识具有不同的经济特征。同样是在研究知识交易,但不同的学者可能在研究“知识”的不同子集。因此对知识交易的深入研究,应该建立在对知识在知识交易视角下的合理分类的基础上。
本文试图在知识交易视角下对知识进行分类,目的是使知识便于知识交易的研究。
1 知识交易视角下知识分类的方式
陈洪澜总结了知识分类的最主要的十种方式,分别是知识的效用、研究对象、知识属性、知识形态、事物运动形式、思维特征、自然现象和社会现象、知识研究方法、知识的内在联系、学科发展趋势[7]。
本文在知识交易视角下对知识的分类方式是第八种,即按照知识研究方法对知识分类。因为本文的研究目的是通过对知识分类便于对知识交易的研究。因此本文对知识分类的标准是否可以用管理学和经济学来研究知识交易,这正是对知识按照知识研究方法分类的一种方式。
知识研究是人类发现知识与求证知识的重要活动,不同的研究方法可以定义出不同的知识, 这就是人们以研究方法来区别知识类别的原由[7]。如根据是否可以用数学方法进行研究,知识分为成熟的学科和准学科;根据是否可以用逻辑学研究方法研究,知识分为抽象的学科、具体的学科以及介于抽象与具体之间的学科;根据是否可以采用实验方法研究,知识划分为实验学科和非实验学科等。
由此类推,在知识交易视角下对知识分类,就是区分哪些知识是可以进行交易的、哪些知识是不易于知识交易的,即哪些知识是可以做知识交易研究的,而哪些知识是不便于做知识交易研究的。
2 知识交易视角下对知识进行分类
查阅国内外文献对知识的分类,在知识交易视角下对知识进行分类的文献鲜有见之。但有一种知识分类是对知识交易下的知识分类有启发的。
1966年,Towers、Lux、Ray将人类知识分类成“描述性知识”、“规范性知识”、“形式性知识”与“实践性知识”四大领域。描述性知识是描述现象或事件的知识,这种知识用以追求及建立现象或事件的事实,如物理、化学、生物和社会相关知识;规范性知识是判断现象或事件适切性、好坏、美丑的知识,这种知识用以追求现象或事件的价值与信念,如哲学知识;形式性知识是统整所有知识的知识,如数学、语言及逻辑等知识;实践性知识是对现象或事件采取适宜行动、实践的知识,这种知识用以追求有效的应用行动,如医疗、新闻、工程、设计和教育等知识[8]。
可以看到实践性知识是易于被感受到使用价值的一种知识,因为实践性知识的目的是将知识转化为有效的行动,是能够切实解决事件中遇到的问题的。
如一所大学购买了自动排课软件就可以马上实现自动排课,教学管理的效率立刻提高;一个组织购买了办公楼装修图纸就可以立刻开始装修施工;一个企业的管理问题采纳了咨询师的意见迅速得到了解决。由此看来实践性知识是有使用价值的,因此是可以交易的。而非实践性知识,即描述性的知识、规范性的知识、形式性的知识的使用价值不是直接能够为人所感知的。如学习了哲学知识,一个人的哲学水平并不是马上能够上升一个台阶;哲学思想也没有办法物化到一种形式中让一个人短时间内体会到哲学思想对他的指导。
马克思主义政治经济学认为,使用价值是一切商品都具有的共同属性之一。任何物品要想成为商品都必须具有可供人类使用的价值;反之,毫无使用价值的物品是不会成为商品的。知识想要成为商品,必须有使用价值,甚至必须有人们能够明显地体会到的使用价值。在任何交易中,商品消费者是为了获取使用价值。知识可以帮助人们直接解决其所遇到的问题时,人们才有购买知识的意愿。
实践性知识正是一种人们能够明显地体会到其使用价值的知识,因此实践性知识是可以成为商品的,是可以作为交易对象的。
而非实践性知识不是没有使用价值,而是其使用价值不易为人所感知,或者在较短时间难以体现出来,因此非实践性知识不易于交易,或者说交易的形式非常单一,如可以想到的对物理、化学、生物、哲学、数学、语言、逻辑这些知识的交易形式只能是课堂讲授。
通过这种知识分类可以看到,实践性知识是可以或易于交易,而非实践性知识是不易于、甚至不能交易的。为了便于知识交易的研究,实践性知识应当与非实践性知识区别开来。
3 通过知识抽象-实用度模型对知识分类
3.1 知识抽象-实用度模型
周波根据知识的抽象程度将知识进行一个连续的分类,令α,α∈(0,1)为知识抽象度参数,α=1的知识为极度抽象知识,表示人们完全看不到该知识的具体应用价值,令β,β∈(0,1)为知识实用度参数,β=1的知识为极度实用、具有确定而唯一的使用价值的知识(具有确定而唯一的使用价值),对于任何一件知识i,有下列等式成立αi+βi=1,人类全部知识分布在图1的AB线段中[9]。
这个模型从抽象度和实用度将知识进行连续排列,对研究知识分类很有意义,但这个模型也有一些不足。原模型的不足与改进如下:
1)原模型中只能体现出知识的抽象度和实用度的相对值,而没有体现出抽象度和实用度的绝对值。
知识的抽象度和实用度的相对值表示一个知识的抽象度和实用度的比例关系,而知识的抽象度和实用度的绝对值则表示一个知识的抽象程度和实用程度究竟是多少,相对值是绝对值标准化的结果。设A(A>0)为知识的抽象度绝对值,而B(B>0)为知识的实用度绝对值,则
抽象度和实用度可以表示一个知识本身的抽象价值多一些,还是实用的价值多一些。而多个知识相比时不能用抽象度和实用度来表示,只能用抽象值和实用值来表示。如知识一和知识二的抽象度和实用度均为0.4和0.6,但实际上知识一的抽象值和实用值都要远远高于知识二的抽象值和实用值。甚至知识一的抽象度为0.3,而知识二的抽象度为0.5,但知识一的抽象值可能远远大于知识二的抽象值。
解决这个问题的方法是在原模型中增加对知识的抽象值和实用值的表示 。
2)原模型中的AB线段上的点与知识不是一一对应的。
图中AB线段上的点对应的不止一个知识,甚至不止一类知识。如前面的例子,知识一和知识二的抽象度和实用度均为0.4和0.6,但实际上知识一的抽象值和实用值都要远远高于知识二的抽象值和实用值,但这两个知识在原模型中位于一个点上。而且即使两类知识的抽象度、实用度、抽象值、实用值均相同,也不能认为这就是相同的知识。
解决这个问题可以在模型中增加知识个数的维度,使此二维模型成为三维模型,但知识并非实体产品,难以计数或计类,所以增设知识个数的维度意义不大。因此只要在原模型中明确指出AB线段中的每一个点都代表了一些知识,而不是一个知识即可。
3)原模型认为β=1的知识为极度实用、具有确定而唯一的使用价值的知识。
而笔者认为β=1的B点已经不是知识了,而是实体产品或服务了,因为在B点已经完全不具有抽象度,只具有实用度。
4)原模型的形式不符合一般的数学坐标形式,不利于理解。
模型一般应该采用笛卡尔直角坐标系,在此模型中可以用x轴来表示实用值,用y轴来表示抽象值。比原模型中有两个纵轴、一个横轴的坐标形式更容易理解。
将经过改进之后的模型命名为“知识抽象-实用度模型”,如图2所示。
知识抽象-实用模型中,纵轴A表示抽象值,横轴B表示实用值。原模型未对“抽象度”和“实用度”进行详细解释,改进后的模型对“实用值”的解释是人们主观能够体会到的知识的实用的程度,而不是知识客观上的实用程度;对“抽象值”也指人们主观能够体会到的知识的抽象程度,而不是知识客观上的抽象程度。事实上也没有办法衡量知识客观上的实用程度和抽象程度。人们主观能够体会到的知识的实用值和抽象值可以通过对多个人对一组知识的实用程度和抽象程度的排列,然后求平均值来得到一个值。
任何一个知识i都可以在知识抽象-实用度模型中的AOB平面找到一个对应的点K。由图2可知,点K的纵横坐标分别是知识i的抽象值Ai和实用值是Bi;而直线A+B=1与OK射线的交点的纵横坐标分别表示知识i的抽象度αt和实用度βi。
AOB平面中的每一个点表示相同抽象值、实用值、抽象度、实用度的一些知识;AOB平面中每个角度的OK射线表示一组抽象度、实用度相同的知识,离原点O越远,抽象值和实用值越大。
3.2 通过知识抽象-实用度模型对知识分类
通过知识抽象-实用度模型对知识分类。
1)OK0射线是非实践性知识和实践性知识的分界线。
若在AOB平面中添加一条临界射线OK0,平面BOK0内的知识为实践性知识,如图3所示。这些知识的特征是实用度相对较大,而知识的抽象度相对较小。OK0射线的斜率不一定是45度,OK0是非实践性知识和实践性知识的分界线,AOB平面中左上方是非实践性知识,右下方是实践性知识;OA轴是伪知识,因为如果知识没有任何的实用性也就没有存在的必要;OB轴上是传统产品,即实体产品若服务,因为OB轴的内容毫无抽象性,只有实用性。
2)射线B=B0是显式使用价值较高与较低的分界线。
另外,知识的实用值需要到达一定的值时,知识的实用性才显著,人们都会认识到知识的使用价值,知识才会有需求。在AOB平面中用一条平行于OA的射线B=B0将AOB平面分成两个部分,左边部分的知识是被人们认为使用价值较低的知识,即显式使用价值低的知识;右边部分的知识是被人们认为使用价值较高的知识,即显式使用价值高的知识,如图3所示。人们往往认为显式使用价值高的知识有购买和消费的必要。
3)OK0射线和射线B=B0将知识分为四类。
图3将包括人类所有知识的AOB平面被OK0射线和射线B=B0分成了四个部分,顺时针编号为Ⅰ区、Ⅱ区、Ⅲ区、Ⅳ区,分别代表四类不同的知识。
Ⅰ区是显式使用价值较低的非实践性知识,即抽象度大于实用度、实用值也比较小。这类知识没有明显的使用价值,或其使用价值完全无法为人所感知。这类知识几乎没有交易的可能,这类知识靠知识的拥有者主动地无偿地传播给别人。如宗教知识的显式使用价值不高,抽象度较高,实用度较低。传教士就是坚定地信仰宗教,拥有宗教知识的人,他们远行并向不信仰宗教的人们传播宗教,大部分宗教使用传教士来扩散它的影响。
Ⅱ区是显式使用价值较高的非实践性知识,即抽象度大于实用度,但实用值比较大。如哲学、数学、逻辑等,这些知识比较抽象,但人们也都知道这些知识的实用度比较高。这种知识的传播主要靠课堂讲授。课堂讲授不能算做是完全的知识交易,通过课堂消费者可以拿到理论知识本身,但不一定会运用这些知识解决问题。这种情况下,知识并没有使用价值。而知识是否有使用价值,才是判断知识是否是商品,是否能成为交易对象的标准。
Ⅲ区是显式使用价值较低的实践性知识,即实用度大于抽象度,但实用值比较小。这类知识有实用性,但实用性较小,不值得交易。如如何才能把地扫得更干净的知识,有实用性,但价值较低,这类知识一般靠口口相传。
Ⅳ区是显式使用价值较高的实践性知识,即实用度大于抽象度,并且实用值比较大。这类知识实用性很强,并且能够解决人们难以解决的、对人们很重要的问题,人们如果获得这样的知识会感到有很大的效用。如管理软件的开发知识、装修图纸的设计知识、管理咨询的相关知识等。这类知识是有巨大的市场需求的,是有消费需求的,是可以交易的。
Ⅳ区知识也可以通过课堂讲授的形式来传播。如前所述,课堂讲授不等同于知识交易,对以下两种情况相对比,第一种情况是通过课堂学习了软件开发知识和管理知识,然后去开发管理软件,第二种情况是直接购买了管理软件。第一种情况的交易对象是教师讲授的能力,因为教师讲授的能力在这个过程中是有使用价值的,教师讲授的能力使得学生听懂了教师所讲授的内容,学生的所付的学费购买的是教师讲授的能力,而教师所讲授的知识在这个过程中对作为消费者的学生并没有使用价值,或者说教师所讲授的知识并不会在短时间内发挥出作用;第二种情况的交易对象是软件开发知识和管理知识,以及物化之后的软件,消费者可以通过软件这种载体立即体会到知识的使用价值。
通过知识抽象-实用度模型,把知识分成了四类,如表1所示。
通过知识抽象-实用度模型对知识分类,发现实用值较高的实践性知识是适合于交易的,根本原因是实用值较高的实践性知识是人们容易感知到其使用价值的知识,而使用价值是商品的自然属性。
3.3 知识的发展方向
在知识抽象-实用度模型对知识分类的过程中,实用值指的人们主观能够体会到的知识的实用价值,而不是知识客观上的实用价值。因此随着社会的发展,随着人们对某类知识的认识的加深,从知识交易视角来看,知识是会发展的。
从知识交易视角来看,人们知识的认识逐步加深,知识的发展是实用值会越来越大,抽象值越来越小,因此实用度也会越来越大。实用值越来越大,意味着知识向右方发展;实用度和抽象度的比例越来越大,意味着知识向右下方发展,如图3所示。
知识发展的实践也证明了这一点。如物理、化学这些今天看上去实用度很高的知识,在它们刚刚被发现的时候,人们还不能意识到这些知识的实用价值,那个时候物理、化学知识还处于图3中的Ⅰ区,传播方式是知识的拥有者无偿地传播给别人。如明清时期,传教士为中国带来了很多西方科学文化知识。今天人们认为是没有什么用的知识,可能到若干年后是有实用价值的。
知识由抽象向实用发展,实用值由低向高发展,在知识抽象-实用度模型中体现为向右下方发展。
也因为这样的原因,就用“实践性知识”这个词来描述实用值较高的实践性知识即可,因为实用值较低的实践性知识随着知识本身的进一步发展或人们对知识的认识的深入,也是会发展成为实用值较高的实践性知识的。
3.4 实践性知识和非实践性知识、传统产品的经济特征对比
通过知识抽象-实用度模型可知,非实践性知识、实践性知识、传统产品是从抽象到实用的一个渐变过程。非实践性知识是不易于交易的,实践性知识是易于交易的,传统产品是完全可以交易的。非实践性知识、实践性知识、传统产品的经济特征有较明显的区别,也是一个渐变的过程,如表2所示。
4 结论
综上所述,可得出如下结论:
1)知识交易视角下对知识的分类是一种按照知识研究方法对知识分类的方式,目的是找到哪些是适合知识交易、可以用知识交易相关方法来研究的知识;
2)根据改进的知识抽象-实用度模型把知识分成四种,其中实用值较高的实践性知识是适合交易的知识。知识的发展方向是由抽象到实用、实用值由小到大;
3)非实践性知识、实践性知识和传统产品的经济特征是渐变的过程,是从不易交易到完全可以交易的一个渐变过程;
4)知识交易可以集中到对实践性知识交易的研究,进一步的研究可以是实践性知识交易的具体经济特征的分析、实践性知识交易的价格模型、实践性知识交易价格模型的实证研究等。
参考文献
[1]ROMER P M.Endogenous Technological Change[J].Jour-nal of Political Economy,1990,98(5):74-102.
[2]NELSON R R.The Simple Economics of Basis Research[J].Journalof Political Economy,1959(67):197-307.
[3]ARROW K J.The Economic Implications of Learning by Do-ing[J].Review of Economic Studies,1962(29):155-173.
[4]TEECE D J.Towards an Economics Theory ofthe Multiprod-uct Firm[J].Journal of Economic Behavior and Organization,1982(3):39-63.
[5]SIMON HA.The Many Shapes of Knowledge[J].Revue D'économie Industrielle,1998,88(2):23-39.
[6]DAVENPORT H T,PRUSAK L.Working knowledge:HowOrganizations Manage What They Know.Boston[M].MA:Harvard Business School Press.1998.
[7]陈洪澜.论知识分类的十大方式[J].科学学研究,2007,25(1):26-31.
[8]TOWERS,LUX,RAY.A rational and structure for industrialarts subject matter[G].Columbus:Ohio State University,1966.
知识文档分类 篇4
本文试图在知识交易视角下构建一个知识分类的模型, 分类的标准是使不同类别具有不同的经济特性, 目的是使便于对知识交易的进一步的研究。
1 知识的定义
知识是人们在认识世界和改造世界实践活动中的认识和经验的总结, 不同的学者对知识的定义各不相同。
一部分学者对知识的定义建立在对数据、信息、知识、智能等相关联的概念的认识上, 如Zack、Fahey&Prusak、Bender&Fish等[1,2,3]。这种认识中, 认为数据是对客观事实的记录;信息是在一定的情况下对数据的解释;知识则是信息的应用, 是对信息进行分析、归纳而形成的规律性认识;智能不仅要发现事物的规律, 还要对知识进行创新用以解决实际的问题, 是创造性的产物, 是知识的最高形式。这种知识的定义指出了知识的作用, 而没有指出知识具体包括的内容。
另一类对知识的定义则明确指出了知识包括的内容。Nonaka认为知识是充分证实的真实信仰[4]。Davenport和Prusak将知识解释为一种具备流动性特质的综合体, 如文字化的信息、结构化的经验、专家独特的见解等都属于知识的范畴, 知识无处不在, 它不但可以隐藏在日常例行的工作、规范之中, 也可以借助于文件化、系统化的机制将知识储存在组织的数据库中[5]。这种对知识的定义更加明确, 更容易让人理解什么是知识, 哪些内容是知识。
在知识交易视角下, 笔者更认同Davenport和Prusak对知识的定义, 有如下两个原因:首先这种对知识的定义认为知识有实用性, 如经验和见解都是解决具体问题的;其次, 这种对知识的定义认为知识是可以物化的, 如文件形式的知识、数据库形式的知识。知识的这两个特点都决定了知识是可以交易的。
2 知识分类概况
知识分类就是按照知识的学科属性将其予以一一揭示, 并分门别类地把它们系统组织起来的方法。知识经过分类后, 就可以显示出每一种知识的学科性质和它们之间的内在联系。性质相同就聚集在一起, 性质相近就联系在一起, 性质不同就予以分开[6]。
陈洪澜总结了知识分类的最主要的十种方式, 分别是知识的效用、研究对象、知识属性、知识形态、事物运动形式、思维特征、自然现象和社会现象、知识研究方法、知识的内在联系、学科发展趋势[7]。
本文在知识交易视角下对知识的分类方式属于按照知识研究方法对知识分类, 本文的研究目的是通过对知识分类便于对知识交易的研究。
知识研究是人类发现知识与求证知识的重要活动, 不同的研究方法可以定义出不同的知识, 这就是人们以研究方法来区别知识类别的原由[7]。如根据是否可以用数学方法进行研究, 知识分为成熟的学科和准学科;根据是否可以用逻辑学研究方法研究, 知识分为抽象的学科、具体的学科以及介于抽象与具体之间的学科;根据是否可以采用实验方法研究, 知识划分为实验学科和非实验学科等。
由此类推, 在知识交易视角下对知识分类, 就是区分哪些知识是可以进行交易的、哪些知识是不易于知识交易的, 即哪些知识是可以做知识交易研究的, 而哪些知识是不便于做知识交易研究的。在知识交易视角下对知识分类的研究比较少。
3 知识抽象———实用模型的构建
知识交易指知识拥有者通过对知识转移进行排他性控制进而获得经济利益的过程[8]。通俗地讲, 知识交易是买卖双方以知识为交易对象、以货币为媒介的价值的交换, 交易的买方要获得知识的使用价值, 卖方要获得知识及知识相关劳动的价值。
任何物品要想成为商品都必须具有可供人类使用的价值;反之, 毫无使用价值的物品是不会成为商品的。知识想要成为商品, 必须有使用价值, 必须有人们能够明显地体会到的使用价值。
因此, 知识是否有用决定了知识是否易于交易, 知识是否有用应该是知识交易视角下知识分类的重要分类标准。
关于知识分类的国内外文献很多, 但在知识交易视角下对知识的分类方式没有查到。但有一个知识分类标准与知识的有用性有关, 对知识交易视角下的知识分类有一定的启发。
2006年, 周波在其《知识交易及其定价研究》一文中提到了一个模型, 此模型根据知识的抽象程度将知识进行一个连续的分类。这个模型具体内容如下:
令α, α∈ (0, 1) 为知识抽象度参数, α=1的知识为极度抽象知识, 表示人们完全看不到该知识的具体应用价值, 令β, β∈ (0, 1) 为知识实用度参数, β=1的知识为极度实用、具有确定而唯一的使用价值的知识 (具有确定而唯一的使用价值) , 对于任何一件知识i, 有下列等式成立αi+βi=1, 人类全部知识分布在图1的线段AB中[9]。
这个模型抽象度和实用度将知识进行连续排列, 在此称此模型为“抽象度-实用度模型”。虽然此模型在表述过程中强调了抽象度的重要性, 但同时也提到了实用度, 与知识交易视角下对知识分类的标准“知识是否有用”相一致。可以通过借鉴和改进这个模型来构建知识交易视角下的知识分类模型。
分析这个模型, 发现照搬这个模型作为知识交易视角下的知识分类模型有一些不合理之处。
(1) 原模型中抽象度和实用度本本身是一个表示程度的相对量, 而不是一个绝对量, 抽象度和实用度需要通过其它绝对量求出, 这样对进行知识分类不够直观。
解决这个问题的方法是用知识的抽象值和实用值替代抽象度和实用度来作知识分类的维度。知识的抽象值和实用值表示一个知识的抽象程度和实用程度究竟是多少, 知识的抽象度和实用度表示一个知识的抽象值和实用值的比例关系, 是对抽象值和实用值标准化的结果。
设A (A>0) 为知识的抽象度绝对值, 而B (B>0) 为知识的实用度绝对值, 则原模型中
(2) 原模型的形式不符合一般的数学坐标形式, 不利于理解。
模型一般应该采用笛卡尔直角坐标系, 在此模型中可以用x轴来表示实用值, y轴来表示抽象值。比原模型中有两个纵轴、一个横轴的坐标形式更容易理解。
将经过改进之后模型命名为“知识抽象-实用模型”, 如图2所示。
知识抽象-实用模型中, 纵轴表示抽象值A, 横轴表示实用值B。原模型未对“抽象度”和“实用度”进行详细解释, 现对知识抽象-实用模型中的变量进行解释。
“实用值”是人们主观能够体会到的知识的实用的程度, 而不是知识客观上的实用程度;“抽象值”也人们主观能够体会到的知识的抽象程度, 而不是知识客观上的抽象程度。知识的实用值和抽象值只能通过人主观地体会, 无法衡量知识客观上的实用程度和抽象程度。
接下来产生了两个问题, 即抽象值和实用值的大小如何来衡量、单位应该是什么。知识抽象值和实用值的大小的衡量可以采用多个人对一组知识的实用程度和抽象程度的排列, 然后求取平均值的方法来求得。当然知识的抽象值大小会与来参加评价知识的人的学识的多少、感受的强弱程度有关。如何才能使更科学地衡量知识的抽象值和实用值的大小, 应该是下一阶段研究的问题。知识抽象值和实用值的单位应该是什么, 现有的知识相关研究中也未曾提及, 但这个单位是什么不是非常重要, 在这里也不做讨论, 也可以是下一阶段深入讨论的一个问题。
现在先回到知识抽象———实用模型本身来讨论。任何一个知识i都可以在知识抽象———实用模型中的AOB平面找到一个对应的点K。由图2可知, 点K的纵横坐标分别是知识i的抽象值Ai和实用值是Bi;而直线A+B=1与OK射线的交点的纵横坐标分别表示知识i的抽象度αt和实用度βi。
(3) 原模型中性质完全不同的知识可能会重叠在一个点上。
假设有这样两种知识。知识一的抽象程度和实用程度都比较低, 知识二是的抽象程度和实用程度都比较高。对于知识一本身来说, 其抽象程度和实用程度基本一样, 因此知识一的抽象度和实用度均为0.5;同样对知识二本身来说, 其抽象程度和实用程度也基本一样, 因此知识二的抽象度和实用度也均为0.5。在图1中这两个点都会位于O点, 但明显地, 知识一没有太大的实用价值, 是不适合交易的知识, 而知识二是实用程度高的知识, 是适合交易的知识。
如果用知识的抽象值和实用值来作为知识分类的维度, 已经解决了这个问题。在图2中知识一可能会位于K1的位置, 而知识二会位于K2的位置。实用程度不同的知识不会在改进后的模型中出现重叠的现象。
知识抽象-实用模型中, AOB平面中的每一个点表示相同抽象值、实用值、抽象度、实用度的一些知识。AOB平面中每个角度的OK射线表示一组抽象度、实用度相同的知识, 离原点O越远, 抽象值和实用值越大。
(4) 原模型中的AB线段上的点与知识不是一一对应的。
已经知道图1中AB线段上的点对应的不止一个知识, 甚至不止一类知识。
改用知识的抽象值和实用值作分类维度之后, 这个问题得到了部分解决。在图2的模型中, 一个点已经对应了一类知识, 即相同抽象值、实用值、抽象度、实用度的一类知识, 比原模型要好一些。
但如果想让知识和模型中的点一一对应起来, 需要在知识抽象———实用模型这个二维模型中增加另外一个维———知识的序数, 使之成为三维模型。但知识并非实体产品, 难以计数, 所以增设知识序数维意义不大。因此只要在抽象-实用模型中明确指出AB线段中的每一个点都代表了一些知识, 而不是一个知识即可。
(5) 原模型认为β=1的知识为极度实用、具有确定而唯一的使用价值的知识。但笔者认为β=1的B点已经不是知识了, 而是实体产品或服务了, 因为在B点已经完全不具有抽象度, 只具有实用度。
对原模型的不合理之处一一进行改进之后, 形成了较为合理的知识抽象———实用模型, 如图1所示。
4 知识交易视角下的知识分类
知识抽象———实用模型中可以看到:左上部分的知识的实用度较小、抽象度较大;右下部分是实用度较大、抽象度较小;左边部分的知识的显式使用价值较低, 右边部分的知识的显式使用价值较高。
在模型中添加临界射线OK0, 作为实用度较高和较低的知识的分界线;添加射线B=B0, 作为实用值较高与较低知识的分界线。
图3将包括人类所有知识的AOB平面被OK0射线和射线B=B0分成了四个部分, 从上到下、从左到右编号为Ⅰ、Ⅱ、Ⅲ、Ⅳ, 分别代表四类不同的知识。
Ⅰ区实用度较低、实用值也较低的知识。这类知识的抽象值要比实用值高, 实用值较小, 甚至人们几乎不能用它来解决任何实际问题。这类知识几乎没有交易的可能, 这类知识靠知识的拥有者主动地无偿地传播给别人。如宗教知识的显式使用价值不高, 抽象度较高, 就属于这类, 宗教知识靠传教士等信仰宗教、拥有宗教知识的人去传播, 一般不会有人去购买这类知识。
Ⅱ区是实用度较低、但实用值较高的知识。实用度是实用值和抽象值的比例关系, 实用度低、实用值高这两个特征并不矛盾。如哲学、数学、逻辑等, 这些知识比较抽象, 但人们也都知道这些知识是有实用价值的, 可是这些知识却也不能直接拿来解决什么问题。这种知识的传播主要靠课堂讲授, 知识的接受者通过课堂了解了这些知识后仍需较长时间的领会的过程, 有的人可以通过较长的时间将这些知识用于实践, 有的人在较长时期内也只明白相关理论, 无法将这些知识用于实际问题的解决中。课堂讲授不是知识交易, 学费购买的只是教师讲授课程、管理课堂等的能力, 而不是知识。学生并没有支付知识的价格, 也没有能够拿来课堂上的知识直接去解决什么实际问题。
Ⅲ区是实用度较高、实用值较低的知识。实用度是实用值和抽象值的比例关系, 实用度高和实用值低这两种情况也是可能同时出现的。这类知识几乎没有什么抽象性, 实用值比抽象值高, 但实用值也小, 不值得交易。如如何才能把地扫得更干净的知识, 有实用性, 但价值较低, 一般没有人去购买这类知识, 这类知识一般靠口口相传。
Ⅳ区是实用度和实用值都较高的知识。这类知识实用性很强, 能够解决人们难以解决的、对人们很重要的问题, 人们如果获得这样的知识会感到有很大的效用。这类知识也有抽象值, 但抽象值并不妨碍人们去使用这种知识去解决问题。如管理软件、装修图纸、企业管理方法都是有抽象程度的, 但更重要的是可以拿来直接去用、去解决问题。这类知识是有巨大的市场需求的, 是可以交易的。
对这四类知识的总结如下, 如表1所示。
通过知识抽象———实用模型对知识分类, 发现实用度和实用值都较高的知识才是适合于交易的, 可以用“实践性知识”一词来描述这类知识。“实践性知识”一词来源于Towers、Lux、Ray对知识的分类, 实践性的知识 (Praxiological Knowledge) 是对现象或事件采取合宜行动、实践的知识, 此种知识用以追求有效的应用行动, 医疗、新闻、工程、设计和教育等知识即属之, 技职教育所探讨传授的知识即属于实践性的知识[10]。虽然Towers等人对知识的分类标准不是知识交易视角、分类目的也不是知识交易的研究、分类的结果也与知识抽象-实用模型下的分类不同, 但实践性知识的含义与此处的“实用度高且实用值高的知识”非常接近。
在知识抽象-实用模型对知识分类的过程中发现, 实用值指的人们主观能够体会到的知识的实用价值, 知识客观上的实用价值是无法衡量的。因此从知识交易视角来看, 知识是会发展的。人们知识的认识逐步加深, 实用值会越来越大, 抽象值越来越小, 因此实用度也会越来越大。实用值越来越大, 意味着知识向右方发展;实用度越来越大, 意味着知识向右下方发展, 如图3所示。
知识发展的实践也证明了这一点。如物理、化学这些今天看上去实用度很高的知识, 在它们刚刚被发现的时候, 人们还不能意识到这些知识的实用价值, 那个时候物理、化学知识还处于图3中的Ⅰ区, 传播方式是知识的拥有者无偿地传播给别人。如明清时期, 传教士为中国带来了很多西方科学文化知识, 因为那时人们并没有意识到这些知识的实用性, 而现在这些知识已经生产生活中必不可少的知识。同样, 今天人们认为是没有什么用的知识, 可能到若干年后才知道这些知识也是有实用价值的。
知识的实用度由小到大发展、实用值由低向高发展, 在知识抽象-实用模型中体现为向右下方发展。
5 结论
(1) 知识抽象———实用模型下, 把知识分成四类, 其中实用度高、实用值也高的实践性知识是适合交易的知识, 应该是知识交易研究的对象。
(2) 知识抽象———实用模型表明, 知识的发展方向是由抽象到实用、实用值由小到大;
(3) 对此模型可以进一步深入研究的问题有:知识的实用值和抽象值的单位和大小应该如何确定;如何去确定OK0射线的斜率;B0的值应该如何确定。
参考文献
[1]ZACK M.Managing Codified Knowledge[J].Sloan Management Review, 1999, 40 (4) :45-58
[2]FAHEY L, PRUSAK L.The Eleven Deadliest Sins of Knowledge Management[J].California Management Review, 1998, 40 (3) :265-276
[3]BENDER S, FISH A.The Transfer of Knowledge and the Retention of Expertise:the Continuing Need for Global Assignments[J].Journal of Knowledge Management, 2000, 4 (2) :125-137
[4]NONAKA I.A Dynamic Theory of Organizational Knowledge Creation[J].Organization Science, 1994, 5 (1) :14-37
[5]DAVENPORT, T H, PRUSAK L.Working Knowledge:How Organizations Manage What They Know[M].Boston, MA:Harvard Business School Press, 1998:231
[6]张余.知识分类新探[J].图书馆论坛, 2006, 26 (6) :175-177
[7]陈洪澜.论知识分类的十大方式[J].科学学研究, 2007, 25 (1) :26-31
[8]ROMER P M.Endogenous Technological Change[J].Journal of Political Economy, 1990, 98 (5) :74-102
[9]周波.知识交易及其定价研究[D].复旦大学博士学位论文, 2006:45
【知识文档分类】推荐阅读:
土地登记理论知识文档09-10
数学知识竞赛简报 文档10-02
金融知识总结文档210-28
食堂食品安全知识培训 文档07-26
高考地理知识点汇总之河流专题-文档资料06-29
11、药品知识培训试题及答案Microsoft Word 文档10-19
七年级上册生物期末复习知识点总结大全-word文档05-29
各单位纠风工作档案分类 文档07-02