语义关联度

2024-07-28

语义关联度(精选4篇)

语义关联度 篇1

摘要:词汇语义关联度计算是信息检索和自然语言处理的关键问题之一。针对该问题提出一种改进的基于Wikipedia语义关联度计算方法 WGR。该方法使用Wikipedia数据集作为背景知识库,在传统方法的基础上融合维基文章中的布局信息,并对维基概念的入链和出链使用不同的方法进行处理;引入Google搜索资源,经分类筛选后使用LDA建模计算关联度;最后综合两个数据集的结果得到WGR语义关联度。通过实验分析,WGR在与现有算法比较时,取得了更好的准确率。

关键词:语义关联度,文章网络,布局信息,维基百科,隐含狄利克雷分布,谷歌

0 引言

语义关联度研究是信息检索、人工智能等领域的基础性研究课题之一,有着重要的研究价值。

传统的语义关联度计算方法包括单纯的对大型语料库进行统计分析,不涉及到相关的背景知识[1,2],或者使用人工构建的带有少量外部知识的词典资源[3,4]。近年来出现了很多利用Wikipedia计算语义关联度的方法。维基文章间丰富的链接关系构成的文章网络及文本内容能提供大量明确定义的语义知识。虽然Wikipedia是数以百万计的用户协作编写的百科全书,内容覆盖广泛,有研究表明,其内容的准确性与由专家写成的大英百科全书相差无几[5]。与传统背景知识库相比,Wikipedia内容的结构化和准确性使其成为更好的语义关联度计算背景知识库。但现有的基于Wikipedia计算语义关联度的方法还存在着一些不足: 1) 着重于链接网络和维基分类树而忽视文本内容;2) 没有考虑Wikipedia存在的缺陷,如更新滞后、覆盖度有限等,没有引入相应的内容进行补充。

针对这些缺陷,本文提出了一种改进的基于Wikipedia词汇语义关联度计算方法WGR,主要贡献如下:

( 1) 引入了维基文章页面布局信息,在使用Wikipedia计算关联度时可以更准确地描述词语-文章的关联性。

( 2) 对维基概念的输入链接( Backward Links) 和输出链接( Forward Links) 分别应用不同的处理方法,从而在Wikipedia内容处理中既应用了维基文章的文本内容,又考虑了多层输出链接。

( 3) 引入Google搜索资源,经过分类器筛选后进行LDA建模从而计算关联度,最后综合Wikipedia和Google资源的结果得到WGR语义关联度。

1 相关研究

现有的语义关联度计算方法主要区别在于利用了不同的背景知识。较早的基于人工语义词典如Word Net和Roget的方法[6],其准确性受限于人工词典的容量和更新情况。其后出现的基于语料库的方法,通过对大量文本集合进行统计分析得到比较全面的背景知识库,其中LSA算法[7]是准确率较高的算法之一,但其需要对语料库进行大量预处理。

Strube和Ponzetto[8]首先开始利用Wikipedia计算语义关联度,所提出的WikiRelate算法将基于Wordnet的方法进行修改后应用到Wikipedia上,取得了和基于Wordnet相近的准确度。Gabrilovich和Markovitch[9]提出的ESA算法是目前准确率最高的语义关联度计算方法之一,该方法采用向量空间模型对维基文章进行建模,不仅可以比较词汇的语义关联度,还可以比较文本内容之间的语义关联度。Milne和Witten[10]提出的WLM算法,采用向量空间模型处理Wikipedia文章网络链接,结合NGD距离( Normalized Google Distance)[11],算法开销低于ESA,且取得了较高的准确率。孙琛琛等[12]提出的WSR算法,引入带权重的链接,并借鉴TF-IDF定义链接权重,从而分析文章网络的多层次结构,最后结合维基分类树计算关联度,算法开销远小于ESA,也取得了较高的准确度。李赟等[13]利用中文维基百科进行语义相关词的获取及其相关度分析。

Radinsky等[14]提出的TSA算法将Wikipedia资源和纽约时报的文章结合使用。使用了纽约时报从1863 年至2004 年的文章存档,先将每个词转换为一系列包含这个词的维基文章的集合,通过维基概念在纽约时报文章中分布的相似性计算原始词的语义关联性。

文献[15]使用LDA对Wikipedia数据集进行建模,将词语描述成高维向量,向量由两部分组成: 词语与上下文临近词的关联度组成的向量,LDA模型输出的对词语的主题表达向量,通过计算高维向量的余弦距离得出语义关联度,也取得了较好的准确度。

2 基于Wikipedia语义关联算法WGR

本文提出的WGR语义关联度计算方法整体流程如图1 所示。该算法主要包括两个部分: 首先是利用Wikipedia数据集的语义关联度计算WikiRel,将待计算语义关联度的词语映射成维基概念后,对每个维基概念所处文章网络中的输入链接和输出链接采用不同的方法计算,计算过程中结合维基文章的页面布局信息,更精确地描述词语-文章关联性。其次是利用Google搜索结果的语义关联度计算GooRel,取得每个待计算关联度的词语在Google搜索中的结果集,使用分类器筛选后进行LDA建模,计算词语各自主题向量的余弦距离。最后综合两个部分得到WGR算法。

2. 1 基于Wikipedia数据集关联度计算WikiRel

已有的基于Wikipedia的关联度算法[8,9,10,11,12,13]大多只考虑文本内容或文章网络。为了综合考虑文章网络和文本内容,本文采用不同的方法对入链和出链进行处理,其中入链( Backward Links) 即目标概念出现在某个维基概念的描述文章中; 出链( Forward Links) 即目标概念的描述文章中出现了某个维基概念。最终取二者的加权和得到WikiRel关联度。

2. 1. 1 维基页面布局信息

图2 为维基文章页面示例,维基文章中的首段通常是对该文章所描述维基概念的概要说明; 在维基页面中显示为蓝色字体的即锚文本; 文章中被加粗为黑体或斜体表示强调说明,如图中的”Apple Computer,Inc”和”Fortune”; 此外,Wikipedia编辑过程中,会附加相关的图片资源进行辅助说明,如图2 中图片下方文字说明。

页面布局信息可以使用正则表达式从维基文章编码中提取。例如,在维基文章编码中,被两个单引号、三个单引号包起来的分别渲染成黑体、斜体; 附图描述为‘[[Image: < filename >| Ac | < caption > ]]’,参数< caption > 即为图片描述; 超链接在编码中有两种形式: ’[[< article name > | < anchor text > ]]’和’[[< article name > ]]’,取前者的anchor text和后者的article name为锚文本。

2. 1. 2 维基页面间的链接信息

Wikipedia中存在着多种链接,不同的链接所能体现的概念间语义关联是不一样的。本文对不同链接使用经验初始权值如表1 所示。

2. 1. 3 使用目标概念入链改进的ESA算法BLRel

ESA算法[9]包括三个步骤: 把词语转换为概念向量; 计算向量中每个元素的相关性权重; 计算两个概念向量的余弦距离。考虑到在维基文章中很多词语只起到辅助描述、组成句子的作用,并不能反映其与对应的维基概念有语义关系,本文只对出现了目标概念作为锚文本的维基文章计算相关性向量。在取得所有包含以目标概念为锚文本的维基文章后,去掉分类、消歧等不需要的功能页面,以及正文内容过短的文章,然后进行文本预处理。

本文在ESA算法的第二步进行改进,将TF-IDF与维基页面的布局信息相结合,词语-维基概念相关性计算如下:

其中is Bold、is Italic、is Anchor、is Image、is First Para分别代表词语是否在页面中为黑体、斜体、锚文本、位于图片描述中、处于第一段,若是则取值为1,否则取为0。

对于式( 1) 中的参数设定本文通过回归分析进行拟合。将式( 1) 作为拟合方程,本文使用了最小二乘法( OLS) 、次序对数回归( OLR) 和支持向量回归( SVR) 三种分析方法,以对比拟合结果对语义关联度计算结果的影响。具体训练集通过人工标注获得,从Wikipedia数据库中随机抽取100 篇文章,这些文章至少都包含一个黑体词语、三个以上可以正确链接到其他维基页面的锚文本、至少三个字的图片描述文字、一个以上的文章段落。然后再从每篇文章中选出30 个词语进行人工相关性标注,选择的过程要覆盖到所有的布局信息,人工标注由三个人分别独立完成,取三个人的标注结果平均值作为最终结果。对于标注结果存在歧义或无法给出标注结果的词语全部剔除,最终得到了1 750 个词语。

2. 1. 4 使用目标概念出链的关联度计算FLRel

本文借鉴pfibf[16],结合布局信息定义了维基概念间链接权值。对于目标概念的输出链接,计算三层输出链接向量的余弦距离得到FLRel关联度。

( 1) 链接权值设置

设a、b为源概念和目标概念,a → b的权值:

其中,w( a → b)0是a到b初始权值; ∣a→ b∣是从a到b链接数量, ∣y→ b∣是任意概念到b的链接数目; N表示Wikipedia中总的链接数目,log计算的值为任意一条链接指向目标节点的反比例值。

( 2) 语义关联度计算

结合式( 1) ,链接的初始权值定义如下:

将式( 3) 代入式( 2) ,再对源概念的所有输出链接计算权重,概念输出链接如图3 所示,a、b为源概念结点,输出至c、d的为第一层,输出至e为第二层,至f为第三层。根据源概念结点构建出每层输出链接向量,最后计算每层向量余弦距离。

在计算第二层链接矩阵时,a→e的权重为w(a→c)×w(c→e)×0.9,0.9为关联性传递衰减系数,第三级链接以此类推。对其中某层链接而言,源概念的语义关联度描述为:

其中,M( a) 、M( b) 分别为源概念a,b的输出链接权重向量。最终FLRel关联度计算为:

其中,Similarity1、Similarity2、Similarity3分别为1、2、3 层链接的余弦距离,α、β、γ 为对应的权重系数,且 α + β + γ = 1,其具体值通过实验多组不同的权值,在 α = 0. 67,β = 0. 21,γ = 0. 12 时,FLRel取得了最高的准确率。

2. 1. 5 WikiRel关联度计算

综合BLRel和FLRel,使用Wikipedia数据集计算得到WikiRel关联度为:

其中 δ + ε = 1,本文 δ = 0. 55,ε = 0. 45。

2. 2 基于Google资源的关联度计算GooRel

本文将Google搜索资源作为Wikipedia之外的扩充背景知识库。对于一组待计算语义关联度的词,首先取得各自在扩充知识库中的网页结果集,再使用分类器过滤主题不相关的结果,接着对网页内容使用LDA进行建模,最后通过计算两个词语-主题分布向量的余弦距离得到GooRel关联度。

2. 2. 1 Google外部资源

虽然Wikipedia是目前规模最大的在线百科全书,但也存在缺陷: 首先,其还在不断完善各种新词条,已有内容也保持着更新维护,内容覆盖度有限; 其次,由于其需要保证内容的公正客观准确性,维基文章中不能涉及过多的时事信息,且其内容的更新存在滞后性。针对这些缺陷,本文利用Google搜索对背景知识库进行扩充,Google资源的优势包括能在技术上尽可能快的找到新出现的网页,由PageRank计算出网页排名,根据与搜索请求关联性的高低给出搜索结果。

2. 2. 2 扩充背景知识库构建

由于对每个词都单独取实时搜索结果会导致关联度计算的时间开销太大,本文通过结合Wikipedia分类结构和Google搜索构建离线扩充背景知识库。Wikipedia中主要的主题分类包括Agriculture、Arts、Culture、Environment、Geography、Health、History、Humanities、Humans、Language、Law、Mathematics、Medicine、Nature、People、Politics、Professional studies、Science、Sports、Technology,使用Google搜索获得与这些主题相关的排名最靠前的50 个网站( 不包括仅为单个网页的搜索结果) ,继而去抓取这些网站中最新的文章,最后按照其所属的分类进行存储,即构成GooRel计算的背景知识库。

2. 2. 3 LDA主题模型

LDA[17]是一种主题概率模型,可以得到文档集中每篇文档的隐含主题概率分布。LDA概率图模型如图4所示,其中α和β表示语料级别的超参数,θ表示文档主题的概率分布,φ表示特定主题下词的概率分布,M表示文档集的文本数,K表示文档集的主题数,N表示每篇文档包含的特征词数。

给定一个词 ωi和一个隐含的主题tj,模型返回 ωi归属于主题tj的概率mij( j = 1,2,…,k) ,对词 ωi,最终的模型输出结果为:

其中,k为隐含主题的数目。

本文采用Gibbs采样估计当前采样词wi的主题tj的后验分布,迭代完成输出主题-词参数矩阵  和文档-主题矩阵 θ 。

2. 2. 4 GooRel关联度计算

对于一组待计算语义关联度的词,首先将其分别映射到扩充知识库的分类上,取出各自对应的结果集; 其次,因为对应的分类结果集中可能包含主题不相关的网页,采用朴素贝叶斯分类器进行筛选,其中训练集通过Wikipedia获取,使用主题词对应维基文章以及文章中所链接的相关维基概念,以及See Also链接文章,构建出每个词的分类训练文本集,去掉主题不符的网页。如果某个词对应的结果集在筛选后网页数量少于3000 个,通过取对应词在Google中的实时搜索结果进行扩充,同时将这些搜索结果也添加到扩充知识库对应的类别中。

最后,对上述消歧完毕的网页文本内容使用LDA进行主题建模,建模过程中的参数估计采用Gibbs采样,迭代次数为1000次,其中主题数量K从10,20,…,一直迭代到200,取得到最优结果的情况; 其中 α = 50 /K,β = 0. 01。最后,对待计算语义关联度的词语 ωi和 ωj的所有网页数据通过LDA计算出分布tr( ωi)和tr( ωj) ( 参见式7) ,计算余弦相似度得到这对词语的语义关联度:

2. 3 WGR语义关联度计算

WGR关联度计算综合WikiRel和GooRel两种方法,对于给定词对 ωi和 ωj,二者的语义关联度计算如下,其中 λ = 0. 66,μ=0.34。

3 实验及分析

3. 1 实验环境与数据集

本文实验环境如下: Windows Server 2003 系统,配置双核3. 5 GHz CPU和32 GB内存。

实验所用的Wikipedia数据来自其官方网站下载的数据集,数据集是2013 年5 月3 日进行的备份。实验所使用的Google扩充背景知识库通过Java编写的爬虫软件抓取搜索结果及网页,平均每个类别收集了接近10 000 个网页,对每个网页的预处理包括取出网页body主体文本内容,剔除特殊符号、HTML标签、停用词以及出现频率极低的词后进行存储。

本文选择最常用的Word Similarity-353 测试集[18]作为语义关联准确率评测数据集。

3. 2 实验结果及分析

在测试集上对本文提出的算法( WikiRel、GooRel、WGR) 进行实验,采用Spearman等级相关系数评估语义关联度计算准确度,实验结果及分析如下。

3. 2. 1 WikiRel参数分析

WikiRel关联度计算中,计算词语-维基概念相关性时实验了三种方法OLS、OLR和SVR对式( 1) 中的参数进行拟合,三种拟合方法对应得到的WikiRel计算结果如表2 所示。

从表2 可以看到,使用最小二乘法( OLS) 取得了最好的计算结果。支持向量回归( SVR) 结果稍差,而使用次序对数回归( OLR) 结果最差,因为其对式( 1) 中参数的返回值导致很多词语-维基概念相关性结果为0。最小二乘法( OLS) 对式( 1) 的参数分析结果如表3 所示。

从表3 可以看到,TFIDF、is Bold、is Italic 、is Anchor、is Image是显著属性,TFIDF值的权重最高,is Bold黑体、is Italic斜体表示强调,体现着一定的关联性。is Image( 图片描述) 和is Anchor( 锚文本) 所能体现的关联性较弱,部分维基文章中的图片和概念主题并不相关,锚文本也是如此,部分链接的添加只是起到引导作用,并没有实际的语义关联。而段落结构( is First Para) 的权重最低,其对词语-维基概念相关性的影响要弱于文字样式。

3. 2. 2 WGR算法评测

WGR算法关联度评测结果如表4 所示。

( 1) WGR与传统方法对比

如图5 所示与传统使用人工语义词典的方法相比,WGR采用Wikipedia作为背景知识库,同时借助Google结果资源,准确性取得了较大提高。

( 2) WGR与现有使用Wikipedia的方法对比

图6 为WGR与WikiRelate、ESA、WLM的对比,也取得了更好的准确率。WikiRelate把在传统词典知识集上使用的方法应用到Wikipedia的层次分类树上; WLM利用Wikipedia文章网络,但其没有区别对待各种链接,并且只考虑与源概念结点直接相连的链接,虽然WLM算法也应用了Google资源,但仅仅是考虑词语的共现频率。ESA算法利用了所有维基文章的文本内容,但仅以TF-IDF值作为词语-概念相关性权值,而且要对几乎所有的维基文章进行预处理来计算词语-概念相关性的倒排索引,计算量非常大。

图7 中LDA所指代的方法为文献[13]提出的使用LDA对Wikipedia文章集进行建模,结合输出的矩阵计算语义关联度,取得了较好的准确度,验证了使用LDA模型处理文档集合计算语义关联度的可行性。本文中提出的GooRel方法,对每个词所使用的文本资源集合覆盖度和时效性更好,取得了和文献[13]方法相近的结果。虽然TSA算法的准确度比WGR稍高一点,但其采用1863 年至2004 年,超过130 年的纽约时报文章存档作为外部资源,这些资源根本无法通过常规途径获取到。

( 3) GooRel结果分析

图8 中横坐标为每个待计算关联度的词对应的搜索结果中参与LDA建模的网页数量。为了验证外部资源对GooRel语义关联度计算的影响,实验中,在清除掉歧义结果页面后,对每个词分别取前500,1000,…,直到5000 个结果网页进行建模。每个词所采用的网页数量对结果的影响如图8 所示,随着参与主题建模的网页数量的增加,准确度不断提升,但在网页数量到达3500 时,提升效果渐趋稳定。

4 结语

本文在使用Wikipedia数据集作为背景知识库的基础上,结合Google搜索资源计算语义关联度,并通过实验验证了方法的有效性。Wikipedia是目前规模最大的知识库,其中还有大量的指向维基以外的链接引用,利用好这些外部资源,也可能会提高计算结果的准确度。而且Wikipedia提供的多语言版本也可能对提高结果的可靠性有辅助作用,这都将是在以后的工作中需要考虑研究的。

语义关联度 篇2

关键词:产品语义,基元,实例推理,关联度,局部关联度

0引言

可拓实例推理是可拓学基元理论及实例推理技术 (CBR)相结合的一种应用方法。目前,国内外学者对该方法开展了大量的理论研究及应用研究,在创意设计、机械产品设计、建筑设计、城市规划、工程施工组织等多个领域形成了有积极影响的学术成果与应用成果。

可拓学实现了知识的形式化与量化表征的统一。 在机械产品设计领域,概念设计过程涉及到设计知识的建模、表征、检索、收敛、提取、重用、可拓推理等方法。1)针对产品知识的表征方法,张艳等[1,2]详细论述了基于可拓知识表示的菱形求解策略,开发了基于可拓知识表示及菱形求解策略的知识库系统,并将该系统应用于水轮机选型设计。刘玲玲等[3,4]将可拓基元理论用于产品创意设计,运用可拓学基元理论构建创意设计阶段基元模型。2)针对设计过程方法的表征,杨刚俊等[5]将TRIZ与可拓学方法相结合,形成了基于可拓学模型的产品创新设计方法。王科奇等[6]将可拓学理论和方法引入到建筑设计创新体系中来,用基元表达方式对建筑设计创新过程进行表征。赵燕伟等[7,8]以油锯开发为例提出了基于可拓实例推理的产品族配置设计方法。翟红生等[9]提出基于可拓分类分析模型的产品快速配置设计。 3)针对评价方法,吕锋等[10]针对设备重要度概念的模糊性和评价指标的多样性特点,提出了一种基于欧氏贴近度的改进模糊物元模型的设备重要度评价新方法。冯青等提出了基于优度理论的产品设计知识评价方法。 夏吉兵等[11]开展了基于可拓学理论的数控机床可靠性评价研究。李晓钟[12]研究了基于可拓优度的专用加工机床定位方案设计方法。4)针对设计优化问题,周建强等[13]提出了基于可拓变换的产品性能冲突传导协调方法。

本文针对产品设计过程中的设计方案收敛问题,提出基于产品语义关联度的产品可拓实例推理方法。通过构建语义关联度函数,提出面向产品族收敛的优度评价方法,并根据语义相关网及局部关联度评价,实现产品功能模块的可拓实例推理。本文以某机床概念设计为应用实例,为产品设计提供一种形式化与量化相结合的设计方法参考。

1设计过程知识的基元表征

基于对概念设计过程知识传递模型的研究,本文结合可拓学的基元理论与可拓创新方法,寻求概念设计及可拓实例推理的新路径,力求通过描述设计过程知识, 研究设计基元的可拓展性、收敛性及运算规律。

1.1产品设计基元概念

可拓学中的基元概念把质与量,动作与关系的相应特征分别统一在一个由对象O,特征C和量值V组成的三元组中,可以形式化的描述物、事和关系,基元B分为物元M、事元A、关系元R,统一表示为:

构建产品设计基元集S={B},用于表征设计过程中涉及的定量与定性问题,形象化描述创新方法与产品设计评价方法。

1.2设计过程可拓创新方法的内涵分析

将概念设计过程细化为三个阶段:概念生长阶段、 概念收敛阶段与概念细化与优化设计阶段。三个阶段根据设计需求分为一级循环与多级循环,体现了可拓学的菱形思维模式,如图1所示。

1)概念生长阶段:设计者在设计目标及设计资源的基础上进行的创造性思维过程,根据基元的可拓展性或物的共轭性,创造性思维过程T可分为拓展分析、共轭分析和可拓变换三种类型,统一表示为, 形成概念基元集S={B},过程体现了“一物多征”、 “一征多值”、“一值多征”等拓展分析的可拓思想。

2)概念收敛阶段:设计者通过恰当的的评价模型对概念基元集进行的收敛过程,得到概念收敛后的基元集S'={B'},表示为{B1, B2,, Bn}├ {B1′, B2′,, Bn′ }。

3)概念产品化阶段:针对收敛后的基元集S'={B'} 中进行概念细化与优化设计,通过共轭分析和可拓变换方法解决概念产品化过程中的对立问题及不相容问题, 获得产品或产品族S''={B''}。

2基于语义关联度的设计收敛方法

针对概念产品集S={B}的收敛通常为优度评价法, 根据概念设计的收敛特征,通过专家评价将非量化指标转化为数量化表达,通过建立关联度函数进行优度评价。本文提出面向产品族的优度评价方法。

在概念生长阶段得到概念产品集S={B},通过评价方法对概念基元集进行收敛,得到收敛后的基元集S'={B'}。在接下来的讨论中,为了区分产品与产品族的概念,将概念产品族定义为:

其中Sn={Bn}表示第n个系列的产品族概念基元集, 如图2所示。

在概念设计及产品化过程中,为满足产品的个性化需求及提升产品的市场覆盖度,推向市场的是多系列产品族而非单一的产品,针对多个产品单体的优度评价可能在评价过程中会由于某个概念产品中的优秀设计基因没有得到有效表达而被放弃;产品族往往包含较为完整的设计基因,针对产品族的评价,可有效减少评价过程中的优秀设计基因的丢失现象。这就使得产品的评价方法从以产品单体为对象转变为以产品族为对象。如图2所示,比较了产品个体与产品族收敛方法的区别。

因此,结合优度评价方法,寻求一种针对多系列产品族的收敛评价方法更具实际意义,本文提出产品族优度评价方法。与产品个体对象比较,产品族优度评价方法旨在寻求产品族的优度稳定性,进而得到最优产品族及最优个体。

2.1确定评价指标及权重

针对概念产品集S={B}展开设计优度评价。首先给定评价目标特征集c=(c1,c2,…,cm)(本文主要讨论多评价目标情况,单目标评价本文不作讨论),以及与其相对应的量值,其中,V(ci)为评价目标的量值域。

并确定对 应评价目 标特征集 的权重系 数,对于非满足不可的指标,用指数 Λ表示 , 即构建评价 指标集

2.2知识表征量化与规范化

对评价指 标集H ={H1,H2, ,Hm}和概念产 品集S={B}可拓知识表征进行量化规范化。产品设计知识中存在定性与定量语义表达,如某产品设计关于评价指标c0的表达v0可存在以下三种形式:

语义量化过程主要通过专家评价区间法,即将评价目标中非量值描述转化为量值或量化区间,并通过专家或以往资料评定量值域Vi,其取值可表示为三种形式:

利用非满足不可的评价目标αr= Λ,对概念产品集S={B}进行初次收敛,剔除不满足的产品个体,构建概念产品族S =S1⊕S2⊕⊕Sn,产品族中的产品个体记为Op j, 产品族S1, S2, ,Sn中的个体 数量依次 记为

2.3构建语义关联函数

建立语义关联度函数的一种方法通过可拓距建立关联函数计算关联度,进而计算优度;另一种方法是直接从语义学角度建立语义关联度函数,通过语义距离计算语义关联度从而计算优度。本文在前者方法的基础上, 提出面向产品族的综合评价法。概念产品族的评价,是相对于单个概念产品设计而言的,是对设计过程中产生的多个概念产品族进行的综合评价。

针对评价指标集H ={H1,H2, ,Hm},其中:

对应的权重系数。针对关联函数的构建有如下三种情况:

若Vi为一个有限区间或无限区间,则取简单关联函数Ki(xi);

若Vi为离散数据的集合

若Vi为前两种情况混合构成的区间套,则构建初等关联函数。

产品族对象Sp及其子对象Opj,Opj关于评价指标Hi关联函数记为Ki(Opj),产品族对象Sp关于评价指标集的综合关联度函数记为Ki(Sp),则有Op1,Op2, ,Opnp关于Hi的关联度为:

构建以Sp为对象的产品族评价表达方法,在此引入方差与标准差概念,用于描述产品族对象Sp中所有个体Op1,Op2, ,Opnp关于某个评价指标Hi的偏离程度。根据概念设计的关联函数的内涵,关联度表示概念方案与Hi量值标准 的距离 , 可分为正 域 (0,+∞)、 临界0 、 负域 (-∞, 0) ,如图3所示。其中均值E(K)表示产品评价指标的量值标准。

与广义数学方差概念不同,在产品评价体系中给定关联度量值标准E(K)=1,而非广义数学方差概念中的均值。给定关联度方差计算表达但由于这里取E(K)=1,则不能用如下推论计算:

记为关联度标准差,由方差概念及产品设计评价内涵可知,D(K)或可描述产品族对象Sp中个体关于某个评价指标Hi的关联度与标准关联度E(K)=1的偏离程度,反映了产品族关于某个Hi的稳定性。

对Ki进行规范化:

对象Opj关于各个评价指标的规范关联度为:

2.4优度评价

概念产品对象Opj的优度记为C(Opj),在此,优度计算有三种情况:

以综合关联函数计算优度:

上式适用于大部分产品的多目标评价;优度取关联函数的最小值,表示产品评价过程中要求所有评价特征都必须符合要求才能通过, 无权重之分,体现了“木桶短板效应”;

优度取关联函数的最大值,表示表示产品评价过程中只要有一个评价特征满足即可通过,无权重之分,产品族优度计算包括产品族中的个体优度和整体优度计算两部分评价,对于个体的Opj评价,若,则个体对象Op0较优,也可按降序排列产品优度。

针对产品族的优度计算,引入方差及相关概念,来计算产品族整体优度的稳定性。

产品族中个体的优度为离散型随机变量,取产品族中个体优度最大的为标准优度记为E(Y),即:

则有关于优度Y的方差:

记为优度标准差,由方差概念及产品设计评价内涵可知,)可描述产品族对象Sp整体关于评价指标的优度与标准优度E(Y)的偏离程度。通过反映产品族S中Sp关于某个评价指标集的综合优度及稳定性。

综上所述,此优度评价适用于系列产品族的优度评价,由S={B}入手,通过产品聚类,形成产品族:

并以产品族对象Sp中的子对象Op1,Op2, ,Opnp为评价个体,构建关联函数,并通过优度计算及优度标准差的描述,反映产品族S中Sp关于某个评价指标集的综合优度及稳定性。这帮助产品概念设计实现产品族的综合收敛,并挑选优度较好的产品族开展详细设计进而产品化,推向市场的产品可更多考虑多样化与个性化需求。

3可拓实例推理设计实例

3.1知识获取与表征

本文给定一个机床产品设计课题,作为应用实例:

国内某磨床制造企业,为某大型钢铁生产企业设计一款小型精密数控轧辊磨床,根据市场、制造企业、 用户的综合调研,对用户知识进行挖掘与表征,形成如下设计需求。从工程语义BRro对机床设计需求知识进行表征。

首先,根据用户知识构建用户需求目标基元模型,

其中Bu为复合基元,作为需求目标基元,同时也构成评价指标基元集的权重分配的主要衡量标准。

3.2领域知识转化与规范化

根据轧辊磨床产品领域知识进行目标完善,由客户目标Bu转化为工程设计知识,并完成定性、定量语义表征的规范 化表达 。 对于等可根据轧辊磨床领域知识进行降元处理,明确主要设计问题及任务,根据轧辊磨床的领域知识,通过领域知识转化与降元,得到主要设计目标集。

给出轧辊磨床产品实例库(部分实例)关键特征参数集如表1所示。

建立评价指标集H ={H1,H2, ,Hm},其中:

根据该评价问题,由于涉及评价指标较多,评价的差异性难以准确反映案例优劣,因此选用多级评价方法,即在次级评价的基础上,将上述13个评价指标聚类为4组一级评价指标作为最终优度评价标准。

给定所有单项指标的权值:

给出概念产品MK8430的参数预估值(评价指标):

3.3关联度计算

由特征参数表可知,相似度的计算涉及到区间值之间、区间值和确定值之间以及确定值之间的三种计算类型。根据可拓距概念及方法(本文不作具体方法的计算过程),涉及最优点在区间中点的初等关联函数、最优点不在区间中点的关联函数(左侧和右侧),建立关联函数。在产品案例库中,利用优度法对实例库(只列举部分)进行可拓实例匹配检索[8]。

给出针对上述实例的关联度计算结果,如表2所示。

根据次级评价规范化关联度,构建一级评价关联度:

综合评价关联度:

根据综合关联度情况,在轧辊磨床产品族中取产品族S1作为可拓实例,即工件移动式MK8420、MK8440、 MK8450。

而在产品族S1中又以MK8420的关联度最高。

针对参数H1= 磨削直径,对产品族,对产品族进行关联度方差分析(这里的与广义数学方差概念不同,在产品评价体系中给定关联度量值标准E(K)=1,而非广义数学方差概念中的均值。)

根据关联度方差计算表达式

关于H1=磨削直径的产顾问度方差:

能够看出,产品族S1关于H1= 磨削直径稳定性最好。同理,可以找产品族S出关于Hn的最优参考实例。 这在产品的可拓配置过程中能够起到一定的指导作用。

根据轧辊磨床的设计者经验阐述:目标概念产品MK8430是宜选用工件移动式设计方案,即为产品族S1,其中MK8420最为接近,但床身及头、尾架要参考MK8440与MK8450的设计。由此可知,本评价方法适用于此类产品概念初期的实例选型及模块可拓配置。

3.4语义相关网

首先根据以上实例评价结果,以产品族S1为共性模块实例,构建机床模块配置方案。工件移动式数控轧辊磨床产品族S1是一种模块化较为成熟的产品类型,如图4所示。

给出工件移动式数控轧辊磨床产品族S1的模块配置物元模型,其中:V(fn)表示配置方案。

以MK8420为最优实例提取关键配置模块V(f1), V(f2),V(f4),V(f5),V(f6)作为语义网的出发点,构建语义相关网[2],如图5所示,明确设计约束问题。

3.5局部关联度

根据模块配置相关网及评价规范化关联度,确定床身工作台、头架、磨削系统、测量系统约束关系。构建局部关联度函数进行模块实例选择i为局部指标序号),如表3所示。

1 )床身及工作台,根据评价规范化关联度,采用实例特征值c1(O),c2(O),c3(O)局部关联度较高的MK8440床身及工作台作为设计实例。从专家经验角度分析验证,床身及工作台设计采用MK8440仅需进行床身尺寸减设计,总体模块装配关系变动较小,比MK8420床身更具实例推理性;

2 )头架,根据c4( O ) , c9( O ) , c1 0( O ) , c1 1( O ) , c12(O),c13(O)构成的局部关联度函数,选用局部关联度较高的MK8420头架作为实例模块。从专家经验角度分析验证,头架选择问题的核心是电机的选型及头架结构的选型,其决定了工件转速,头架转动的稳定性又与机床整体的加工精度有着密切复杂的关系。选用MK8420头架,电机转速为1500rpm与概念产品的额定转速相同,且MK8420头架结构可完全继承到概念产品MK8430;

3)磨削系统,根据c5(O),c6(O),c7(O),c8(O), c9(O),c10(O),c11(O),c12(O),c13(O)构成的局部关联度函数,选用局部关联度较高的MK8420磨削系统作为实例模块。从专家经验角度分析验证,磨削系统是工件移动式数控轧辊磨床的核心模块,涉及磨头动静压轴承的选型、主轴电机的配置、磨架进给及微量进给的控制机构,是机床精度的主要控制模块。MK8420的精度与砂轮的选型,与MK8430最为接近,因此采用MK8420磨削系统;

4)测量系统,根据c7(O),c8(O),c9(O),c10(O), c11(O),c12(O),c13(O)构成的局部关联度函数,选用局部关联度较高的MK8420测量系统作为实例模块。从专家经验角度分析验证,MK8420的精度控制范围在几个方面都与MK8430最为靠近;

5)支撑模块,根据c1(O),c2(O),c3(O)构成的局部关联度函数,选用局部关联度较高的MK8440支撑模块作为实例模块。从专家经验角度分析验证,考虑到工件的重量的支撑及工件加工半径,MK8440支撑相比MK8420,适用范围更广,也更接近MK8430。

综上局部关联度计算及专家经验对比所述,在产品概念设计阶段,局部关联度对于产品模块的选型有着良好的可用性。

根据模块可拓配置,形成概念产品的主体模型,产品详细设计(本文不作讨论),最终形成产品方案,经过数字样机及真实样机的调试,获得真实参数集,对比预测参数集如表,验证了方法的可行性与有效性。该概念设计过程为MK8430产品的详细设计提供了有力支持。

4结论

基于语义关联的视频元数据库构建 篇3

当前,广电行业普遍都在进行视频内容管理系统的建设,大量视频被数字化和编目后进入内容管理系统,随着系统规模不断扩大,视频信息的检索、过滤和提取技术已成为媒体内容管理方面的研究热点。然而,利用计算机技术直接从数据中理解视频内容十分困难,建立视频数据的描述数据(即元数据)的视频检索和分析被普遍认为是现阶段最有效的解决方案,视频数据的元数据库构建变得十分重要,一个结构良好、内容合理的元数据库成为视频数据管理的基础。由于现有的媒体内容管理系统中缺乏数据语义方面的信息,大部分系统的搜索引擎仅仅利用关键词的直接匹配或词频统计作为检索依据,对关系型需求的查询缺少支持;其次,在自然语言中,可能用不同词汇来表达同一个概念,仅依靠关键词匹配和词频统计,可能造成检索错误。要克服上述问题,一个有效的方法是利用元数据的语义建立关键词或标签(tag)之间的语义关联,为搜索引擎提供语义信息。本文提出了一个利用语义关联信息的视频元数据数据库构建方法,利用该语义信息的检索方法可有效改善系统搜索准确性。

1 语义关联网络模型

元数据编目使关键词和视频之间建立了对应关系,但关键词本身并不仅仅是一个符号,而是具有一定的语义,在实际中,人们是使用关键词不是使用符号本身,而是其包含的实际意义。因此仅仅记录关键词和视频之间的关系对计算机理解视频是不够的。语义关联的目的是在关键词数据库中引入类似人类具有的“知识”,使计算机能理解关键词的词义。在概念网络模型(Conceptual Network Model,CNM)中,用概念来表示词汇在自然语言中的实际意义。一个词往往对应着多个概念,即一词多义,比如“病毒”这个词,可以是指计算机中一类能复制自我的恶意程序,也可以表示生物学意义上的一类低等生物。同样,也存在着不同的词汇表示相同的概念,例如:成都还可被称为蓉城、锦城、锦官城;世博会的同概念词汇还有世界博览会、国际博览会、万国博览会、世博会、世博、万博等。

概念虽然表达了明确的语义,但人对视频的检索等操作仍然会采用包括关键词等自然语言方式,因此,需要在元数据库中建立词汇和代表语义的概念之间的关联。

另一方面,由于视频数据数目十分庞大,具有相似关键词但不同类型的视频在内容上可能相去较远。为了改善语义关联的元数据库在检索方面的性能,在关联网络中引入视频的多重分类,如图1所示。

元数据语义关联数据库中的视频分类,可按照时间、地点、人物、知识属性等角度提供多重分类体系标准,用于对视频进行分类编目。知识属性分类体系分类可参考国家广电总局的《广播电视音像资料编目规范-电视资料部分》中对视频节目分类建议和《中国新闻信息分类标准》相关规范和标准等,其构建原则是保证类别之间重复少(唯一性)和类别集合的总体完备性。

2 词汇表管理

在具体实现中,概念和关键词类似,用词或词组表示,语义词表管理提供对词汇和概念词汇进行定义、维护的能力,包括基本词汇管理和用户自定义词汇管理。在基本词表管理方面,从知识属性、题材和节目形态等方面考虑常用的词汇和语义,汇集基本词汇和语义关联作为基本词库。在基本语义关联词库的基础之上,概念词汇可以进行动态更新,包括新词汇的增加和旧词汇的去除。由于概念词汇属于相对固定、封闭的词汇体系,它的动态更新需要管理者审核后方可正式纳入到编目系统中。

在用户自定义词库管理方面,主要包括关键词分析以及具有相同语义的关键词库(即同义词)管理两部分。通过关键词统计分析,可以得到关键词的使用频率,在不同视频中的使用情况等多方面信息,从而为关键词的自动推荐以及更新提供依据。具有相同语义的词汇库主要关注的是关键词间的关联信息。一定数量的编目之后,数据库会积累大量的关键词,这些词汇中会有许多词汇具有相同的语义或同一词汇具有不同语义的情况出现。由于词库的建设和维护需要较大的工作量,视频库编目系统可以设有专职词库管理员,该管理员借助同义词检测、关键词使用频率和权重等技术指标,将关键词归类,给出正式的关键词作为一个统一使用概念,并建立这个概念词汇与其对应的关键词之间的联系,同时建立同义词词库与概念索引库的动态联系,保持关键词和概念之间的关联,保证检索的一致性。

3 数据表示和存储

目前对于关联数据的存储方式主要有纯文本方式、专门存储程序和关系数据库方式3种:

1)纯文本存储。纯文本(如.OWL文件)的方式,按某种方式直观地表示语义之间的关联,符合词汇的语义特性,易于理解,适用于直接表示和存储。但文本形式较简单,当关联的概念和实例较多时,效率较低,不适合大规模的词汇和概念的语义关联的管理。

2)专门的管理工具存储。如OMM等软件,支持对RDF、OWL等类型文件的存储管理,并提供各种接口,可使用查询语言对语义关联关系进行查询,但这些软件工具技术上尚不够成熟,达不到关系数据库存储的效率。

3)关系数据库存储。关系数据库技术相对成熟,适合大规模数据的存储,存储效率高,易管理且便于查找数据。在当前支持语义信息存储的技术尚未成熟的时候,对于海量数据本体的存储和管理,关系数据库是最佳选择。

这里采用第3种关系数据库存储形式,数据的存储采用与应用分离的设计,对于以后扩展和维护系统都具有较好的灵活性。存储视频语义关联信息主要包括4个表,视频-关键词表、视频-分类表,关键词-概念词表,分类表。此外,为了记录完整的视频、词汇和分类数据,还至少需要建立视频元数据相关的表、词汇说明表和类说明表。表1、表2分别定义了词汇表的主要字段和属性,视频-分类表和分类表与此类似。

说明:ID为videoID的视频具有ID为wordID的关键词

说明:ID为wordID的关键词的语义具有ID为conID的概念表示

数据采用基于关系数据库技术存储和组织语义关联信息,可以充分利用数据库管理系统(Data Base Management System,DBMS)提供的各类数据定义、维护和检索操作,采用结构化查询语言(SQL)实现语义关联数据的管理,图2是一个简化的利用关联语义信息检索的过程,并利用数据库管理系统的功能,保证数据的一致性和完整性。

4 小结

数字视频内容管理的一个关键问题是视频内容的智能检索和推荐。直接在非结构化的视频数据中理解视频内容十分困难,在媒体资产(MAM)等内容管理系统中,是通过视频数据对应的元数据对视频进行组织和检索等操作,本文在分析了视频元数据中关键词在自然语言理解上的特点,引入“概念”,利用关键词和概念之间语义上的关联,建立视频数据、关键词和概念之间的语义关联网络,并根据视频可能涉及的时间、地点、人物和属性进行分类,最后给出了在关系数据库中存储语义关联信息的方法,利用关联信息可以改善视频检索的智能化程度。计算机对词汇在语义的理解上需要充分的语义“知识”,本文提出的语义关联是这种知识的其中一个部分,要进一步提高计算机视频数据管理的智能程度,另一个关键的知识是概念间的语义联系,如何对概念之间的语义联系进行细分,并建立概念之间的语义关联模型是本文后续研究的一个方面。

摘要:在视频元数据中引入语义信息能更好地支持基于语义的智能检索。利用视频元数据中关键词的语义信息,建立概念之间语义关联网络,提出了一种构建具有语义关联的视频元数据库方法。该方法从词汇的语义出发,建立关键词和概念之间的关联,并给出了基于关系数据库的语义关联信息存储方法,从而为搜索引擎提供语义信息。

关键词:视频编目,元数据,语义网络,概念,视频检索

参考文献

[1]苏伟峰,李绍滋.一个基于概念的中文文本分类模型[J].计算机工程与应用,2002,38(6):193-195.

[2]KARAM O,HAMAD A,ATTIA M.Exploring the sem antic gap incontent-based image retrieval:with application to Lung CT[EB/OL].[2010-01-03].http://www.icgst.com/GVIP05/papers/P1150535241.pdf.

语义关联度 篇4

1 知识元相关概念解释

1.1 知识元的含义

指不可再分割的具有完备知识表达的知识单位。

1.2 语义学(Semantics)

也作“语意学”,是一个涉及到语言学、逻辑学、计算机科学、自然语言处理、认知科学、心理学等诸多领域的一个术语。

1.3 知识元语义分析

是知识元服务的重要手段和目的,属于语言学的范畴,指众多的知识元通过一定的语义连接在一起,可以导致知识价值的增值,甚至是催生新的知识。通过知识元的链接和发掘各知识元的相关联系,目的在于找出知识元语义表达的规律性、内在解释、不同知识元在语义表达方面的个性以及共性,以此来揭示知识元之间的各种关联,得以创造新的知识。

1.4 药性知识元

包括四气知识元、五味知识元、归经知识元。四气知识元:寒、凉、平、温、热;五味知识元:辛、甘、淡、酸、涩、苦、咸;归经知识元:胆、肝、肺、大肠、胃、脾、心、小肠、膀胱、肾、心包、三焦。

1.5 功效知识元

将“动宾结构”的功效解构为功效知识元,包括动词知识元和名词知识元,例如“宣肺”解构为动词知识元“宣”和名词知识元“肺”。举例如下:动词知识元(升提补益类):升、举、托、提、回、救、宁、补、挟、增、保、健、暖、温、兴、助、壮、填、强、长、接、撑、续、益、养、滋、润、泽、生、乌、明;名词知识元(脏腑、形体官窍类):心、肝、脾、肺、肾、腑、肠、胃、胆、膈、中、胸、骨、筋、窍、肌、目、脉、咽、发、须。

2 五脏功效群相关概念解释

2.1 功效群

功效群指同动词知识元、同名词知识元组合构成的群,如动词知识元“补”功效群:补脾、补肝、补肺、补肾、补气、补血、补阴、补阳、补中等;名词知识元“肝”功效群:补肝、养肝、滋肝、疏肝、舒肝、清肝、凉肝、平肝等。

2.2 五脏功效群

指名词知识元为心、肝、脾、肾、肺的功效群,《中国药典》(一部)2005年版所载的五脏功效群如下:“心”功效群:宁心、清心、养心、凉心;“肝”功效群:补肝、养肝、滋肝、疏肝、舒肝、清肝、凉肝、平肝;“脾”功效群:补脾、健脾、温脾、醒脾;“肾”功效群:补肾、益肾、温肾、固肾;“肺”功效群:补肺、益肺、润肺、敛肺、清肺、温肺、宣肺、泻肺。

2.3 五脏关联功效群

由五脏功效群可得,能够与名词知识元“心、肝、脾、肺、肾”组合的动词知识元是“补、养、益、滋、健、疏、舒、平、清、凉、温、醒、润、敛、宣、固、宁”。与之相关的动词知识元功效群称为“五脏关联功效群”,按数量排序如下:“宁”功效群:宁心;“宣”功效群:宣肺;“滋”功效群:滋肝、滋阴;“健”功效群:健脾、健胃;“疏”功效群:疏肝、疏风;“舒”功效群:舒肝、舒筋;“醒”功效群:醒脾、醒神;“平”功效群:平肝、平喘、平冲;“凉”功效群:凉心、凉肝、凉血;“润”功效群:润肺、润燥、润肠;“养”功效群:养心、养肝、养胃、养阴、养血;“敛”功效群:敛肺、敛疮、敛汗、敛阴、收敛;“固”功效群:固肾、固脱、固涩、固精、固表;“益”功效群:益肺、益肾、益智、益精、益气、益血;“清”功效群:清心、清肝、清肺、清肠、清热、清湿热;“温”功效群:温脾、温肾、温肺、温胃、温经、温阳、温中;“补”功效群:补脾、补肝、补肺、补肾、补气、补血、补阴、补阳、补中。

3 基于“知识元语义分析”探讨“五脏功效群”性效关联

(频数*是指药物频数)

3.1 研究对象

资料的来源:《中国药典》[2](一部)2005年版所载性、味、归经、功效记载齐全的中药,共计525味。

数据剔除标准: (1) 缺性味、归经记载:人工牛黄、体外培育牛黄等中药; (2) 现代药理功效表述:云芝、藏菖蒲等。

数据纳入标准:具有“五脏功效群”及“五脏关联功效群”的所有中药。

3.2“名词知识元”性效关联研究

建立“五脏功效群“中的名词知识元与药性之间的关系,以“肝”功效群为例说明,如表1所示。

由表1可得,“肝”功效群:滋肝(2)、养肝(2)、凉肝(2)、疏肝(3)、舒肝(6)、清肝(8)、平肝(16)、补肝(17)的共性是入“肝经”的频数与“药物频数”完全相同,分别是2、2、2、3、6、8、16、17。

以此类推,“心”功效群:凉心(1)、养心(2)、宁心(5)、清心(11)的共性是入“心经”的频数与“药物频数”完全相同,分别是1、2、5、11。

“脾”功效群:温脾(2)、醒脾(3)、补脾(6)、健脾(16)的共性是入“肝经”的频数与“药物频数”完全相同,分别是2、3、6、16。

“肾”功效群:固肾(1)、益肾(9)、温肾(10)、补肾(32)的共性是入“肝经”的频数与“药物频数”完全相同,分别是1、9、10、32。

“肺”功效群:泻肺(2)、宣肺(3)、补肺(3)、益肺 (4)、温肺(5)、敛肺(6)、清肺(9)、润肺(17)的共性是入“肺经”的频数与“药物频数”完全相同,分别是2、3、3、4、5、6、9、17。

综上可知,“五脏功效群”的共性就是名词知识元“心”、“肝”、“脾”、“肾”、“肺”组合成的功效群与各自对应的归经“心”、“肝”、“脾”、“肾”、“肺”呈“直接关联”。

3.3“动词知识元”性效关联研究

建立“五脏关联功效群”中的动词知识元与药性的关系,如表2所示。

4 结语

本文将“四气-五味-归经-功效”视作一个整体进行研究, 从“知识元语义分析”角度阐述了“五脏功效群”的性-效关联。结果得知“五脏功效群”的共性就是名词知识元“心”、“肝”、“脾”、“肾”、“肺”组合成的功效群与各自对应的归经“心”、“肝”、“脾”、“肾”、“肺”呈“直接关联”。另动词知识元组成的功效群与药性的关系为:动词知识元“补、益、固”与药性“甘+温+肾”密切相关, 表达的药物功效为“补肾、益肾、固肾”;动词知识元“宁、滋、健”与药性“甘+温+脾”密切相关, 表达的药物功效为“健脾”;动词知识元“温”与药性“辛+温+肾”密切相关, 表达的药物功效为“温肾”;动词知识元“宣、醒”与药性“辛+温+肺”密切相关, 表达的药物功效为“宣肺”;动词知识元“清、凉”与药性“苦+寒+肝”密切相关, 表达的药物功效为“清肝、凉肝”;动词知识元“疏、舒”与药性“苦+寒+肝”密切相关, 表达的药物功效为“疏肝、舒肝”;动词知识元“平”与药性“苦+寒+肝”密切相关, 表达的药物功效为“平肝”;动词知识元“润”与药性“甘+寒+肺”密切相关, 表达的药物功效为“润肺”;动词知识元“养”与药性“甘+寒+肺”密切相关, 表达的药物功效为“养肺阴”;动词知识元“敛”与药性“酸涩+寒+肺”密切相关, 表达的药物功效为“敛肺”。并宏观概括了“五脏功效群”的性-效关联”的量化范围, 作为参考。

审视中药功效,挖掘其中的药性特征,是中药理论研究的必经之路[3]。药物的性-效关联研究应借鉴现代多学科理论、方法及技术,从宏观、整体的高度进行研究。本文仅从其中一个角度出发,意在能够对药物性-效关联提供另一种思维方式,拓宽药物性-效关联研究的思路,不足之处,祈请读者不吝指教。

参考文献

[1]周福生, 赖小平, 许仕杰等.中药药性理论模型化表征方法研究思路[J].世界科学技术—中医药现代化, 2009, 11 (2) :229-233.

[2]国家药典委员会.中华人民共和国药典.2005年版.一部[M].北京:化学工业出版社, 2005.

【语义关联度】推荐阅读:

经验语义10-15

语义类型06-05

语义数据06-06

语义变化06-07

语义模型06-17

语义比较06-20

语义检索07-04

语义指向07-27

语义知识07-29

文化语义08-12

上一篇:货代法律地位分析下一篇:母亲的小市民生活