基于用户特征的研究

2024-05-28

基于用户特征的研究(共12篇)

基于用户特征的研究 篇1

0引言

随着互联网信息的海量增长,一方面用户很难从海量信息中发现自己真正所需的信息;另一方面也使得大量少人问津的信息成为网络中的“暗信息”,无法被一般用户获取[1]。推荐系统[2,3,4]作为互联网信息和用户快速连接的一种工具,可以帮助用户方便获取感兴趣的信息。推荐系统技术的出现,使用户不再是被动的网页浏览者,而成为信息获取的主动参与者[5]。推荐系统的核心思想是从海量的用户历史行为数据中分析出与用户兴趣相关的物品信息,并向用户进行推荐。推荐系统在电子商务领域应用非常广泛,如淘宝、京东、亚马逊等大型网站均有应用。亚马逊的购书推荐系统,可根据用户的购买情况,向用户推荐相关书籍;360浏览器的“猜你喜欢”功能,可根据用户的点击情况,向用户推荐相关信息等。

目前,对于推荐系统还没有明确的分类体系,本文对推荐系统作如下划分:1根据算法原理,分为基于协同过滤算法的推荐、基于内容的推荐、基于关联规则的推荐、基于知识的推荐、混合推荐;2根据应用场景,分为电子商务应用中的推荐、社交好友的推荐、信息内容的推荐;3根据使用的分析数据,分为基于用户行为数据的推荐、基于标签的推荐、基于上下文信息的推荐、基于社交网络的推荐。

随着互联网络的发展和大数据浪潮兴起,人们逐渐意识到推荐引擎的重要性,好的推荐系统能够充分挖掘隐含在大数据中的信息,帮助用户迅速获得所需信息,提高信息查询效率,改善用户体验,同时方便为企业推销产品。目前,apachemahout推荐系统平台,可以帮助开发人员快速搭建推荐系统。

1传统推荐算法

1.1协同过滤算法

协同过滤算法是目前应用最为广泛的个性化推荐技术[6,7],其中Grundy被认为是第一个投入应用的协同过滤系统[8]。协同过滤算法主要有两种:基于用户的协同过滤和基于物品的协同过滤。基于用户协同过滤的基本思想是在大量的用户中挖掘出和目标用户具有相同兴趣的用户,作为目标用户的近邻,根据近邻与目标用户的相似度,预测目标用户对目标物品的喜爱程度,根据最终计算结果排序,将评分较高的物品推荐给用户。基于物品的协同过滤的基本思想是:如大量用 户对两个 物品的评 分非常相近,则两个物品是相似的,先计算出物品之间的相似性,再找出近邻物品,结合用户对近邻物品的评分计算出对当前物品的评分。基于物品的协同过滤算法分为两步:1计算物品之间的相似度;2根据物品的相似度和用户的历史行为生成推荐列表[9]。

1.2相似度计算方法

协同过滤中,由用户的历史评分记录生成用户评分矩阵Rm*n,根据Rm*n计算用户相似度以及物品的相似度,相似度计算在协同过滤中非常关键,可以提高准确度。

协同过滤算法中常用的相似性度量方法有余弦相似性、皮尔森相似度、修正余弦相似性等。

余弦相似性的计算将用户评分看作n维空间中的向量,计算向量之间的夹角余弦度量相似性的大小:

其中,u,v为两个用户的评分向量。

皮尔森相似性是在两个用户共同评分的项目集上,使用用户的评分进行相似度计算:

其中,Ru,i代表用户u对物品i的评分;Ru.avg代表用户u评分的平均值;S代表用户u,v评分的项目集。

修正余弦相似性也是依据用户评分计算相似度:

其中,Ru,i代表用户u对物品i的评分;Ru.avg代表用户u评分的平均值;S代表用户u,v共同评分的项目集合;S1代表用户u评分的项目集合;S2代表用户v评分的项目集合。

1.3预测评分方法研究

使用近邻用户的评分数据,或者近邻物品的得分,采用相似度加权方法计算用户对目标物品的评分值。计算如下:

sim(u,v)代表用户的相似度;Pv,j代表近邻用户v对物品j的评分;Ru.avg用户u评分的平均值。

近邻物品得分的计算方法如下:

sim(i,j)代表物品的相似度;Pu,j代表用户u对物品j的评分;Rj.avg为用户得分的平均值。

本文在以上传统协同过滤算法的基础上,提出改进的协同过滤算法。

2基于用户特征和商品特征的组合协同过滤算法

在协同过滤算法中,用户和商品相似度的计算是非常重要的步骤,精确的近邻计算结果可以提高信息推荐的准确度。传统协同过滤仅依据用户评分的历史记录进行相似度计算,没有考虑用户和商品本身的特征。本文提出一种新的相似度计算方法,能改善相似度的计算结果。

2.1基于用户特征的相似度计算

网站注册中一般会 要求用户 填写基本 信息,例如年龄、性别、学历、职业等。本文将用户属性特征信息融入相似度计算,根据采用数据集,考虑用户的性别、年龄、职业信息。

(1)性别特征。不同性别的用户对商品的需求是不同的,性别相似度度量计算公式为:

(2)年龄特征。不 同年龄段 的用户对 商品的需 求不同,年龄相似度度量计算公式为:

本文认为年龄差距在10岁以内的用户兴趣相近,其它年龄差距按公式进行度量。

(3)职业特征。不同职业的用户对商品的需求不同,职业相似度度量计算公式为:

用户特征相似度计算公式为:

其中a,b分别为性别特征和年龄特征所占权重,可根据具体情况,结合传统协同过滤算法反复实验获得适当的权重。

用户相似度计算公式为:

其中,SimMatrix(u,v)为根据用户评分矩阵计算的相似度结果;c,d分别为两种相似度计算所占权重,具体数值可结合传统协同过滤算法反复实验获得。

2.2基于物品特征的相似度计算

将物品分类信息融入商品相似度计算中,由于每个商品可以属于多个不同的类别,以测试数据集movelens中的数据分类为例,电影类别数目一定,一部电影属于某个类别,则该类别属性的值设为1,否则类别属性设为0。根据类别属性值产生一个类别向量,通过计算类别向量在n维空间的夹角余弦来计算商品之间的特征相似度。

假设商品i的类别向量为→i,商品j的类别向量为→j,则商品i,j之间的相似度计算公式:

物品相似度计算公式为:

其中,SimMatrix(i,j)为根据物品得分矩阵计算的相似度结果;Sparse=对i,j评分用户的交集/i,j评分用户的并集,为用户评分的稀疏度;e,f为两种相似度计算所占权重,具体数值可通过结 合传统协 同过滤算 法反复实 验获得。

2.3组合推荐算法

通过计算相似度得到近邻用户和近邻商品,传统评分预测计算方法采用上文所述相似度加权方法。本文提出的计算方法基于物品的计算方法和基于用户的计算方法进行组合,计算公式如下:

其中,α=相似物品数/设定的物品近邻数;β=(设定的物品近邻数-计算出的相似物品数)/设定的物品近邻数。

上述组合评分计算,弥补了由 于数据稀 疏性即物 品多、评分少带来的近邻数目不足的问题,改善推荐计算结果。

3实验设计与结果分析

将基于物品的协同过滤算法,基于用户的协同过滤算法和本文提出的改进算法的实验结果进行对比。

3.1实验数据集

验证实验所采用的数据集为MovieLens网站的电影评分数据ml-100k,MovieLens由GroupLens项目组创办,是一个以研究为目的的实验性站点。ml-100k数据集包括用户属性信息文件u.user,用户评分数据文件u.base,u.test,电影信息文件u.item等。该数据集包含10万条用户评分记录,943位用户,1682部电影,每个用户至少对20部电影进行了评分。

3.2实验度量指标

本实验结果的度量标准采用平均绝对误差MAE。通过计算算法预测评分和实际用户评分的偏差大小来度量算法的预测准确性。MAE计算公式如下:

其中,Pi为预测用户品分;qi为用户实 际评分;N为评分用户数目。

3.3实验结果

结合传统协同过滤算法进行反复试验,确定计算公式中权重估计值:

a=0.5,b=0.2,c=0.7,d=0.3,e=0.8,f=0.2。在上述权重值下进行基于用户协同过滤,基于物品协同过滤及基于用户特征和商 品特征的 组合协同 过滤算法 试验。实验结果如图1所示。

由实验结果可以看出,结合用户属性特征和商品分类属性特征的组合协同过滤算法在不同的近邻数目取值下,度量指标平均绝对误差比传统的基于用户的协同过滤和基于物品的协同过滤低。可以看出,本文算法提高了推荐的准确度。

4结语

本文将用户属性特征融入用户相似性计算,将商品分类特征融入商品相似性计算,改进了相似度计算方法,并将两种预测评分方法进行组合,一定程度上减少了数据稀疏性带来的问题。由实验结果可以看出,改进的算法提高了推荐精度。下一步研究需将该算法应用在其它推荐场景中,不局限于实验所采用的数据。

摘要:协同过滤算法在电子商务网站推荐系统中的应用非常广泛,其通过分析大量用户的历史行为数据,挖掘用户的兴趣,向用户推荐合适的物品。然而,协同过滤算法存在数据稀疏性问题。针对该问题,提出一种基于用户特征和商品特征的组合协同过滤推荐算法。通过用户基本属性特征、物品分类属性特征以及用户的历史评分记录,计算用户的相似性和物品的相似性,获得近邻用户和相似物品;依据改进的基于物品协同过滤和基于用户协同过滤组合推荐算法,为项目进行评分。实验表明,该方法能降低预测结果的平均绝对误差,提高推荐精度。

关键词:协同过滤,属性特征,数据稀疏性,平均绝对误差

基于用户特征的研究 篇2

基于Web浏览的高校图书馆用户个性化研究

本文对当前主要的Web挖掘技术和高校图书馆用户兴趣建模技术进行了分析,提出了以高校图书馆用户在高校图书馆网站浏览内容分析为主,浏览行为分析为辅的高校图书馆用户兴趣挖掘过程模型.而基于Web浏览内容挖掘所得到的用户兴趣模型能较准确地描述用户的`兴趣.

作 者:黄镇圣  作者单位:南昌陆军学院科文教研室 刊 名:科技信息 英文刊名:SCIENCE & TECHNOLOGY INFORMATION 年,卷(期): “”(12) 分类号:G64 关键词:图书馆   个性化服务   用户兴趣模型   Web挖掘  

基于用户研究的产品包装设计 篇3

【关键词】用户 研究 产品 包装 设计

引言

随着社会进步与人类精神文明的不断提升,用户对产品价值需求的内容更多、品味更高、形式也更多样化。如对产品包装而言,从过去的用户对产品包装的简单需求,到今日的产品包装已成为影响企业产品销量和市场份额的主要因素,均表明产品包装设计已是企业产品设计的重要环节。以往的设计经验告诉我们,产品包装设计只有与用户研究有机融合,才能将产品包装的应用性价值最大化。具体而言,就是要求设计师全面而深入地了解用户的基本情况、行为习惯以及思维活动等,通过建立有效的用户模型,为产品包装设计与创新提供最基础的用户信息资料与精确设计定位。基于此,运用用户研究理论的科学研究方法,借助相关成功案例,对产品包装设计等进行深入而系统地剖析研究,以期对企业和设计界产品包装设计的应用和创新有所帮助。

1 用户研究与产品包装设计概述

1.1 用户研究的概念及其方法

用户研究是新时期设计界兴起的一股设计研究方法的新思潮。用户研究的最基本思想就是将用户时时刻刻摆在所有过程的首位[1]。简言而之,用户研究作为“以用户为中心”的设计流程中的第一步,它是一种理解用户,并将用户实际目标、用户客观需求与企业的商业宗旨相匹配的理想方法。在产品设计领域,运用用户研究方法,可以帮助设计师获取丰富而真实的用户原始信息资料。比如:用户的行为习惯、生活状态、价值观、以及看待产品的视角和使用产品的惯有方式等[2]。以此为基础进行的相关产品设计,既可以减少设计团队的设计时间和成本,又可以合理使用资源,使产品设计更符合用户的习惯、经验和期待。

目前常用的用户研究方法主要有9种,其中观察法、文化探寻等方法均在人种学研究中有充分应用;而研究人员最频繁使用的问卷调查、访谈法、焦点小组等方法,均源自于社会学;最后在自身科学领域中,如眼动研究方法、可用性测试、用户角色、卡片分类等也被经常使用。

1.2 产品包装设计的内涵与用户研究

产品包装设计是基于用户需求与体验的多元化设计,具体是指选用合适的包装材料,根据产品本身的特性以及消费者的喜好等相关因素,运用巧妙的工艺制作手段,为产品进行容器结构造型和包装的美化装饰设计[3]。当下,解决产品在流通消费过程中的物质保障功能与审美功能优化相结合的问题,已成为产品包装设计的目的所在。故而,在现代产品包装设计中充分运用用户研究的设计方法可以有效地促成产品设计以增值化的形态呈现。如:通过对用户行为习惯特征的深入探究,使得产品包装的结构形态更具功能化和人性化;通过对用户生活状态与收入水平的充分了解,使得产品包装的材料形态更具经济性和绿色低碳;通过对用户的审美视角与价值观的客观分析,使得产品包装的装潢形态更具文化内涵和独特风格。总之,将用户研究融入产品包装设计过程中,既满足了消费者的基本价值需求,也促进了产品的有效推广传播,促成商品经济消费的良性循环。

2 用户研究在产品包装设计中的应用实践

2.1 用户研究与包装材料的绿色选择

伴随设计的不断发展,产品包装设计的绿色化已成为现代设计师不懈探讨的问题,也逐渐演变成大众消费者所关注的重点,这不仅要求设计时所使用的包装材料须满足包装材质的可循环利用,更要以用户的感知习惯与消费心理为设计前提,以便于传达绿色低碳环保、资源再生利用等重要信息,形成包装设计领域的创新型风格。

例如,臺湾“掌生谷粒”粮品企业所推出的系列农产品(图1)。在设计前期,设计师通过观察法及文化探寻的研究方法,对台湾地区的自然田园与农户进行了地域性实际调研,掌握了大量的人文与生态信息,并辅以摄影与拍摄等现代科技手段做出了详细的客观记录;之后,运用深度访谈与用户角色的研究方法,对目标用户进行了全面的信息搜集,通过录音与速记的方式,对小量需求的特殊用户以及大量需求的企业用户做出分类规划;最终,基于对用户信息的深入分析研究,该系列农产品的包装设计材料决定选用有机形态下的自然原生牛皮纸张,用橡子树皮揉搓而成的纸藤捆扎,并在包装表面贴合棉纸作为形象装饰,有效地避免了包装的过度视觉装潢。在其以全新的包装形式涌入消费市场时,迅速获得了广大消费者的认可,这也充分体现出地区民族文化的精神内涵以及绿色包装材料适度设计的基本要求。

2.2 用户研究与包装色彩的装饰应用

色彩作为最直观的视觉符号,不仅可以有效传达产品的基本信息,也可以促成企业品牌的高识别度。研究表明,人对色彩的感知相当敏锐,人眼可以分辨出10000种色调;而在经济消费环境中人们对商品色彩的注意力占人眼可视范围的80%;而对其造型的注意力仅有20%[4]。不同色彩装饰下的产品,不仅给予用户不同的心理感知,产品包装配色的协调舒适也能激发消费者浓厚的购买欲。因此,色彩在产品包装中的装潢应用,要根据产品基本属性与价值功能制定装潢设计方案,更要注重对用户消费心理,视觉行为特征,审美情趣等用户精神内涵的分析与归纳。

举例而言,农夫山泉旗下“东方树叶”的系列茶叶包装就是基于用户研究视角下运用色彩搭配进行包装装潢的典型案例(图2)中国有巨大的茶饮料消费市场,但日前大多数同类产品都有雷同的包装形象[5]。故而设计师Pearlfisher试图通过对中国茶叶市场、茶叶历史文化以及相关消费用户的资料收集,从而设计出形象性与装饰美感并存的包装形象以帮助农夫山泉茶饮料脱颖而出。值得一提的是在对用户购物标准与消费趋向勘测记录时,设计师借助眼动仪对抽样调查的目标客户群做出相对客观的检测试验,通过客户在面对不同装饰色彩时的视觉波动,获取用户色彩选择的视觉信息数据,并运用深度访谈与回溯的研究方法确保实验数据的精确度与可用度,从而设计出具有东方神韵的茶叶饮品包装图案。其中由于茶饮自身色彩与茶品种类的不同,故在瓶贴设计上选择极富民族特征的深红与翠绿作为主色调,并大量使用传统民间装饰图纹与书法字体的排列方式,充分传达出东方色彩的通透质感与内敛情绪。当下“东方树叶”在茶饮品消费市场上深受到广大茶叶消费者与经营商的青睐,不仅是民族化色彩在包装装潢中的实践性应用,亦是设计师精确运用用户研究的具体措施及方法满足用户审美情感需求的突破性创新。

2.3 用户研究与包装结构的功能设计

随着商品经济的推进,广大消费者在开启产品包装时已不再满足于包装自身的基本属性,而更关注包装的附属与延伸功能,这也说明对于包装结构的全面创新与制定已成为包装设计师的又一研究性课题。

鉴于用户对产品包装多功能化的价值需求,包装设计的结构创新应该具备两个必要因素:其一,同一包装功能形态的可增值价值体现与再生循环;其二,针对包装对象,即产品使用时的便捷性与人性化表达。简而言之,包装结构的多功能化就是满足用户使用产品时的便捷性的基本需求,以及对产品包装附加功能的多次利用,有效促成包装的可增值性价值体现[6]。

在众多包装设计的上市产品中,意大利的朗姆酒包装是结构功能化创新的代表作品(图3)。设计师通过问卷调查的用户研究方法对不同消费群体的客户需求分别展开调研。对于酒类销售的大型企业进行大范围的网络问卷调查,将获得的有效数据作进一步定量分析;而对工艺品收藏或礼品馈赠的居家白领用户进行小范围的电话问卷调查,将获得的客观信息做出汇总归纳与定性分析。在掌握用户资料与需求的基础上选用胡杨木作为包装的函套,并结合纸质材料的特征,创新原有酒包装的内部结构,使包装稳定性与空间布局最优化兼顾。而针对特殊用户,设计师在后期的小样制作环节进行可行性测试。选取典型用户对包装小样进行特定任务的操作,同时设计师对用户的行为以及言论进行观察,记下任务过程中的可用性问题。根据记录对于设计初稿进行相应的调整与修改,在原本包装函套增加简洁明晰的镂空技法,并在整体造型上增添局部包裝隔间,置入电线与小型号白纸灯泡,赋予单一的朗姆酒包装新的使用功能,即保护产品同时用户亦可通过简单拆分得到DIY的节能绿色电灯。充分满足用户对包装重复使用的全新要求,实现了包装结构的创新与附加功能的价值体现。

结语

现代企业为增强其竞争优势而日益重视产品包装和服务优化创新。做好现代产品包装设计,不仅仅需要艺术的修养、工程的理性,更需要将设计的过程和实践建立在一系列坚实的基础上,这样才能设计出真正符合人本需求的包装。而这一系列坚实的基础必然与扎实的用户研究息息相关。通过对用户研究方法的理论研究丰富扩大用户体验感知的范围和概念,实现了对于设计对象的用户研究,亦为新时期产品包装设计的创新提供理论支持和可实用的基础。

当然,用户研究方法的最终目标并不是纯粹的科学技术应用,而是通过具体设计创新来满足企业实际利益和用户生活品质的需求[7]。只有从用户本身的切实需要、行为动态,习惯特征等层面出发,才能真正丰富设计理论和提高实践水平,赋予新时代产品包装低碳绿色、装饰美感,多功能化的创新性特征,摆脱仅仅表面形象设计的狭小范围。

参考文献

[1]DDF·UXPA中国.用户体验百家谈[M].北京:电子工业出版社,2014.

[2]李利伟.基于情境感知的远程用户研究方法和工具研究[D].大连:大连海事大学,2011.3.

[3]王安霞.产品包装设计[M].南京:东南大学出版社,2002.

[4]张继渝.设计色彩[M].重庆:重庆大学出版社,2005.1(3).

[5]陈巧娟.国内茶饮料包装设计初探——由“东方树叶”包装设计谈茶饮料包装之路[J].中国包装工业,2013.6.

[6]宋冬慧,吴天宇.包装结构多功能化的创新研究与制作[J].艺术百家,2013.12.

基于用户特征的研究 篇4

随着计算机和信息技术的快速发展,电子商务得到了迅猛发展。根据中国互联网络信息中心的统计数据显示,2013年我国网络购物市场交易金额达到1.85 万亿元,相较于2012 年增长了40.9%。人们在进行网络购物的同时,也会根据购物的体验和产品使用情况进行用户评论。目前,一些大型B2C网站商品后面的用户评论少则几千条,多则数十万条。这些用户评论直观地体现了用户对商品和服务的态度以及意见,准确的获知用户对商品的态度和意见对商家的经营决策至关重要。然而,由于这些用户评论的数据巨大且属非结构化信息,因此需要借助计算机技术对这些用户评论进行数据挖掘。评论挖掘主要包括产品特征挖掘、情感倾向分析以及评论中主管内容识别,它是非结构化信息挖掘的一个新兴领域。在国外,针对英文的用户评论挖掘已取得了一些成果,而国内针对中文的用户评论挖掘还处于起步阶段。由于文化和语言表达方式的差异,使得用于英文用户评论的评论挖掘技术不能直接用于中文的用户评论挖掘。所以,本文将主要针对中国电子商务网站上面的中文用户评论进行产品特征挖掘和情感倾向分析,旨在为中文领域内的电子商务网站商家提供更为方便和科学的评论挖掘数据。

结合产品特征和用户情感倾向,可以直观的得到用户对产品及服务的满意度;根据用户评论针对不同产品特征的评论数量的不同,可以直观看出用户更关注哪些产品特征。这对于商家的经营决策,能起到非常确切的指导作用。本研究制订了以下针对中文用户评论中产品特征和情感倾向的挖掘任务:

(1)提取用户评论中的主要产品特征,并计算出针对该产品特征的用户评论数量;

(2)根据提取到的产品特征,对情感倾向词进行抽取,并组成产品特征- 情感倾向词对。

1 研究背景

Popescu等人[1]将用户评论挖掘分为几个子任务:(1)主要产品特征挖掘;(2)对于产品特征的用户主观观点挖掘;(3)评论观点的情感倾向判断;(4)根据观点的重要性进行排名。本文的研究内容主要涉及(1)(2)(3)这三项子任务。

1.1 产品特征挖掘

网络用户评论中的产品特征挖掘是指通过计算机从海量的用户评论中自动地获取用户关注该商品的主要产品特征[2],如在用户评论中出现了“物流”、“价格”和“质量”等。

在英文用户评论挖掘领域,由于研究的比较早,研究者已初步取得了一些成果。2004 年,Hu等人[2]首先采用关联规则算法对英文用户评论进行产品特征进行抽取,并利用该方法对数码相机、手机等商品进行用户评论挖掘,平均查准率达到72%,平均查全率达到80%。并在此基础上,对基于产品特征的情感倾向进行了抽取和分析,判断了用户对这些特征的情感导向[2,3]。

也有一些人采用其他方法实现了对用户产品特征和情感倾向的抽取,Kobayashi等人[4]采用了一个半自动化的循环方法实现了对产品特征和情感倾向的抽取,但是该方法的缺点是需要大量的人工参与;Popescu等人[5]利用研发的Konw It ALL系统进行贝叶斯分类,实现了产品特征抽取,相较于Hu的方法,提高了准确率,但是查准率却有所下降。

目前,对于中文用户评论的产品特征抽取研究主要集中在需要人工参与的半监督型方法或者监督型方法,例如姚天昉等人[6]通过人工定义的汽车本体抽取中文汽车评论的产品特征;Zhuag等[7]针对电影的用户评论,将电影的产品特征分为电影元素和电影相关演员两类,并人工定义了电影的产品特征;人工定义的产品特征表达模式虽然能够较精确地抽取出用户评论中的产品特征,但很难将所有可能的表达模式都人工罗列出来,产品特征抽取的召回率往往较低。Shi等[8]人面向中文也做了产品特征挖掘的研究,但是需要人工建立需要产品属性的概念模型。苑田田实现了对产品特征的抽取,并采用模糊认知图进行了知识表示[11]。

1.2 情感倾向抽取

用户评论通常由产品特征词和针对该产品特征的观点词构成,这些观点词通常由形容词组成。这些观点词承载了用户对该产品及服务的情感倾向,通常为正面、负面和中性。因此,针对产品特征的情感倾向抽取主要分为评论观点词抽取和观点词极性判断两步[9]。

目前,对于评论观点词的抽取主要有利用产品特征和观点词之间的关系抽取观点和利用观点词词典抽取观点两种方法。Hu和Liu[2]认为观点词一般由形容词构成且应该出现在产品特征词的附近,因此应该抽取产品特征词附近的形容词作为观点词;Popescu和Etzioni[4]根据观点词和产品特征词往往在评论语句中共现的规律,人工定义了产品特征和观点词之间的语法规则,利用已抽取出的产品产品特征结合语法规则抽取观点词;Zhuang等[7]针对电影评论手工定义了频繁使用的100 个褒义和贬义词作为种子集,然后在Word Net中寻找种子的同义词集,并将新得到的同义词添加到种子集中,通过迭代形成最终的观点词词典,然后通过观点词词典来获取用户评论观点词。

用户评论观点词抽取完成之后,还要进一步判断观点词的极性,通常包括正面、负面和中性。通过建立观点词极性词典来获取观点词的极性是判断评论观点词极性的最主要的工作,同时还需要考虑观点词周围的程度副词及其他语法修饰。Sista和Srinivasan[10]利用GILexicon获得初始的褒义和贬义词种子集,然后利用Word Net中的同义词和反义词联系对初始的褒义和贬义词种子集进行扩展,形成最终的极性词典。

2 方法

本文是采用Apriori算法实现对用户评论产品特征的抽取,Apriori算法是经典的频繁项集挖掘算法。在产品特征抽取的基础上,利用产品特征词和情感倾向词的共现关系实现对情感倾向词的抽取。另外,在进行产品特征抽取之前,还需对用户评论数据进行预处理。

2.1 用户评论预处理

评论预处理主要包括对评论语句进行分词、二级词性标注和断句等工作,本文主要在Python开发环境下采用中科院分词器ICTCLAS 2011 对用户评论进行预处理。通过分词、词性标注和断句等处理后得到句子库,这些句子库将成为下一步进行产品特征抽取的数据基础。

2.2 采用Apriori算法提取特征词

通过上一步的评论预处理,生成了句子库事物文件。在此基础上,本文采用关联规则寻找频繁项集的方法来抽取产品特征。Apriori算法是经典的频繁项集挖掘算法,其算法核心是通过提取满足最小支持度的频繁项集来作为产品的候选特征。

本文采用的Apriori算法步骤如下,初始K=1:

(1)遍历整个事物文件,统计所有名词产生候选1项集;

(2)统计中每个名词出现的句子数作为其支持度,将支持度不小于min Sup1的名词加入频繁1项集F1,并作为频繁2项集的候选集;

(3)通过连接步骤,产生候选(k+1)项集;

(4)通过剪枝步骤,根据最小支持度min Sup2,由产生频繁(K+1)项集;

(5)K=K+1;

(6)若没有新的频繁项集产生或K=3,则结束,否则跳到步骤3。

在上述算法过程中,剪枝步骤是是Apriori算法产生频繁项集的关键步骤。候选项集中的成员有可能是不频繁的,需要根据每个成员的支持度对候选项集进行剪枝,从而得到频繁项集。其算法流程图如下图所示:

2.3 利用情感倾向词的匹配度抽取特征- 情感倾向词对

情感倾向是用户针对产品及服务的某个特征的主观性的评价语言,它直观的体现了用户对产品及其服务的意见和态度,准确的挖掘出这些情感倾向词对用户评论挖掘至关重要。由于情感倾向往往是针对某一产品特征的主观评价,因此这些情感倾向词一般都出现在产品特征词的周围,本文就是利用这种共现关系实现对情感倾向词的抽取,从而组成产品特征- 情感倾向词对。在评论语句中,一些表示程度的副词和表示否定的词也是重要的考虑因素,因此一个产品特征- 情感倾向词对可以用个pair<feature,opinion,degree,negat ive,weight> 表示,可以简写成pair<f,o,d,n,weight>,其中weight表示<f,o> 匹配的权重,本文只有在weight大于阈值0.25 的情况下才认为<f,o> 提取正确。本文的情感倾向抽取算法流程图如下2-1 所示:

通过利用情感倾向词的匹配度实现了对用户评论中情感倾向词的抽取,组成了产品特征情感倾向词对,通过对这些产品特征- 情感倾向词对的分析,可以有效指导商家的经营决策。

3 实验验证及评价

3.1 数据来源

考虑到用户评论挖掘的普适性,本文选取的网络用户评论数据为国内某大型B2C网站中某型纸尿裤的评论数据,共3076 条,时间跨度为2011 年9 月至2012 年4 月。

3.2 试验结果

(1)本文首先对用户评论数据进行了评论预处理,包括分词、词性标注和断句,其部分结果如下表3-1 所示:

(2)采用Apriori关联规则算法对用户评论进行产品特征抽取,其结果如下表3-2 所示:

通过算法计算,本文主要确定了5 个产品特征,分别是物流、卖家服务、品牌、价格和产品质量。

(3)利用情感倾向词的匹配度抽取特征- 情感倾向词对根据上文获取的5个产品特征,本文利用产品特征和情感倾向词的共现关系,实现了对情感倾向的提取,组成了产品特征-情感倾向词对。针对算法抽取的产品特征-情感倾向词对,本文进行了统计和分析,统计结果如表3-3所示:

上表的统计结果显示,有1472 条用户评论关注产品的质量,583 条用户评论关注了产品价格,而关注物流、卖家服务和品牌的用户评论数分别只有255 条、64 条和152 条。这体现了用户在网络上购买纸尿裤时更多关注的是产品的质量和价格,对物流和服务品牌关注较少。因此,商家的经营重点应该是努力提升产品质量,并相应的降低产品的价格,从而提高产品的核心竞争力。

同时,本文还针对每种产品特征的情感倾向占比进行了统计,其统计结果如图3-1 所示:

从上图可以看出,“物流”、“卖家服务”、“品牌”这三个产品特征的“很好”评价占比非常高,“质量”产品特征的“很好”和“好”的评价占比也很好。而“价格”产品特征的各等级评级占比相差不大,说明用户认为该商品的价格相较于其他同类型商品不具备优势,商家应该努力较低产品的价格,从而获得核心竞争力。

4 结束语

本文主要研究了基于中文的网络用户评论挖掘,采用Apriori关联规则算法实现了对产品特征的抽取,并统计了各产品特征的用户评论数量。在产品特征抽取的基础上,利用情感倾向词和产品特征共现的关系实现了用户情感倾向词的抽取。根据以上的用户评论挖掘结果,能为电子商务商家的经营决策提供一种决策依据。

摘要:随着电子商务的迅猛发展,越来越多人开始选择网络购物,并会根据购物体验和使用情况对商品进行评论。本文主要基于网络用户评论对产品特征和情感倾向进行挖掘,从而指导商家的经营决策。本文首先介绍了Apriori产品特征挖掘算法,然后基于产品特征进行了情感倾向词挖掘,组成产品特征-情感倾向词对。最后,基于数据进行了试验验证和评价。

关键词:用户评论,产品特征,情感倾向

参考文献

[1]POPESCU A M,YATES A,ETZIONI Q.Class extraction from the Word Wide Web[C]//Proc of AAAI-04 Workshop on Adaptive Text Extraction and Mining.San Jose,CA:American Association for Artificial Intelligence,2004:1-6

[2]Hu Ming-qing,LIU Bing.Mining and summarizing customer reviews[C]//Proc of the 10th ACM SIGKDD International Conference on knowledge Discovery and Data Mining New York:ACM Press 2004:168-177

[3]LIU Bing,HU Ming-qing,CHENG Jun.Opinion observer:analyzing and comparing opinions on the Web[C]//Proc of the 14th International Conference on World Wide Web.New York:ACM Press 2005:342-351

[4]KOBAYASHI N,INUI K,MATSUMOTO Y,et al.Collecting evaluative expressions for opinion extraction[C]//Proc of the 1st International Joint Conference on Natural Language Processing.Berlin:Springer,2005:596-605

[5]POPESCU A M,ETZIONI Q.Extracting product features and opinions from reviews[C]//Proc of HLTEMNLP.Morristown,NJ:Association for Compatational Linguistics,2005:339-346

[6]姚天昉,程希文,徐飞玉等.文本意见挖掘综述[J].中文信息学报,2008,22(3):71-80

[7]ZHUANG,Li JINGfeng,ZHU Xiaoyan.Movie review mining and summarization[C]//Proceedings of the 2006 ACM CIKM International Conference on Information and Knowledge Management New York:ACM Press,2006:43-50.

[8]SHI Bin,CHANG Kui-yu.Mining Chinese reviews[C]//Proc of the 6th IEEE International Conference on Data Mining.Washington DC:IEEE Computer Society,2006:585-589

[9]郗亚辉,张明.产品评论挖掘研究综述.山东大学学报,2011(5).

[10]STONE P J,DUNPHY D C,SMITH M S.General inquirer:a computer-assisted approach for computer analysis of textual data.2010(10)

基于用户特征的研究 篇5

工 作 手 册

(理工类专业适用)

学 院

专业班级

姓 名

学 号

指导教师

二○一 年 月 日

基于形状特征的图像检索算法仿真实现研究

摘要:近年来,随着数字多媒体和移动计算机以及互联网信息技术的快速进步发展,数字图像的应用数量正以惊人的增长速度不断增长。面对日益丰富的数字图像媒体信息这个海洋,人们仍然需要有效地从中不断获取所有人期望能够得到的更多媒体信息。因此,在一个大规模的数字图像检索数据库中如何进行快速、准确的图像检索已经成为当前人们图像研究的一个热点。

为了能够实现快速而准确地进行信息检索数字图像,利数字图像的主要视觉信息特征,如图像颜色、纹理、形状等元素,基于形状的数字图像信息检索处理技术应运而生。本文主要深入研究基于图像形状基本特征的边缘图像侦测检索,边缘图像检测检索是基于图像形状基本特征的一种有效检索图像方法,边缘检测是检索图像最基本的形状特性。在图像景物边缘特征检测中,微分这个算子算法可以准确提取和输出景物图像的一些细节分析信息,景物图像边缘特征是图像细节分析信息中最主要具有不可描述性的景物边缘特征的部分,也是进行图像边缘分析过程中的一个不可或缺的部分。本文详细地阐述分析了一种局部边缘厚度检测算子方法,即canny方法算子,用c++编程语言实现各方法算子的局部边缘检测,并根据算子边缘厚度检测的准确有效性和边缘定位的准确可靠性,得出这种canny方法算子已经具备了所有最优化的边缘厚度检测所应必需的各种特性。并通过基于图像轮廓的图形描述表示方法,傅里叶轮廓描述符对一个图像的轮廓形状及其特征特点进行轮廓描述并将其存入图像数据库中。对行业也相应的具有检索查询功能。

关键词:形状特征检索;边缘图像检测;傅里叶描述符

一、前言

随着现代信息化工业社会的到来,几乎任何一个学科研究领域的技术发展都和现代计算机技术密切联系有关,人们所需要处理的图象信息已不仅仅只是一些数字、符号等的信息,而是越来越多地与人接触并得到大量的数字图象内容信息.其中例如:航空卫星信息遥感监测图象、医学遥感图象、地理水文信息监测图象等.而且在实际技术应用中随着时间的不断推移,图象信息数量也在不断扩大,利用各种人力来对这些图象信息进行内容浏览和信息检索,不仅仅需要大量的精力和时间,浪费大量的的人力,而且几乎已是不可能完成的一件事。这样需要利用计算机对这些数字图象内容进行有效内容组织和信息检索便已经成为现代人们科学研究的重要课题.因而传统的数字图象内容表达和信息检索处理方法往往是需要使用图象文件名、标题、关键词数字等.目前,这种检索方法已不能完全满足现代人们的技术要求.因此,人们越来越迫切地认识需要对这些图象的各种可视性和特征图象进行信息提取,并且根据这些可视特征对各种图象内容进行信息检索.基于图象内容的数字图象信息检索处理技术,也正是在这样的一种情况下发展产生的.基于图象内容的数据图象信息检索数据技术就是通过数据分析一个图象的主要内容(例例如:颜色、纹理、形状等),从大量活动视频图象库中查找含有特定物体的图象,它充分克服了现代传统检索方法的不足,融合了数字图象处理、图象识别和网络图象检索数据库等多个领域的最新技术成果,从而完全可以为你提供更有效的图象检索技术手段.它们既充分体现了特征图象的基本信息处理特点,又充分结合了现代传统图象数据库检索技术.其基本检索过程一般是:首先对一个图象特征进行图像预处理,然后根据特征图象的基本内容从特征图象中直接选取所有有需要的特征图象形状特征,存于图象数据库中;然后当对一个图象特征进行勾画检索时,对于一个图象已知的特征图象首先抽取其具有相应的图象特征,然后在整个图象数据库中进行检索与其相似的特征图象,也或者可以根据相对于某一个的查询对象要求直接给出一些图象特征点和值,然后根据所需要给定的图象特征点和值在整个图象数据库中进行检索所要的特征图象.结果例如:对于基本相同形状带有特征的图象检索,你或许可以直接给出一些有关被勾画检索某个对象的基本形状特征描述,可以认为是一些带有特征点的值,也或者可以认为是勾画出的检索对象的形状略图;对于基本相同颜色的图象检过,可以直接给出不同颜色的物体比例或者关系,等等.最后,给出图象检索后的结果.目前,从事这一技术课题相关研究的年轻人越来越多,国外许多著名科研机构和专家学者都在积极进行许多有关这一技术课题的相关研究,例如:公司的数据检索系统.国内的许多专家学者和相关科研机构也在积极进行此技术问题的相关研究.本文首先对基于对象内容实体图象的的检索数据进行了简要的理论概括,然后对基于实体对象动态形状的实体图象内容检索数据理论基础进行了深入的理论研究,包括:基于对象形状的实体图象内容检索计算方法,对象实体形状的综合描述,图象形状配匹检索算法,最后本文给出了一个基于对象形状的实体图象内容检索数据原型管理系统,并在一台微机上加以实现,该原型系统主要功能包括内容图象检索数据库的管理建立,数据库的日常维护,图象的信息查询等几个功能.二、研究介绍

2.1、课题背景及研究意义

随着现代多媒体网络技术、计算机网络技术、通信网络技术及互联网络的迅速进步发展,人们正在快速地发展进入一个现代信息化的新社会。现代信息技术已不可能能够运用各种技术手段大量的进行采集和分析产生各种类型的海量多媒体信息数据,人们对各种多媒体信息的采集需求也越来越大量和频繁。虽然人类信息的数量快速增长直接促进了人类社会的快速发展,但是由于信息快速膨胀也给现代人类社会带来了过多的的信息量以至于远远超过了这类人的整体接受信息能力。因此,除了怎样获取、处理和传输存储各种多媒体信息十分重要,怎样在各类海量的各种多媒体信息中快速有效地准确访问这些人们经常感兴趣的各种多媒体信息也对其显示体现出了同样的巨大重要性。

图像抽象信息采集是传统多媒体信息中最常见的一种,也因其具有传统多媒体信息采集数据量大、抽象应用程度低的基本特点。如何从各种海量的有用图像处理信息中有效地收集获取有用图像信息,即使是图像处理信息数据资源的使用管理和信息检索也就显得日益重要。随着当前人们对文字图像文本信息的巨大检索需求的不断增长,产生了基于图像文本的文字图像信息检索引擎技术,比如著名的中文搜索结果引擎google和百度中对文字图像的文本检索。这种基于人类文本的人工检索标注技术所广泛利用的人工文本标注检索方法虽然存在一些局限性,经常进行检索时会出来大量的一些用户不感兴趣的文本图像,但在没有找到更好文本解决办法的实际情况下,用户通常只能选择继续检索使用。因此如何对一个图像的特征内容自动、客观、全面地对其进行特征提取。真实有效的准确表示数字图像信息内容,帮助用户快速有效地检索访问自己感兴趣的信息图像内容,有着极大的科学研究领域需求和迫切的应用需要,而基于图像形状特征的数字图像信息检索分析技术恰好真正能有效的帮助解决这个现实问题。另外在实际的应用中,图像信息数据库及其信息检索的技术研究对医学多媒体图像数字图书馆、医学临床图像应用管理、卫星图像遥感网络图像和应用计算机图像辅助设计和开发制造、地理位置信息采集系统、犯罪识别系统、商标标识版权的使用管理,生物的形态辨识以及分类等诸多方面可以提供有力的技术支持。

2.2、国内外发展状况

近年来,CBIR已经逐渐发展早熟成为一个非常活跃的医药临床医学研究应用领域,各类我国顶尖临床科研机构与临床研究公司已陆续成功开发推出了一些基于CBIR临床应用管理系统的临床研究应用产品,有的已经成功广泛应用扩大到医药临床医学、商标、专利技术以及检索等诸多研究领域。

IBM的系统QBIC是它是第一个具有商业性的基于CBIR的子系统。它们还提供了基于图像颜色、纹理、形状和其他手绘图像草图的多种图像类型索引使用方法。columbia大学的图库Visual SEEK图库提供了基于自然色彩和立体纹理的多种索引分析方法。PhotoBook 是美国麻省理工学院和多媒体科学实验室自主开发的一套用于检索、浏览人脸图像的交互式检索工具,它其中包含三个图像子系统分别用于提取人脸形状、纹理和各种人脸面部特征,用户甚至可以分别定制做基于上述一种人脸特征的图像检索。MARS(multimedia analysis and retrieval system)这个系统由美国UIUC 大学负责开发,其不同之处主要在于用户学到了很多专业领域的基础知识:例如计算机图像视觉、数据库资源管理和云系统和网络信息资源检索。新加坡国立大学公司开发的一个基于复杂内容的模糊图像信息检索系统,其显著性的技术创新特色主要包括:多种特征提取的新方法、多种基于复杂内容图像检索的新方法、使用自定义组织式的神经网络对复杂内容特征进行度量、建立基于各种内容图像索引的新应用方法以及对各种多媒体信息格式进行模糊图像检索的新应用技术。

清华大学的数字ImgRetr检索结合了多种组织检索方法,就这样能为您提供基于形状主色、纹理、直方结构图、颜色元素分布、框架等多种组织方式的形状检索。

2.3课题研究的主要内容

本文主要依托基于物体形状的网络图像信息检索分析技术,重点深入研究基于物体形状动态特征的网络图像信息检索。形状纹理特征不同于物体颜色、纹理等的特征,形状纹理特征的正确表达必须以对物体图像中每个物体或图像区域的正确划分来作为理论基础。在二维矩形图像中的空间中,形状通常被我们认为为它是由于一条完全封闭的并由轮廓映射曲线所形成包围的特征区域。通常这种情况下.二维形状中的特征区域有两类可以表示它的方法,一类可以是一个区域形状特征,利用的可以是整个二维形状特征区域;另一种分类可以是一条轮廓曲线特征,利用的则可以是二维图像的整个外边和内界。本文主要重点研究的领域就是外界与边界的边缘索引测量方法边缘测量检测,边缘测量检测的常用方法主要有很多,如:roberts矩形交叉曲线微分代数算子、sobelt微分代数算子、priwitt交叉微分代数算子和Laplacian微分代数算子以及canny微分算子。而其中属Canny算子最好。

本文主要深入研究的字符是傅里叶描述符。其主要理论思想观点是用关于物体内部边界的傅立叶变换公式作为其物体形状学的描述。

2.4、相关内容介绍

2.4.1形状分析

2.4.1.1、形状特征

常用的长轴形状运动特征参数有长轴周长、形状特征参数、偏心率、长轴运动方向与弯曲运动能量等矩阵的描述、综合光密度以及三维轮廓的应力矩也同样可以用于表示和用来描述三维图像。

2.4.1.2特征选择

通常一般来说,形状的形态表示特征图型表示法具有两种常用图形表示法的表现方法,一种表示方式主要是用来表示具有轮廓性的形状形态特征,另一种表示方法主要是用来表示具有区域性的形状形态特征的。前者一般来说只用于看到整个部件物体的内部外观和形状边界,而后者则直接把它关系着其应用到整个部件物体外观形状上的各个区域。

2.4.2、一种基于形状的图像检索算法

2.4.2.1、算法分析

基于这种形状的图像检索更多地只是用于了解当前的用户能够粗略地扫描画出一个图形轮廓之后进行图形检索的实际情况。这种图形轮廓绘图可以认为是通过用户凭借自己脑子在空中的第一印象徒手自动画图绘出来的,也甚至可以认为是通过操作系统软件提供的基本图形绘图处理工具“拼凑”的。这两种检索情况都不具有一个基本特点,即它所提供的检索形状只是对所欲检索图象形状的粗略抽象描述,它从它的大小、方向或者其整体形状结构上都很有可能与真正根据要求调查的检索图形形状有较大小的出入。因此,基于面的形状进行检索的主要难点仍然在于需要寻找一种能够准确检索与面的大小、方向及整个扭曲面的伸缩程度无关的检索方法。

不变矩和产品轮廓的应力不变矩的方法产品具有良好的轴向平移、旋转、尺度上的缩小和放不变性及高度抗干扰性。用一个图像的形状不变矩和图像轮廓的应力矩阵来作为矩对图像的两种形状相似特征进行索引,使用适当的形状相似性之间距离进行定义,计算并得出两幅画中图像的形状相似性之间距离,当这个距离的值足够小时,就可以认为两幅画的图像形状是相似的。傅里叶这种算法不仅对图像噪音控制具有很好的鲁棒性,而且对几何变换速度具有不变性,更加十分适合工图像形状分析检索的实际需要。因此,提出了应力不变矩和矩形轮廓的应力不变矩的算法和傅里叶公式描述中的符号相结合的计算方法。

三、图像检索技术的发展过程

目前图像检索的技术最早开始于上个世纪70年代,当时主要研究的是基于文本的检索,即使采用关键词和描述性的文本来对其进行检索,要求使用者对文本中各种特征的描述都必须具备一定的精度准确性和规范性。但是随着各种大规模的数字化图像仓库的诞生,基于文本检索的技术暴露了自身的优势。在我国逐步发展到90年代,基于图像内容的信息化图像检索技术应运而生,其设计思路主要是充分利用信息化图像自身的各种视觉特点,例如:将图像中的颜色、纹理结构、形状、空间之间的关系等信息作为内容来进行匹配、查找。它通过充分地利用了己经拥有的算法,使得所有的特征提取和匹配都完全能够由机器自动地完成,检索的过程也没必要太多的人为干涉和解释,这就克服了传统的手工标签注释方式的低效率和二义性。

四、基于形状特征的图像检索

因为许多的图像检索系统把注意力集中到了基于色彩或者是纹理学的方式上。但对于某些图像形状来说,纹理和颜色的信息不够丰富,如一些商标图像等,这时基于纹理的检索方法便无法完全满足所有的检索要求,而必须从整个图像形状入手。形状特征信息是图像的中心特征之一,图像中的形态和信息不会随着图像中物体颜色的改变而发生任何变化,它是一种稳定的特征。用各种形状的特征来区别物体很加直观,它们是现代社会中人们识别不同形态图像的主要技术特征之一。因此,通过利用各种形状特征来检索图像,可以大大提高检索的精度和效果。基于目标的形状特征的图像检索主要目的是通过检测得到目标轮廓线或分割得到目标轮廓,并针对其所在位置进行形状特征的提取或直接针对图像搜集寻找合适的向量特征。形态描述要求我们在尽量区别各个目标之间的基础上,对于目标平移、转动及尺度的变化并不敏感。目前,虽然我们已经研究提出了许多关于形状的分析技术,但是想要将它们有效运用到图像检索中仍存在的问题还有一些困难和疑惑亟待解决,如算法的工作效率和复杂程度,形状特征的提取与描述等。

五、基于形状特征的图像检索具体实行

5.1对象形状的描述

图象经过边缘的提取、分割后可以获得诸个被分割的区域.对诸个被分割的区域所提取的形状特征,是基于内容的图象检索系统的重要组成部分,所提取的形状特征对于图象的旋转、图像的平移和对图象缩放都是不敏感的.本文主要研究涉及以下几种形状的特征:

(1)基于傅立叶系数的形态和特点.圆角度,细长程,散射性.(2)基于几何形状的特征.区域的面积,区域的周长,体态比.(3)矩描述.共有七个矩常量.(4)以相似多边形为基础的结构和特点.(5)形状直方图.5.2、系统设计与实现

系统主要可以分为三个组成部分:(1)图象数据库建立模块.该建立模块首先对用户输入的各种图象信息进行了预处理,其中包括各种图象信号和噪声的清除,图象尖锐化,边缘检测(对象物的分离),边缘细化,链码追溯,对于边界信息进行了多边形逼近,然后将其提取到对象的各种形状信息,最后把用户需要提取的信息特征值直接存入到图象数据库中;(2)图像数据库维护系统模块.本次维护系统主要负责对图像数据库信息进行维护,主要内容包括图像浏览记录的修改及历史纪念信息的删除;在对图像记录进行修改时,对那些由于计算机自动提取得到的特征值我们都是不可以进行修改的,而且我们只能通过修改这些由人为确定定义的字段,如:一个有关于图象的文字说明部分.(3)图像检索查询模块.该功能首先根据需要对被检索的图像进行提取的形状和特征,然后再根据需要选择按哪些特征值对象来进行检索,设置好图像的检索所达到要求的类型和相似程度,最后与将图像信息与数据库中的其他图像进行匹配,输出查询结果.图象的匹配查询是整个图像信息数据库的主要功能和组成部分,匹配算法的好坏及其优劣直接影响到匹配查询的速度和信息库查询的质量,其根本思路就是通过判断一个经典的已知图象与一个图像数据库中的一个图象之间的距离,如其距离有点足够小,就说明我们可以确定两个已知图象之间是相似的,其结果一般应该是多个已知图象,这些所有的图象都与经典查询的图像在一个给我们认为有点相似.我们其实可以通过运用各种相似性程量测度查询函数过程方法工具来进行分析和控制计算一个查询特征图象与一个特征图像数据库中每一个特征图象的相似度和程度,相似性程度测量中的查询函数过程主要来说是研究建立在对数据特征分析和模式识别相关技术研究基础上的,涉及所遇到的主要技术问题之一就是对于一个数据输入模式如何进行特征描述和模式判别,查询的基本过程就是根据一个新的给定数据模式对一个数据输入中的模式特征进行数据匹配.这个相似度一般来说是通过0~1之间的某个个不同参数特征来进行表现计算出来的,总的相似度也由各种不同特征所测量的相似度通过函数加权运算求和得.传统数据库的准确匹配和查询技术是很简单地了解的,但对于图象型的数据库来说,查询的质量和查询的快慢还是相互矛盾的,要求查询率和准确性好,就需要尽可能多地增加一些描述图象的特征矢量的维数,随之而来就需要尽可能多地增加计算量,所以,要在不降低特征矢量的维数条件下,才能够大幅度地提高查询率,就必须通过调整和完善查询的策略.主要采用以下两种操作方法:

(1).聚类的基本原理:分类即把一个标准图象按类划分开来成以下几类,每一类都被用户定义成作为一个分类标准图,则在用户查询一个标准图象时,首先根据要求计算出与各种分类标准图之间的物理距离,确定它们之间是否隶属于何一类,然后再与该一类的标准图象之间进行具有相似性的分类匹配.(2)过滤的原理:即通过降低维数,在进行图象匹配之前,首先将一些形状和特征相差甚远的图像从一个被称为图象匹配团队中全部清除掉,然后再将查询到的图象和匹配团队中剩下的其他图象进行对比.5.3、算法步骤

(1)通过计算被检索图像的形状和特征,并从数据库中提取图像形状和特征进行索引;

(2)对特征向量进行归一化;

(3)使用欧式距离法来计算归一化后的图像数据库中各个图像与显示者的图像之间的相似性和距离;

(4)按序输出检索结果。

5.4.边缘检测

其中边缘化的特点通常是直接影响物体图像最为主要的一个基本特点。边缘则主要是在泛指周围各个像素的颜色灰度并没具有较大阶跃性质的变化或者在屋顶上的颜色没有发生较大改变的那一个周围像素。Poggio在文中这样解释说:“或许对应着图像中物体的边界或许并没有对应着图像中物体的边界,但是边缘具有十分令人满意的性质它能大大地减少所要处理的信息但是又保留了图像中物体的形状信息”。

边缘图像检查理论是一种实现图像识别的重要理论知识基础和技术前提,直接意义地说它决定了图像识别检查结果的客观准确性。由于人体边缘图像检测尚不成熟,直接地严重影响了对图像识别的实际研究应用,一直以来都认为是图像识别相关技术应用领域的重要研究发展热点。经过多年的研究探索和应用实践,边缘式质量检测系统技术已经逐渐发展渗透至各个应用领域。在应用生物医学上,边缘提取检测主要作为适用于人体肾脏血小球的边缘提取,在应用生物医学工业和工程科学以及其他工程材料领域的边缘检测,如聚酯纤维或者其他塑料制品。而且在加工喷涂、焊接和机械装配时也被充分地吸收利用。在中国传统的民族文化工艺美术上,用于对传统纺织品和手工艺品的定制设计,服饰的定制设计和手工制作,发型的定制设计,文物收藏材料以及照片的编辑复制和收集整理,运动员的身体动作状态分析和体能评级等等。总之,边缘厚度检测已被广泛应用于各个领域。这仍然是我们必须不容忽视的一个研究发展热点。

5.5、Canny边缘检测

5.5.1 Canny指标

基于微分算子的边缘提取方法存在的一个比较麻烦的问题是如何让我们选择适当的阈值,可以通过这种方法使边缘从每一个细节中被提取出来。阈值的选择方式不同,所需要提取得到的边界信息也不相同。在两个不同的阈值下,采用相同的微分算子均可以从图像边缘提取得出一个点,但两者之间有比较大的差异。这样,在边缘提取中也就存在了对提取良好与否的评估。

针对这一重要问题,根据边缘检测的工作有效性和其定位的安全可靠性, Canny 通过研究最优的边缘检测仪器所必须要求的特点,给出了衡量边缘检测系统性能好坏的三个主要指标:

(1)良好的边缘信噪声对比,即将不是边缘点错误判定为其他边缘点的错误概率相对较高,将其他边缘点错误判定为其他边缘点的错误概率相对较低;

(2)良好的定位特性,即检测出来的边缘点应该要尽量安装在实际边缘的点为中心;

(3)对于单个边缘只能产生唯一的响应,即单个边缘能够同时产生许多个响应,其概率相对较低,并且在虚假的响应中对边界的反馈效果相应得到最佳抑制.用这样一个词来说,就是我们希望能够有效地提高人们对于景物边缘的灵敏度和噪音的同时,这种能够有效地抑制其他人们产生噪音的方式才是良好的边缘提取技术。值得我们十分庆幸的一点其实是,且个二阶线性映射算子仍然能够在有效抵抗图形噪声和对图形边缘的线性检测之间获得最佳结果折中,这个二阶线性映射算子本身其实就是高斯函数的一个二阶取值引用导出函数。高斯函数和用于原图的卷积已经初步达到了一种可以抵抗局部噪声的主要效果,而用于求导的函数,则被普遍认为已经是我们检测一个景物局部边缘的一种重要手段。

设二维高斯函数为

G(x,y)=12πσ2exp(x2+y22σ2)

其中,σ为高斯函数的平滑度和分布式的参数,可以被广泛地基于用来衡量控制网络对象或者网络图像平滑的重要程度。

其中,σ是高斯函数的分布参数,可用以控制对图像的平滑程度。

最优阶跃边缘检测算子是以卷积▽G*f(x,y)为基础的,边缘强度为

|Gf(x,y)|而边缘方向为ρ=Gf(x,y)/|Gf(x,y)|

由高斯函数的定义我们得以可知,该高斯函数都可以是无限地从头拖尾的,在实践中,一般的各种情况下都方法是将原来的有限模板尺寸截断为n,至于就达到了有限的模板尺寸。这个新的实验结果证明,当N=b2σ+1时,能够直接取得较好的边缘化学检查实验结果。

5.5.2 Canny算子的实现

下面是Canny算子的具体实现。

利用高斯函数的双向可分性,将映射▽g的两个一维滤波卷积上的模板可以分解成两个一维的滤波行列式式滤波器:

Gx=kxexp(x22σ2)exp(y22σ2)=h1(x)h2(y)Gy=kyexp(y22σ2)exp(x22σ2)=h1(y)h2(x)

h1(x)=kxexp(x22σ2) 1

h1(y)=kyexp(y22σ2) 2

h2(x)=kexp(x22σ2) 3

h2(y)=kexp(y22σ2) 4

h1(x)=xh2(x) 5

h1(y)=yh2(y) 6

K为常数将式12分别与图像f(x,y)卷积得到输出

Ex=Gxf(x,y)Ey=Gyf(x,y)令A(i,j)=Ex2(i,j)+Ey2(i,j),α(i,j)=arctan[Ey(i,j)Ex(i,j)]

A(i,j)反应出一个在图像(i,j)上点处的边缘强度,是一个在图像点处的法向力矢量(下一个交于其边缘线方向)。

根据关于canny的卷积定义,中心边缘点梯度作为一个卷积算子和它的图像(x,y)的卷积梯度是在中心边缘点和梯度相同直线方向的同一区域内两个算子梯度中的最高值。这样,就可以能够通过在各个梯度点的最大梯度值和方位上进行判断并得出每个该梯度点的最大强度方位是否为其应用领域最大强度值,从而快速确定各个梯度点的边缘点。例如,当一个矩形像素图象满足以下三个基本条件时,则被我们视作该点是一个像素图像的边界点。

(1)当像素该中一点的平均边缘运动强度方向超过了沿着像素该中一点的边缘梯度方向运动的同方向两个像素相邻点的像素中一点的平均边缘运动强度时;

(2)与该点梯度方向上相邻两点的方向差小于45度;

(3)观测领域核心中的最大边缘变化强度最大边缘阈度数值以所在该观测点位置为领域中心。

此外,如果(1)和(2)同时被边缘的顶点像素满足,那么候选选择梯度最小值相同方向上的两个非相邻顶点像素就从候选选择边缘的顶点中被直接取消,条件(3)阈值相当于由候选边缘区域选择梯度最大的阈值所在点组成的一个阈值,即图像与候选边缘的顶点之间的平均距离可以进行阈值匹配,这一消除过程就等于消除了许多虚假的边缘点。

图像边缘检测的基本步骤:

(1)对于滤波,边缘的检测主要是基于引导值进行计算,但是容易受到噪声影响。然而,该滤波器在减少噪声时还会造成边缘强度的损耗。

(2)进行了增强,加强算法把邻域的点的度有明显改变的地方突出表现。一般是靠计算梯度的幅值来实现。

(3)进行检测,但是在有些影像中梯度幅值较大的点并非边缘端。最简单的对边缘性检测就是梯度幅值阈值的判断。

(4)定位,精确确定边缘的位置。

综上所述,Canny算子的具体算法步骤如下:

(1)使用高斯滤波器对图像中的信号进行滤波,去除图像中的干扰和噪声;

(2)分析利用高斯算子的一阶方向偏移滤波函数采用微分的方法对物体图像中各点方向进行滤波,得到每一点的方向梯度和角强度和物体运动时的方向;

(3)针对梯度方向运动进行“非极大抑制”时对其梯度的反向运动及其方向如图可以正确定义为其如下如图所示

x

标识分别为1,2,3,4的四个区域将其属于四个局部分区之一,各个局部分区用不同的线将相邻四个像素分别排列来对其局部进行高度比较,以此来决定其每个局部的极大像素值。例如,如果我们在相邻中心像素图像获得x的梯度方向上认为属于第4区,则把获得x的极大梯度方向值与其左上和右下两个方向相邻中心像素的极大梯度的数值大小进行向量比较,看获得x的极大梯度的数值大小是否可视为极大梯度值。如果不是,就把每个矩形像素y到x的颜色灰度系数设置为0。这一抑制过程被人们称之为“非极大抑制”。

(4)对一个梯度进行两次阈值,即取一个阈值,两者之间的关系公式为。我们将梯度值小于的每个像素灰度设置为0。然后将梯度值小于的每个像素灰度平均值设定为0。去除了大部分的噪声,但同时也导致损失了有用的边缘和界面结构信息。

5.6基于轮廓的描述方法

基于局部轮廓图对形状进行描述的设计方法又大致可以细分为局部连续型(注意即局部全局式)和局部离散型(即局部结构式)两种。连续型全局轮廓图图描述的方法并没有对称为全局图的轮廓图进行任何分段式的处理,往往目的是从整个称为全局图的轮廓图中抽取并给出一个特征向量。这种属于离散式的分析方法通常首先把它的轮廓特点分解成许多不同片段,然后用传统计算机轮廓提取法找出其片段相应的轮廓特点。简单的物体形状类型描述表示符主要类型包括链码、傅立叶描述符、曲率尺度空间形状描述表示符和小波描述表示符四种基于物体轮廓的形状描述表示方式。

5.7傅立叶形状描述符

傅立叶形状轮廓描述符即它是一种被广泛应用的二维模型形状轮廓描述符,其最基本的设计思想就是用一个直接位于模型物体内部轮廓上没有边界的傅立叶变换函数来对其内部形状轮廓进行精确描述,假设一个二维模型物体的内部轮廓形状是由一系列每个坐标值函数为的物体像素所组合构造的并组成,其中,n函数为在物体轮廓上每个坐标像素的实际参考映射次数。从这些边界点的整体坐标中我们常常可以由此推导出来得出四类不同形状的坐标表达,分别为正弦曲率坐标函数、质心坐标距离、复弦长坐标矢量函数及其余弦长坐标函数。轮廓弧曲线上一个特征点的移动曲率被精确定义是因为该点在轮廓线上切向的移动角度与曲率相当于轮廓弧长之间的角度变动率。曲率密度函数我们通常可以简单地将其表示形式如下:

K(s)=ddsθ(s)

其中是轮廓线的切向角度,定义为:

θ(s)=argtan(yx)x=dxdsy=dyds

质心点的距离函数可以直接定义成其为从一个物体的边界点到另一个给定物体的边界中心之间距离,如下所示:

R(s)=(xx1)2+(yy1)2

复坐标函数是用复数表示的像素坐标:

Z(s)=(xx1)+j(yy1)

这种复杂的坐标向量函数的傅立叶变换形式可以用来产生一系列关于复数的坐标系数。这些频率系数从微观频率上直接反映表示了各个类型物体的宏观形状,其中较低和高频度的物体分量值就代表了各个类型物体微观形状的具体性和宏观细节属性,高频度的物体分量值则代表了各个类型物体宏观形状的具体微观细节属性特点。形状图的描述符参数可以通过这些图形转换器的参数计算得出。为了使其能够更好保持与参数旋转的速度无关性,我们简单地仅仅保留了每个参数的旋转尺寸位置信息,而且同时省略了参数相位位置信息。缩放参数无关性通常由于在保证把缩放参数值的大小同时减少添加到c和dc中的分量(或第一个不为零的缩放参数)之后缩放才能得到确认。请特别注意图形转换中的无关性就是基于物体轮廓上的形状属性来转换表示固有的转换属性。对于具有曲率向量函数和质心之间距离的曲率函数,我们只不过需要分别考虑正交角频率的两个坐标时间轴,因为这时两个函数的傅立叶变换都必须是对称的,即有。基于点的曲率三角函数的一种形状线性描述符号也可以使其表示形式为:fK=[|F1|,|F2|,...|FM2|]

其中整数代表傅立叶变换每个参数的第一至i个整数分量。类似的,由质心粒子间距所做的推测计算得到的粒子形态可以描述

符为:

fR=[|F1||F0|,F2F0,...,|FM2||F0|]

对于一个复杂的坐标密度函数,正值的频率密度分量和负值的频率密度分量被同时广泛使用。由于函数dc的地理参数定义是否与某些形态条件所在处或地点的地理位置密切相关而因此得以常被忽略。因此,第一个不是零的微波频率参数分量被广泛应用于后来用于标准化其它的微波变换频率参数。复函数坐标系是函数所有的推导形式得到的坐标形态为其描述符式为其定义方程为:fz=[|F(M/21)||F1|,...,|F1||F1|,|F2||F1|,...,|FM/2||F1|]

为了能够保证在整个特征数据库中所有位于物体的各种特征形状和其他特征均可以具有相同的特征直径和特征长度,在第一开始进行实施傅立叶变换前后你需要把所有位于物体边界点的个别特征数目可以统一添加到m。因此算法可以被直接替换为傅立叶变换法的方式使用来大大幅度改善这个算法的执行效率。

5.8图像的相似性度量

在基于特征信息的图像内容检索图像信息检索中,特征的信息相似性和特征度量也被广泛认为已经是一个亟待解决的重大检索技术研究课题之一。只有在根据分析结果得到特点图像的两个特点后后再进行对该两个特点的图像相似性距离进行准确度量,才能有效的根据图像相似性和图像距离情况做出准确判断,实现对该特点图像的准确检索。为了更好地准确达到不同特征数据检索的提取目标,需要针对特征提取后得出的不同特征数据进行相似度的分析计算。相似性系数是以一个特殊数值的表示方式被用来显示表达两个不同物体之间的事物相似性相关程度的一种数学度量式的结果。将一个人类图像的各种特征检索观察点可看作等同是图像位于一个坐标标准空间的一个特征点,两个图像特征观察点的相似度和特征距离即相似度通常用它们之间的特征距离系数来精确表示,不同特征种类的图像特征检索数据所指的需要同时采用的相似度及其度量计算函数都可能是不一样的,相似性和度度量函公式的正确选择的恰当与否往往会对特征检索结果精确度与否产生很大的直接影响,合适点的距离才是度量计算函数的正确选择,将来也会帮助使得人类图像的各个特征向量比较更加容易契合了解的人类对于各种视觉图像感知技术方面图像内容的特征仿真,有助于基于人类视觉图像感知技术方面的人类图像特征检索分析技术的仿真性能和实际应用。

假设我们在一个图像的数据库中,用两个特征向量分别来描述和表示任意一个图像的特征,其中 x 和 y ,分别为是任意两个图像的特征向量,它们之间的接近程度我们可以通过采用距离的度量或者是统计学的方法等等来对这两个图像的相似性做出判断。常见的距离测度度量主要有欧几里德、Manhattan等。下面就我重点介绍一下欧几里德的距离。

欧几里德的线性距离函数是一种在实际上已经使用十分广泛的线性距离函数变量。它的变量计算简单,并且同时也和国际参考动力系统理论中的径向旋转不确定变量计算有密切相互联系。它的英文含义:

例如当我们发生了数据的丢失或者是当所有的特征矢量都不具备相同的权重时,那么就无法利用欧几里德距离计算方法来对其进行类似性的测度。为了避免这类情况,在实践和研究的过程中,我们可以针对欧几里德的距离进行归一化。归一化欧几里德距离的定义公式如下图所示:

6、实验结果分析

图像库中包括简单几何形状,其中星形、心形、圆形、新月形图像10幅。从分析我们不仅可以清楚地明显看出,算法对于检索图像的视觉扭转和图像形变都真的是十分具有非常强的不变性,并对于检索图像的基本主观形态和视觉特性也是非常具有鲁棒性,在就算没有一定的图像形变和扭转干扰等等条件的特殊情况下,仍然完全可以直接得出良好的视觉图像判断检索实验结果;且由于算法检索图像结果所需要排列的持续时间和排列顺序与检索个体的视觉主观性和视觉特征判断检索方式大致相同,检索结果准确率也比较高。

六、以形状为特点的图像检索系统设计

6.1检索基本思想

本文文件检索的基本工作方法主要内容是:在根据设计需要建立矩形图像库时,对不同输入的两个矩形图像子存入进行综合分析,分别选择采用经过改进后的不同可变矩和二维极坐标傅里叶描述子对两个图像的不同形状和状态特征向量进行综合描述;在将两个图像子的存入转换到二维矩形图像库同时,也将其中两个相应的不同可变矩和二维极坐标傅里叶描述子的形状特征向量分别存入二维矩形图像库的特征库.检索时,根据所有用户需要提供的图像查询数据示例检索图像,采用通过线性函数加权方法求和的一种计算结果方式,计算其与二维矩形图像库中各不同类型矩形图像的各种综合相似度,把计算结果对子集中的一个大于一定相似度的图像结果集进行返回发送给所有用户.6.2 Canny算子的程序设计

本文是用C++编程来实现图像的处理,整体流程图如图所示

未打开

N

Y

Canny算子程序流程图如图所示:

6.2.1图像特征数据库设计

基于图像形状和特征的检索系统中的一个图像特征数据库是用来存放和分析图像仓库中不同图像之间的形状和特点。在这里,将计算得到的一组图像的形状和特征(曲率、质心距离、复坐标和弦长)从 Access中存放到一个相应的特征列表中,组成了一个特征数据库。

对于图像的检索,本文特别设计了对图像入库、显示、删除和添加描述四个功能。首先,利用灰度共生矩阵提取的方法得到一个图像的形状特征,并将这些特征数据存储在 access 数据库中;然后,利用基于文本或者简单的缩略图浏览等多种方式从 access 数据库中寻找到一个示例的图像,同时,针对该一个示例图像进行基于其形状和特征的内容检索和匹配,并根据需要给出检索结果的图像。

6.3实验结果

以下是原图与处理后的图片,其中图3-4为原始图片,图3-5为Canny 算子处理后的图片。

从上述处理过的数据和图像中我们可以清楚地看出, canny 算子所处理的数据和图像不但达到了准确地提取边缘信息的主要目的,提高了抵御干扰的能力外,还使得边缘更为连续清晰。

七、基于图像形状学特点的检索方法在系统中的实现

7.1系统框架

一般的图像检索子系统主要有两个大部分共同组成:图像产生子系统和数据库检索子系统,如图4-1所示。图像产生的子系统主要是对于图像输入前进行的预处理、图像中内容的特性提取以及把这些特性和部件描述的信息纳入到数据库中。图像检索子系统主要是完成对图像的检索,其中包含了浏览和查询、图像特点的相似性匹配以及图形使用者接口等几个部分。

在本文的两个实验物理子系统中,图像特征制作与截图生成实验子系统将本文中所需要描述的流体物理学图像特征及其应用对象的局部轮廓特征进行了综合分析并并入库。在这个图像轮廓检索工具子系统中,支持一个用户通过浏览库中现有的一个图像库,手动地绘制一个图像库的轮廓及然后选择一个示例的视图。

7.2编程环境

本次测试实验操作系统的主要程序开发工具平台主要是Window XP,选择使用Visual C++6.0和Access两款软件作为主要的程序开发工具,选择Visual C++6.0和Access是因为它们都能够具有面向对象应用程序设计的基本整体化和性能设计特点以及所需要开发的所有应用程序都能够具有高度的效率地正常运行。同时又是一种微软技术性高度相互集成的企业软件开发实用工具,它为企业用户自己提供了一套功能强大的企业微软软件基础类库。且因我们已经使用了Visual C++6.0来用于开发一个基于视频内容的数字视频流和图像信息检索系统。由于芯片系统内部采用了面向对象的图像设计工作方式,这样也就使得芯片系统的许多图像功能以及处理图像模块都完全可以直接整合应用起来到其它的芯片图像处理系统中,而且需要添加新的图像算法也就不必再因为需要额外复杂地进行修改许多的图像源代码,非常好地有助于整个芯片系统在图像功能上的逐步完善和不断扩展。

7.3程序结果

首先打开一个图像库选择一个图像,然后对该图像进行特征提取。系统通过图像检索相似度的匹配,找到六个与其相似的图像,输出结果。找到六个与其相似的图像,输出结果。

八、总结

本文第一章对基于内容的图像检索方式进行了概述,进而又着重介绍了基于形态的图像检索方式。并且广泛地应用了对图像进行边缘检查的技术,对整个图像进行了检索。它主要是运用 canny 算子的方法。首先,是对边缘的检测主要以导数来计算,但是受到了噪声影响。然而,该滤波器在减少了噪声的作用下,也造成了边缘强度的损耗。其次,增强算法把对邻域的点的度有明显改变的地方以及点凸显性地展现了。一般可以靠计算机梯度的幅值来实现。再次,但是在有些图象中,梯度幅值比较大的地方并非边缘的节点。最简单的对边缘性检测就是梯度幅值阈值的判断。最后,精确地选择了边缘处的位置。

我也希望在今后的将来有更多的人去探导、研究一个边缘检测算子,为使我们能够看到更好的影片效果而努力,为了促进全人类的生活和发展而努力。图像是自古以来人类识别和交流信息的一个主要资料来源,因此,图像处理的应用领域已经涵盖到了人类日常生活、工作等诸多领域。随着现代科学技术的发展和进步,图像的应用领域也在不断拓宽。所以对于边缘性的检测也是需要继续进步。我看到将来,边缘检测技术已经广泛地应用于人们日常生活的各个领域,在当今世界人类的日常生活中,文化艺术、军事技术、生物医疗技术、工业生产和信息工程技术、航天与空间技术等等重要的领域都占有着不可或缺的一部分。同全人类的生活走向风流。

参考文献

[1] 章毓晋.图像处理和分析[M].北京:清华大学出版社,1999

[2] 章国宝.叶桦.陈维南.基于正交小波变换的多尺度边缘提取[J].中国图像图形报,1998(3)

[3] 陈武凡..彩色图像边缘检测新算法−广义模糊算子法[J].中国科学A辑,1995(2)

[4] 唐立军.段立娟.高文.基于内容的图像检索系统[J].计算机应用研究,2001,18(7):41-45

[5] 冯所前.文档内容图像检索[D].北京大学信息科学技术学院智能科学系硕士学位论文,2005

[6] 谢毓湘.吴玲达.栾悉道.基于内容的图像检索技术研究[J].计算机工程与应用,2002(1):35-38

[7] 宋涛.刘刚.一种基于内容的文档图像检索方法.《郑州大学报》,2010年1月

[8] 郭小娟.基于内容的图像检索技术的研究[D].西安:西北大学,2007

[9] 徐建华.图像处理与分析[M ].北京:科学出版社,1992

[10] 贾元元.基于形状的图像数据库检索技术研究[学位论文] 2004

[11] Ang Y H.Image Retrieval Based on Multidimensional Feature Properties 1995

[12] 赖志国.余啸海.Matlab 图像处理与应用[M].北京:国防工业出版社,2004

基于女性用户的交互界面设计研究 篇6

关键词:界面设计;女性用户

1 项目背景

1.1 国内研究现状

自从第一部智能手机摩托罗拉天拓A6188问世,到如今已经之其余的驱动硬件:处理器、内存、缓存、图像处理器、声卡的普及与硬件的革新从而进入公众的视野中。[1]智能手机的诞生使得手机除了最基本的通话、通信功能以外的第三方应用程序得以体现,用户可以在智能手机上下载第三方appstore提供的应用程序。

随着技术的革新应用程序研发技术的改进,交互性的提升,界面设计风格的多样化,App已经不再仅仅是男性用户独占。百度数据显示,与2013年初相比,中国女性用户在移动端上的增长率最高,其中移动购物增长率最高达到了3倍多。[2]而与男性相比,对于移动互联网的依赖性,女性用户特点更为鲜明,其发展势头也最为迅猛。女性应用程序还在发展初期,目前国内GDP虽然已经仅次于美国,但由于人均GDP较低,且女性的健康意识、炫耀意识、交流意识也没有被深度激发,所以目前国内女性应用的热度远不及美国,但这也说明了女性App的未来前景巨大。

1.2 国外研究现状

界面设计的概念首先是在欧美国家提出来的,有充裕的经济条件和高端的研究机构来针对用户体验界面设计,有一套适合本国互联网行业的交互设计系统理论和实践经验, 他们的作品是艺术与技术的结合,重视用户的完整体验,时刻以普通用户的使用习惯与理解角度为构建交互界面,提出了许多有建树的设计理念和方法,同时将很多交叉性学科的知识应用于交互界面设计研究,如格式塔视知觉理论、人机工程学理论、现代设计学理论等,可以在交互界面设计领域中,已经走在了这方面研究前段。[3]

2 女性用户使用APP分析

根据来自AppAnnie的数据,图片、视频处理APP在AppStore总榜的下载排名一直位居高位,这也正符合了女性爱炫耀的心理;导购类App下载排名也较高,2014年第2季度,同比增长256%,这其中很大一部分都是女性用户;而工具类App的排名则相对较为平稳,这主要是由于工具类App的打开率相比而言不算很高,且用户使用的时间也较为有限。

尽管女性应用的发展不及美国,但是从近两年App市场情况来看,针对女性用户的应用程序已经经过几轮更新换代,其导航设计、交互路径、界面风格、功能运用已悄然改进。细看目前较为热门的女性App,并没有做大而全的平台类的App,都是在细分领域进行深耕,由于女性用户爱炫耀、爱分享、爱交流、爱购物,因此社區类和工具类的应用都有了较大的潜力。

目前女性应用主要分为以下几类:经期应用:大姨吗、美柚、女性日历;导购应用:美丽说、蘑菇街;图片、视频处理:美图秀秀、美拍、百度魔图、Camera360;女性社交:薇密、辣妈帮;母婴:快乐孕期、孕期提醒;美妆社区:美啦美妆、美妆心得;美甲:秀美甲、河狸家;美发:美美豆、时尚猫、波波网;整形:新氧整形、整吧等。综上所述,各个细分领域的应用未来都有着较大的发展前景,总体而言满足女性用户炫耀心理、细分女性用户细节需求、了解女性用户操作习惯是界面交互设计不断前进的前提。

3 基于女性用户需求的界面设计原理

3.1 捕捉女性用户细节感知

人类综合科学大学的名誉教授新井康允说:“一般说来,男性在空间认知能力方面强些,而女性语言、及辨识细微差异方面的能力强些。”同时东京理科大学的原菊教授也表示:“有关知觉的大脑皮质,相比而言,女性的要厚些。”[4]女性在语言系统上的天赋异禀使得她们在使用移动应用时会受到信息的影响。比如该项应用到底能为我带来何等的用处,它都能为我带来什么帮助等等信息。而这一心理特性也使得女性更倾向于功能型的App。第二个心理特征是注重细节。以美丽说App为例,在进入界面会根据用户登录时间段在欢迎界面上以淡粉色字体显示“上午好/下午好/晚上好,欢迎回来美丽说”。这微小的细节让女性用户觉得这是一个贴心温馨的app,会让女性用户感受到被关注及呵护,女性用户会乐于使用这个应用程序。

3.2 独具新意的ICON命名

根据苹果官方统计,截止到2013年6月,仅AppStore的应用程序数目就有90多万。想要令用户在数量如此之多、竞争力如此之大移动应用市场下载,那一定要给予用户一个难忘的第一印象。在移动应用中它具体体现在应用名字与ICON设计。

当我们谈及产品设计及其可用性时,往往首先关注视觉元素而会忽略文字。这可真是遗憾,因为文字是用户与应用程序或网站交互的一个主要渠道。[5]因此拥有一款绝妙的应用名字绝对是最能吸引用户下载的途径。“大姨吗”是一款以经期健康为核心,关爱女性健康的手机应用。它的名字即根据现代专指女性来生理周期时的流行俗语“大姨妈”而来。

3.3 用户定位细分成为趋势

女性用户较男性用户有一个明显的特质她们有较多特定需求,例如女性特别爱美,无论美容、美发、美甲、美颜,因而会有美发、整容、美甲、美妆类App出现,同时图片处理类App也是为满足女性爱美可以上传美照到网络上应运而生;女性用户异于男性用户还在于她们有生理周期,在当下竞争激烈的社会环境下,很少有人会特别关照女性生理周期,但是“大姨吗”这款App的出现会贴心的呵护女性用户,帮助女性用户关心自己、解决生理期遇到的问题;同时女性用户在家庭中还会扮演准妈妈、新妈妈、母亲的角色,因而“快乐孕期”帮助准妈妈们快乐的度过十月怀胎,“宝宝树”、“亲宝宝”等App帮助措手不及的新妈妈们解决产后如何育儿的困惑。这种针对女性用户不同阶段、不同方面需求的细分恰巧迎合了有较多特定需求的女性用户。

3.4 界面颜色搭配

在360手机助手中根据“TOP女人”周人气排名前八的App图标选色上,6个APP图标采用粉色,一个橙色,一个湖蓝色。而进入交互界面,其中7个是白色和粉色搭配,一个是白色和橙色搭配。最值得关注的是,女生专区本身就采用了粉色界面设计,说明在界面颜色搭配上对于粉色的喜爱与忠臣度之高。

随着针对女性用户App的增多,过多的粉色图标会让女性用户产生视觉疲劳,因此在移动应用程序的后起大军对于颜色的选择开始发生变化,会采用粉色的邻近色——橙色、黃色、紫色、粉色偏紫(美拍)、橙色搭配黄色(美柚),同时又是借鉴了红柚的颜色,甚至有些像“阳光妇儿”带专业性的应用程序大胆采用湖蓝色来区分其App与其他App的不同。因此针对女性用户的界面设计颜色搭配可以运用粉色、橙色、黄色、紫色等明度、纯度较低色相相近的颜色。

3.5 界面分享需求

女性的一个心理特征是分享交流。美国心理学博士约翰·格雷(John Gray)曾在《男人来自火星,女人来自金星》书中写到:“女人重视爱、沟通、美与关系。花许多时间互相支持、帮助、教育。她们透过感觉和关系品质来诠释自(下转第页)(上接第页)己存在的意义;透过分享与建立关系来经历满足感。”因而女性常常更加擅长语言情感的表达、分享和社交八卦。所以女性在使用移动应用时会希望分享交流,比如很多女性会将购买的产品分享到新浪微博、微信、朋友圈等社交软件中,从而得到共鸣甚至是他人的赞赏。

3.6 界面中动态图像的合理使用

女性用户不仅仅是App的忠实粉丝,而且是推动消费的原动力。以“美丽说”App为例在“正在流行”板块中会有动态图形滚动出现:“刚买了皇冠卡通熊图案两色T恤”或“刚买了早春款韩版铅笔裤”提示语,设计师在界面设计时抓住了女性用户喜欢比较、参照她人的心里,让小小动态滚动条在不经意间出现,界面中动态图形的合理运用以动止静,动静结合,也让女性用户在浏览页面的间隙可以了解到她人的购物情况,从而产生购买的欲望。

3.7 易用性和简洁化

如果界面设计的较为复杂,那对于女性用户而言在操作上会产生不便,因此易用性就显得尤为重要。同时随着界面扁平化的流行,界面布局过于饱满、内容繁多,女性用户在浏览信息时会产生厌倦感,因此界面设计时另外一个原则是布局趋向简洁化。分类清晰、层级鲜明、操作流畅的界面设计原则更符合女性用户的心理需求。

4 总结

随着数字技术的迅猛发展,智能手机被大众所接受并有较高粘度的使用,以及在市场化引导下的用户细分,使得App应用的受众更明确和细致。本文基于对时下热门App的分析与研究,针对女性用户的特点分析研究在界面设计时对icon命名的技巧,以及界面设计中色彩搭配的运用;长时间浏览页面对于女性用户会产生疲惫感,这时动态图形实时发挥事半功倍的作用;女性用爱分享、爱交流的特质使得界面设计中“分享”功能变得异常重要;同时,女性用户的逻辑思维弱于男性,因此在界面框架的层次、流程上相对清晰、明朗。要设计出达到女性用户满意的界面,需从女性用户的需求为出发,从而真正地实现自然化界面设计。

参考文献:

[1] 宿子顺,殷俊.以女性用户为主导的信息产品界面设计策略[J].大众文艺,2013(16).

[2] 网易:2014年中国移动互联网女性App行业报告[DB/OL] . 网易科技,http://info.hhczy.com/article/20140816/22789.

shtml.

[3] 李琛.移动互联网时代购物App交互界面设计研究[D].河南大学,2014.

[4] 刘丰源,严晨.女性用户移动应用中的交互设计研究[J].吉林艺术学院学报,2014(5).

基于用户特征的研究 篇7

伴随着互联网诞生的电子商务正以一种不可抵挡的势头在全世界范围迅速普及和发展,在这种背景下面,移动电子商务应运而生。移动电子商务是电子商务的一种延伸形式,本质上是电子商务技术的一种革新,基于移动无线网络,依托移动通信设备,使人们能不受时间和空间限制进行商务活动,它是电子商务的一种新形式。

据艾瑞咨询最新统计数据显示,截止2011年第一季度,移动电子商务市场规模达到13.9亿元,同比增长358.7%,其增长的幅度在移动互联网的各大细分市场中遥遥领先。中国互联网数据中心预测,中国使用手机上网的网民数量将在2013年超过使用电脑上网的网民数量,其中3G用户数已经达到6 700万户。如何在移动电子商务中抢占先机,挖掘潜在客户,实现精准营销成为发展移动电子商务业务企业的头等大事。

2 理论背景

2.1 移动电子商务

电子商务发展至今主要经过了三个阶段:第一个阶段是20世纪60年代到20世纪90年代,这一阶段电子商务主要是基于电子数据交换,是以纸质文件交换后的一种商务形式的革命;第二个阶段是20世纪的中后期,由于Internet互联网的出现,使电子商务进入了一个崭新的时代,这一阶段电子商务发展成为依托Internet互联网而进行的商务活动;第三个阶段则是现代基于移动互联网的电子商务。张亚鹏、刘海鸥等人认为,移动电子商务是传统电子商务与移动通讯设备、无线网络技术相结合而形成的一个全新的电子商务体系,这种商务体系是以移动通讯设备作为核心开展的[1]。Hameed、Khawa等人在总结前人文献对移动电子商务概念的概述后,同样认为移动电子商务是以移动设备为核心的一种电子商务新形式,他们认为移动电子商务的主要落脚点在移动,移动电子商务以移动和传统电子商务区分开来,应该以移动设备为核心[2]。

根据交易对象的不同,移动电子商务主要可以分为消费者对消费者(C2C)、个人对个人(P2P)、商家对消费者(B2C)、商家对商家(B2B)等几类[3]。Yonghee、Shin等人从不同的角度对移动电子商务的定义进行了界定,他们认为移动电子商务是指一种能力,这种能力包括支持用户能在任何时间、任何地方使用移动无线网络来购买商品[4]。中国通信网对移动电子商务给出的定义是,移动电子商务是指利用移动终端,通过移动通信网络进行数据传输开展各种商业经营活动的一种新型电子商务模式。

2.2 数据挖掘

数据挖掘,就是分析数据,使用自动化或半自动化的工具来挖掘隐含的模式的过程,是从数据中发掘信息或知识的过程,目的从已有的数据中提取模式,提高已有数据的内在价值,并且把数据提炼并转化成为知识。目前,数据挖掘已经应用到许多领域,例如营销、财务、通信等。

2.3 客户细分相关理论

客户细分就是指根据不同客户的属性来划分的客户集合[5]。当前学术界、企业界比较普遍接受的是基于客户价值的细分理论,它不仅包括客户为企业贡献的历史利润,同时它又包括将来利润,即客户在将来可能为企业带来的利润总和。基于客户价值的细分理论选择“客户当前价值”和“客户潜在价值”两个维度对客户进行评价。“客户当前价值”是指到目前为止客户为企业贡献的价值总和;“客户潜在价值”是指客户未来可能为企业带来的利润价值的总和。每个维度又分高低两个档次,从而形成一个二维的矩阵,将用户群体分为四组,价值客户(Ⅳ)、次价值客户(Ⅲ)、潜在价值客户(Ⅱ)和低价值客户(Ⅰ)。

企业在推广的过程当中针对不同的客户应当有不同的办法,投入的资源也是不一样的。很显然价值客户(Ⅳ)相对企业来说是最有价值的,被称之为企业的玉质客户;然后是次价值客户(Ⅲ),被称之为企业的金质客户,他们属于帕累托“二八定律”中20%的客户,虽然数量不多,却为企业贡献了大部分的利润;其它的低价值客户(Ⅰ)对企业的价值最小,称为铅质用户,另一类是潜在价值客户(Ⅱ)。这两类用户虽然数量比较多,但是为企业创造的利润却比较小。值得我们关注的一点是潜在价值客户(Ⅱ)通过客户关系再造,在将来有可能转化成为价值客户(Ⅳ)。从长远来看,潜在价值客户(Ⅱ)是企业的一笔隐形财产,是企业长期利润来源的基础。本文将利用数据挖掘的方法分别挖掘价值用户(Ⅳ)、次价值用户(Ⅲ)和潜在价值用户(Ⅱ)的特征。

3 研究设计

3.1 问卷设计

本文研究的重点是移动电子商务用户群体特征,重点包括价值用户(Ⅳ)特征、次价值用户(Ⅲ)特征以及潜在价值用户特征(Ⅱ)或者说移动电子商务的潜在用户特征,对移动电子商务用户的认知度、用户的需求度和用户的使用意愿进行综合分析。问卷主要包括三个方面的内容:第一部分是前言部分,主要向被调查者简单介绍移动电子商务的基本概念和本次调查的背景;第二部分主要调查被调查对象的基本信息,包括性别、年龄、学历、感情状况、性格、职业、行业、所在单位的性质、现生活所在地、月收入、是否有上网购物的经历、手机是否是智能手机、每周使用手机上网的时长等;第三部分是问卷的主体部分,是对用户对移动电子商务认知、需求、使用度和使用意愿的指标设计。

3.2 调查方式

从理论的角度来说,所有有可能使用移动终端的人群都是本文的调查对象,但本次调查对没有使用过电脑上网的用户群(共20人)做了一个针对性调查,发现没有使用过电脑上网的被调查者中仅有2人使用过手机上网。研究受人力物力资源所限,于是有一个基本的前提假设就是使用移动电子商务的人群一般都使用电脑上网,所以在本文中调查问卷的受众主要是电脑上网的人群。网上访问采取随机抽样的方式,一方面利用大众聊天软件,通过留言和电子邮件的方式邀请其填写问卷,另一方面在大众论坛发放问卷邀请网民填写问卷,问卷投放使用的是问卷星平台,更加方便受访者填写。

3.3 数据统计

本次问卷调查成功收回有效样本共1 748份,下面将对原始数据简单进行统计分析。

性别结构:本次调查中男性被调查者共1 016名,占样本比例58.12%,与中国互联网络信息中心2012年1月公布的《中国互联网络发展状况统计报告》的数据中男性网民的比例55.9%基本相符。年龄结构:网民主要以年轻群体为主,80后占据过半为53.5%,其次是70后和90后,分别占18.5%和20%,70前的最少,只占总体样本的8%。学历结构:此次调查中学历以本科/大专为主,占全部样本的62.4%,高中/中专/技校文凭占全部样本的20%,硕士及以上占10.1%,初中及以下占7.5%。职业结构:学生与企业一般职工占此次调查的大部分,一般职工的白领占比为25.9%,其次是学生,占比为20.1%,一般职工中蓝领的占比为16.9%。地理位置分布结构:被调查者主要来自城市,46%的被调查者来自大城市,45%的被调查者来自中小城市,仅9%的被调查者来自乡镇及农村地区,这一方面与农村互联网接入条件有关,另一方面农村居民自身缺乏电脑和网络使用技能[6]。智能手机比例:此次调查中使用智能手机的用户达60.8%,移动电子商务的发展潜力无限。收入结构:月收入或每月可用于支配的零用钱1 000元到3 500元的群体占到了46.6%,月收入8 000元以上的占9.7%,共170人。

4 数据挖掘及结果

4.1 数据挖掘的算法选择

本文使用Clementine数据挖掘软件,应用C5.0算法对预处理后的数据进行挖掘分析。

4.2 用户数据分析

4.2.1 移动电子商务用户认知度分析

根据调查问卷的问题“您知道移动电子商务吗?”得到对移动电子商务用户认知的情况统计,非常了解的占20.7%,了解的占30.3%,听说过但不了解具体功能和使用方法的占40.7%,从未听说过的占8.4%。大部分的人只听说过移动电子商务,但是并不知道具体功能和使用方法,甚至有小部分网民从未听说过移动电子商务。

对调查问卷的问题“您是从什么途径知道移动电子商务的?”,绝大多数的用户回答是通过网络宣传获知移动电子商务的,占40.3%;通过传统纸质报刊杂志获知移动电子商务的用户仅有72人会去使用移动电子商务;通过纸媒获知移动电子商务的用户使用移动电子商务的可能性仅0.3左右。说明通过纸质媒体推广移动电子商务相比网络宣传和口碑营销并不是行之有效的方法。

4.2.2 移动电子商务用户需求度分析

用户需求就是产品或服务的使用者对使用产品或服务的一种需求或者期望。根据问题“如果你使用过移动电子商务,您感觉自己需不需要这个业务?如果没有使用过,你觉得这个业务对你有用吗?”得到数据可知认为需要、非常需要,觉得移动电子商务很有用和有用的用户占40.8%;说不清自己是否需要移动电子商务或者说移动电子商务到底有没有用,比例占到56.9%;认为现在和将来都不需要移动电子商务,完全没有这方面需求的只占有3.3%。

4.2.3 移动电子商务用户使用意愿分析

使用意愿是指消费者使用或者购买某种产品或者服务的欲望的一种心理活动。根据问题“假设您所关心的因素都能满足,未来一年您会使用/继续使用移动电子商务?”得到的数据发现,当用户关心的因素得到满足的情况下,未来一年内肯定会和可能会使用移动电子商务的用户占比76.4%,表示肯定不会使用移动电子商务的用户仅占比1.9%。说明用户对使用移动电子商务的意愿还是比较强烈的,移动电子商务发展大有前景。

对问卷调查问题“没有使用移动电子商务的原因?”,对不使用移动电子商务的原因进行统计分析得到的数据发现,用户不使用移动电子商务最大的原因是习惯在电脑上网购,其次是出于安全性的考虑,排在第三的是不知道如何使用。

4.2.4 移动电子商务用户特征分析

(1) 现有用户分析。

经过预处理的数据集一共有1 748个有效样本,我们选择其中800个样本出来作为数据挖掘的训练数据集,用于构建决策树模型,剩下的948个样本作为测试数据集,用生成的决策树模型进行分类预测,以评估决策树模型的性能。

一共得到26条规则,用于偶尔使用手机购物的有5条,用于没有使用过手机购物的有13条,用于经常使用手机购物的有6条。我们主要研究经常和偶尔使用手机购物人群的规则特点。

续上表

把数据集中除去800个训练样本之外的948个样本取出,作为测试样本,对预测结果进行分析, 有83.23%的测试样本(789个)的预测值和实际值相符,16.77%的测试样本(159个)的预测值与实际值不符。在159个预测错误的样本中,实际值为“偶尔”但被预测为“没有”的有50个,实际值为“偶尔”被预测为经常的有4个,实际值为“没有”被预测为偶尔的有65个,实际值为“没有”被预测为“经常”的有11个,实际值为“经常”的被预测为“偶尔”的有18个,实际值为“经常”的被预测为“没有”的有11个。

(2) 认知低使用意愿高用户分析。

认知低使用意愿高的用户是企业的潜在价值用户(Ⅱ),虽然这些用户的当前价值不高,但是他们的潜在价值比较高,通过一定的客户关系转化,他们将来有可能转化成为企业的价值客户(Ⅳ),是企业长期利润的重要来源基础。通过题目14“你知道移动电子商务吗?”和题目19“假设您所关心的因素都能满足,未来一年您会使用/继续使用移动电子商务?”,筛选分类出认知低但是使用意愿高和其他两类,分析认知低但使用意愿高的用户群体特征,发现对这些用户进行电子商务精准营销能达到事半功倍的效果。

移动电子商务认知低而使用意愿高的用户特征是:1)年龄为80后,使用非智能手机、性格外向的学生;2)年龄为70后,生活在大城市、使用非智能手机、收入中等偏上的教师;3)偶尔使用手机上网、收入中等偏上但是没有网购经历的白领;4)收入在8 000元以上、经常使用上网的非智能手机用户;5)收入中等偏上、使用非智能手机的蓝领;6)年龄为70后和80后,收入中等、性格内向、使用非智能手机的用户。以此可以看出,下一阶段营销和推广的重点应该针对使用非智能手机的人群,提高移动电子商务在非智能手机用户的认知。

5 结论与建议

本文将数据挖掘技术应用到移动电子商务用户群体特征分析,移动电子商务企业利用该成果可以更有针对性地进行营销与推广,迅速定位潜在客户,提高用户体验,挖掘客户价值。本文的研究给企业进行产品的精确营销与推广提供了一个有益的借鉴。

(1)突出移动电子商务独特优势,增强用户粘性。

通过调查问卷发现,很多人没有使用移动电子商务的原因是习惯在电脑上网购。相比传统电子商务,现在智能手机可以迅速定位用户位置,移动电子商务厂商在发展业务的时候应当更加注重结合这方面的潜能,而不是一味地移植传统电子商务。移动电子商务与LBS(基于位置的服务)的完美结合,能给移动电子商务厂商在发展移动电子商务业务时带来无法比拟的优势,提供一种全新的服务。另外应多和已经成熟的移动网络平台如手机论坛、微博、社交网络和点评类网站入手,更好地吸引用户,增强用户粘性。

(2)增强移动电子商务支付安全性,消除用户安全顾虑。

通过问卷调查我们发现,用户没有使用移动电子商务的另外一个重要原因就是用户对安全性的担忧。由于无线网络的独特特点,无线电波在发送的过程当中更容易被黑客所截获,从而安全性也成为了移动电子商务发展的一个重要壁垒。增强安全性的同时,移动电子商务厂商在发展移动电子商务业务的同时加强安全推广,鼓励用户使用移动支付,并加大支付后续服务,让用户了解移动支付安全性并没有传言中那样低;提供类似网银快捷支付中的48小时无条件取消交易的服务能较好地打消顾客在安全方面的顾虑。

(3)进一步挖掘男性用户市场,努力开拓女性市场。

男性用户是当前移动电子商务的主力,但是从长远的角度来说女性市场不容忽视,毕竟女性是购物的主力军,是移动电子商务发展的巨大潜力用户。要加大在女性群体当中的宣传力度,从女性对购物的态度出发,让她们觉得使用移动电子商务是休闲娱乐方式的一种,是购物的一种潮流时尚。另外,移动电子商务厂商在发展移动电子商务业务的时候应当针对女性用户提供个性化的服务,从女性用品入手,或者对女性提供更多的优惠折扣;已有的电商网站也可以根据女性的贪廉心理,提供只针对移动电子商务的优惠,从而吸引女性用户使用移动电子商务业务。

摘要:相比传统电子商务,移动电子商务在位置相关性、个性化和随时随地访问性等方面有无法比拟的优势。在总结国内外移动电子商务研究现状和发展趋势的基础上,通过网络问卷收集数据集,利用数据挖掘方法研究移动电子商务用户群体特征,对1 748份有效问卷进行挖掘分析,得出一些已使用移动电子商务用户的特征以及认知低而使用意愿比较高的用户特征,为发展移动电子商务业务的企业实现精准营销提供借鉴。

关键词:移动电子商务,数据挖掘,决策树,精准营销

参考文献

[1]张亚明,刘海鸥.移动电子商务产业应用模式创新研究[J].企业经济,2011(9):59-62

[2]K HAMEED,K AHSAN,W YANG.Mobile commerce and applica-tions:An exploratory study and review[J].CoRR,2010(abs/1004):4469

[3]廖卫红.移动电子商务互动营销模式应用研究[J].中国流通经济,2012(1):85-89

[4]S YONGHEE,J HYORI,C MUNKEE.Analysis of the consumerpreferences toward M-commerce applications based on an empiricalstudy[C].Korea,2006

[5]菲利普科特勒,苏宇,贾宇娜.新千年市场营销发展趋势[J].销售与市场,2001(1):5-8

基于用户特征的研究 篇8

随着信息技术的不断发展,计算机的系统安全越来越受到人们的关注,进行用户身份认也成为保护系统安全的一个重要手段。而传统的密码认证已经远远不能达到安全要求,因此基于生物特征的识别认证方法得到了广泛应用,例如指纹识别、虹膜识别、人脸识别等,但上述几种识别方法在应用过程中需要硬件设备的支持,并且成本较高,不利于推广。20世纪80年代,Gaines等人首先提出了击键特征用于用户身份认证[1],随后出现了大量研究成果,如使用统计分析理论、模糊数学、人工神经网络等方法进行实现。其中统计分析理论是在假设样本为正态分布的前提下,将测试样本与训练样本进行比较,不过目前尚不清楚击键特征是否符合正态分布,模糊数学方法的精确度不高,而人工神经网络虽然效果比较好,但是实现难度较高并且训练时间比较长。

在此提出将聚类分析的方法用于击键特征识别,采用谱系聚类法对提取的用户击键特征进行分类,相比于前面提到的几种识别算法而言,谱系聚类法在实现时比较容易,并且其识别准确度达到了一定的要求,比较适合用于击键识别。

2 击键特征

用户击键特征体现为击键延迟时间和击键间隔时间[1],不同人的这两种击键特征的不同性已经得到证实,所以在进行识别时既可以以其中之一为主要对象,也可以使用二者结合,在此主要针对击键间隔时间进行识别。

简单介绍一下用户击键特征的提取过程。用户在击键时,键盘会向系统发送击键消息,每按下一个键,便会有两个消息产生:一个是按下键的消息,一个是弹起键的消息。通过设置键盘钩,可以捕获键盘消息。在键盘钩函数中,可以对这消息进行识别需要的处理。在该函数中,通过测时函数对两个消息之间的间隔进行测量,从而得到一组击键序列之间的时间间隔向量,即用户击键特征矢量。

3 击键特征识别算法

3.1 类及类间距离测度方法

在研究聚类算法之前,要了解类的定义,这里将模式的特征矢量作为集合中的元素,并且以距离作为模式间的相似性测度。定义如下:

若集合S中任一元素xi、xj的距离dij有

式中,h为给定的阈值,则称S相对于阈值h组成一类。

距离测度的种类比较多,常用的有欧氏距离、绝对值距离、明氏距离、马氏距离等,这里使用的是最常用的欧氏距离,其计算方法如下:

设x=(x1,x2,...,xn),y=(y1,y2,...,yn)T。向量x,y欧氏距离为:

识别算法除了类及所用的相似性测度之外,还要用到类间距,类间距离的定义式有很多,下面主要介绍两种距离的定义。

(1)最近距离法

两个聚类ωk和ωl之间的最近距离定义为

式中,dij表示xi∈ωk与xj∈ωl之间的距离。

(2)最远距离法

两个聚类ωk和ωl之间的最远距离定义为

式中,dij表示xi∈ωk与xj∈ωl之间的距离。

3.2 谱系聚类法

谱系聚类法又称系统聚类法、层次聚类法,是效果较好、经常使用的方法之一,国内外研究得较为深入,有不少成果[2]。其基本思想为:首先定义类与类之间的距离,这里采用的是最近距离,再有类与类之间最短距离的递推公式,其中ωr为由ωp和ωq合并所得。

在此基础上,先将n个变量视为n个类,计算两两之间的距离,然后找到距离最小的两个变量,将其合为一类,再找到与此类距离最小的变量加入该类,最后得到所有变量间的谱系关系。

具体的算法步骤为:

(1)初始分类。令k=0,每个模式自成一体。

(2)计算各类间的距离,从而生成一个对称的距离矩阵。

(3)找出步骤(2)中距离矩阵中的最小元素,将其对应的两个类合并成一类,产生新的聚类。

(4)检查类的个数,如果大于2转至步骤(2);否则,停止。

对于给定的N个n维模式,要分成c类,在采用最近距离或最远距离的情况下的计算复杂度为O(cN2n2)。

在实现击键识别过程中,可以采用最近距离、最远距离或者平均距离中任意一种,但每种距离的适用范围不同,需根据具体要求进行选择。

3.3 识别方法

在完成数据的采集之后,要对采集到的用户击键特征矢量进行聚类分析,按上述谱系聚类法完成聚类后,可以得到一个类似图1的谱系关系图。根据图1中所示各矢量关系可以清楚地看到,矢量x6距离类的中心最远,因此在进行识别时类似于x6的这种待检测矢量就可以被拒绝。

在完成采样、聚类、识别之后,即结束整个用户击键特征识别。

4 测试

4.1 测试数据采集

本次测试数据采集在Microsoft Visual Studio 2008环境使用C++语言编程实现,获得的击键时间间隔精度为毫秒(ms)。共设置口令4个,长度分别为6、8、10和12。采集合法用户击键特征样本20个,合法待测样本和非法待测样本各50个。

4.2 测试结果

测试结果如表1所示。

从表1中数据及文献[3]可以看出,尽管使用谱系聚类法对用户击键特征的识别准确度不如神经网络等方法,但是其实现难度较小,花费较多资源,因此还是用一定应用价值的。

5 结语

提出使用统计学中常用的谱系聚类法对用户击键特征进行分析识别,从测试结果中可以看出该方法达到了较好的效果。虽然无法达到人工神经网络等方法的识别精度,但是该方法比较容易实现,并且可以满足一定的安全要求,具有一定的使用价值。

摘要:以用户击键特征为依据,提出了一种基于谱系聚类法的识别算法。该算法通过谱系聚类法对用户击键特征向量进行聚类分析,并形成各向量之间的谱系关系,从而由谱系关系来对击键特征向量进行识别。该算法的主要特点是使用欧氏距离进行分类,算法实现简单并且识别速度快。由于采用的聚类算法的简单性,其识别精度尚有待提高,因此该算法适用于击键识别的简单应用。

关键词:谱系聚类法,击键特征,身份认证

参考文献

[1]Gaines R,Lisowski W,Press S.Authentication by Keystroke Timing:Some Preliminary Results[R].Rand Corporation:Rand Report R-2560-NSF,1980.

[2]孙即祥.现代模式识别[M].北京:高等教育出版社,2008.

用户行为特征库的构建方法研究 篇9

建立用户行为特征库的前提是搞清楚用户行为的特征。以下将从两个方面对用户行为特征进行定义。

(一)网络应用特征。

用户的网络行为通过使用不同的网络应用得以体现的。稳定的网络环境中,不同网络协议通常对应着不同的网络应用。网络协议都有其各自的特征,即“指纹”。因此,可以将原始数据包中负载部分的这些指纹特征提取出来,记录并建立应用特征库,用特征库中的这些应用特征与网络中的流量进行模式匹配,以达到识别用户的网络应用,反映用户网络行为的目的。应用特征的形式:一是特征字符串;二是正则表达式;三是流特征序列。通过对特征库的更新和维护,可以不断向特征库中添加新的特征,以完备网络应用的识别。

(二)访问域名特征。

DNS(域名系统)是一种分布式网络目录服务,主要用来把域名转换为IP网络地址。DNS请求是衡量用户网络行为的一个重要特征,通过对DNS数据的挖掘,能够深入地发掘用户典型的web访问行为。采集DNS数据的方法一般有两种:一种是从网络流量中过滤提取DNS查询请求,另外一种方法则是解析在DNS服务器上的日志记录。第一种方式的针对性不强,因为要实时捕获所有用户的流量,而只从这些流量中筛选出DNS查询请求,这样开销太大。第二种方式的优势就是针对性强,所有用户的DNS查询直接从记录日志解析即可。其可行性依赖于DNS查询原理。

二、用户行为特征提取方法

以下将详解介绍这建立特征库所依赖的相关技术和原理。

(一)特征签名技术。

特征签名是指能够将一类应用和其他应用分开的属性。它可以是协议交互过程中的特征字符串或者是序列流特征。

1.字符串特征。

特征字符串特征的提取主要用到了DPI技术。DPI 全称为“Deep Packet Inspection”,即“深度包检测”。 DPI 不仅要进行层次分析,还增加了应用层分析,即需要从协议的应用层中提取该协议特有的出现频率较高的特征字符串或者特征模式作为特征,用以识别该应用。

2.流序列特征。

对于使用未加密协议的网络应用,通过字符特征的方法可以非常有效的识别,但是对于使用加密协议的应用,字符特征就显得束手无策了。针对应用协议加密的情况,可以使用基于网络流序列特征的方法进行识别。

Signature={±p1,±p2,…,±pN} (2-1)

该式中,“±”号表示数据包方向的正负,从源IP到目的IP的方向规定为正方向,反之为负。pi表示第i个数据包的有效负载长度,可以排除TCP包头的可选项以及附加在尾部的填充信息所造成的影响。

(二)域名特征提取。

对于用户访问域名的特征提取,本文采用的是主动爬取常用导航页面与被动解析日志相结合的方式来建立用户访问域名的特征库。

1.主动获取。

一些常用的导航页面比如hao123等,及时收录了网络音乐、网络视频等热门分类的优秀服务站点,这些热门的优秀站点是对整体网络用户的宏观规律的总结,因此,本文通过爬虫程序从这些导航页面中获取服务分类、服务名称和域名来建立域名特征库。

2.日志解析。

热门导航页面反映的是网络整体用户的宏观规律,对于某个局部范围内的用户,其网络用户行为还具有局部性的特点。这些网络行为是热门导航页面没有包含的。为了弥补主动爬取方法的局限,本文还通过解析局域网内首选DNS服务器日志的方法,将用户访问数量最多的1000个域名加入域名特征库。

三、结语

利用原始数据报、DNS请求记录和NetFlow数据流的特征,分析用户行为特征,通过特征签名技术和域名特征提取技术建立了用户行为特征库,为后续研究用户行为奠定了基础,同时也为研究准确高效的网络管理软件提供了便利。

摘要:随着互联网的高速发展,用户规模不断扩大,新的应用日益倍增,这使得用户的网络行为日趋复杂。面对纷繁复杂的网络用户行为,如何提取客观参数来衡量用户的网络行为是当前研究的一个热点。从研究用户如何使用网络和用户访问网络的客观规律两个方面的需求出发,本文从原始数据包、DNS请求记录和Netflow流三方面入手,提取相关网络客观参数构建用户行为特征库,为后续用户网络行为奠定基础。

基于用户特征的研究 篇10

关键词:组推荐,推荐系统,用户特征,用户兴趣,偏好融合

0 引言

随着互联网的飞速发展,海量信息仅依靠搜索引擎很难准确获得满足用户需求和个性化偏好的信息资源,信息过载问题日益突出[1],推荐系统正逐渐成为解决信息过载的主要发展方向[2]。推荐系统可以根据用户的个体信息需求,为其提供个性化信息推荐,在海量信息空间中,以个性化的方式引导用户获得有用的信息对象[3]。目前,推荐系统在电子商务(如Amazon、eBay、Netflix、阿里巴巴、豆瓣网、当当网等)、信息检索(Google、MyYahoo、GroupLens、百度等)以及移动应用、电子旅游、互联网广告等众多领域取得了较大进展[4]。然而,现有的推荐系统都是针对单个用户设计的,只能为单个用户提供相应推荐。但在实际生活中,有许许多多用户组成的群组参与活动,此时进行推荐则需考虑群组中所有用户的偏好。这种为考虑每个用户偏好的推荐系统被称为组推荐系统,它将推荐对象由单个用户扩展为一个群组[5]。

组推荐系统研究受到越来越多的关注,其中涉及数据挖掘、机器学习、统计学、管理学、社会心理学等领域,具有重要的研究意义和实用价值[6]。2011年ACM推荐系统大会举办了上下文感知电影挑战赛,主题是为家庭群组推荐电影[7]。研究人员提出了一些组推荐系统的相关算法,如Boratto[9,10]等人利用社区发现技术,根据用户相似度对用户进行划分,从而形成群组,还利用K-means算法,直接对用户项目评分矩阵进行聚类,得出用户群组。Intrigue[11]则通过提取旅游景点的特征并结合人口统计学信息对群组进行划分,采用加权均值策略为每个群组分配不同的权重。

本文通过对组推荐系统相关技术与算法研究发现:(1)已有的组推荐系统主要是根据用户的相似度,使用聚类算法或社区发现算法进行群组发现,并没有考虑用户本身的一些属性;(2)已有的组推荐系统通常是与传统的协同过滤算法结合来预测用户的评分,但实际应用中发现,随着用户与推荐系统交互的增多,用户的信息需求或兴趣可能发生缓慢或剧烈的变化,不同历史评分对描述用户当前兴趣的能力存在较大差异,产生用户兴趣的概念漂移问题[12],造成推荐准确性下降。

本文提出了一种结合用户特征和用户兴趣变化的组推荐系统算法。主要从两个方面进行了创新:(1)通过对用户特征的分析,利用人口统计学信息,抽取出用户特征向量,使用聚类算法将具有相似特征的用户形成群组;(2)提出一种结合用户兴趣变化的协同过滤算法,并将其应用于组推荐系统中,提高组推荐系统的准确性。

1 组推荐系统算法

1.1 算法描述

结合用户特征和用户兴趣变化的组推荐系统算法由4部分工作组成。

(1)用户特征的预处理与向量化。算法中涉及到的用户特征主要为人口统计学数据,包含用户的性别、年龄、所在区域等信息。这些用户特征数据多为一些文本型数据,而用户特征数据需要作为算法的输入数据。为了在算法中使用这些数据,需要将用户特征数据进行一定的预处理,将其转化为算法能够识别的向量形式。

(2)群组发现。群组发现的主要目的是将已经向量化的用户特征数据作为输入,采用K-means聚类算法根据用户特征进行群组划分,将具有相似用户特征的用户划分到一个群组内,从而产生多个用户群组,算法将针对这些用户群组进行推荐。

(3)结合用户兴趣变化的协同过滤算法。与传统的协同过滤算法相比,结合用户兴趣变化的协同过滤算法采用了改进的欧氏距离方法来模拟用户的兴趣变化问题。在传统的基于欧氏距离方法计算相似度时加入了用户的评分时间,这里引入一个时间惩罚函数到欧氏距离的计算中。时间惩罚函数为单调递增函数,为惩罚系数,其公式如下:

将时间惩罚函数加入到相似度计算公式中,即可得到改进后的相似度计算公式:

其中,rui为用户u对物品i的评分,rvi为用户v对物品i的评分,tui为用户u对物品i评分的时间,tvi为用户v对物品i评分的时间。不同用户对相同物品的评分时间间隔越久,用户u与用户v的相似度就越低;反之,相似度越高,从而模拟了用户兴趣变化。

(4)群组评分预测。为了得到群组对某一项目的预测评分,算法涉及到群组中用户的偏好融合问题。在组推荐系统中,偏好融合是指根据群组成员的偏好提取群组偏好[8]。本文算法中的偏好融合方法采用评分融合方法。先通过用户兴趣变化的协同过滤算法对群组中用户的评分进行预测,从而得到群组内用户对该项目的评分。为了避免“痛苦问题”,算法选用了痛苦避免均值策略,将用户的评分融合,最终得到群组对该项目的预测评分。

痛苦避免均值策略公式如下:

其中rgi为群组g对项目i的预测评分,rui为用户u对物品i的预测评分,G为用户群组,为痛苦阈值。

1.2 算法过程

算法中需要涉及的各个集合与参数有:(1)用户特征集合Uinfo;(2)用户项目评分矩阵R(Um.In);(3)用户特征向量集合Uvec;(4)群组集合Groups(K,group);(5)群组数目K;(6)群组预测评分rgi;(7)群组预测评分矩阵RY(groupm.Im)。

算法1结合用户特征和用户兴趣变化的组推荐系统算法:

输入:Uinfo,R(Um.In),K

输出:RY(groupm.Im)

对Uinfo进行处理得到Uvec

将Uvec作为输入,指定值K,运行K-means算法进行聚类,得到用户群组Groups(K,group),其中包含了K个group

FOR(each groupin Groups)

FOR(each uin group)

通过上文提出的结合用户兴趣变化的协同过滤算法对项目i进行评分预测,得到rui

END FOR

使用公式(3)对group中的rui进行偏好融合,得出rgi

END FOR

RY(groupm.Im)←rgi

2 实验

2.1 实验数据集

实验数据采用MovieLens 100K数据集,数据集中包含了943位用户对1682部电影的100 000条评分记录。其中u.user文件记录了用户的性别、年龄等用户特征信息。实验中按照80%~20%的比例构造出了训练-测试数据集。使用训练集进行算法模型训练,并通过测试数据集对算法的推荐准确度进行检测。

2.2 实验结果度量标准

采用评分预测中常用的标准平均绝对误差(RMSE)计算预测值与真实值之间的偏差,RMSE值越低,说明预测值与实际值之间差距越小,即预测准确度越高;反之,预测准确度越低。RMSE计算方法如式(4)所示。

2.3 实验结果

将本文提出的结合用户特征和用户兴趣变化的组推荐系统算法(GRA-UI)与传统的协同过滤算法的组推荐系统算法(GRA)进行对比,GRA在计算预测值时采用传统的协同过滤算法。实验比较了在群组数目K从5~30变化时算法的准确度。图1为实验结果,由实验结果可知:

(1)组推荐系统中,随着群组数目的增加,组推荐系统的准确度不断提高。这是由于群组数目增加时,每个群组中的群组规模相应降低,群组内用户具有更高的相似性,被推荐项目更符合群组内每个用户的偏好。因此,改变群组规模可有效影响组推荐的准确度。

(2)在相同的群组规模下,考虑用户兴趣变化的GRA-UI算法在推荐准确度上均优于GRA算法。用户兴趣变化能够影响组推荐系统的推荐准确度,结合用户的兴趣变化能够有效提高组推荐系统准确度。

3 结语

本文提出的结合用户特征和用户兴趣变化的组推荐系统算法,首先通过对用户的特征信息进行分析,进而产生群组;其次在预测评分时提出了一种结合用户兴趣变化的协同过滤算法;最后使用痛苦避免策略为各个群组得出预测值。算法中以用户特征来进行群组划分能够更有效结合用户本身的信息,使群组划分依据更合理。使用结合用户兴趣变化的协同过滤算法能很好地解决用户兴趣变化问题,使组推荐结果更加准确。

参考文献

[1]XU HAI LING,WU XIAO,LI XIAO DONG,et al.Comparison study of internet recommendation system:comparison study of internet recommendation system[J].Journal of Software,2009,20(2):350-362.

[2]RESNICK P,IACOVOU N.GroupLens:an open architecture for collaborative filtering of netnews[C].Proceedings of the 1994ACMconference on computer supported cooperative work,Chapel Hill,NorthCarolina,United States,1994(10):22-26.

[3]ADOMAVICIUS G,TUZHILIN A.Toward the next generation of recommender systems:a survey of the state-of-the-art and possible extensions[J].IEEE Transactions on Knowledge&Data Engineering,2005,17(6):734-749.

[4]CAI W L,WU M X,JIE Z Y,et al.Context-aware recommender systems[J].Journal of Software,2012,32(3):217-253.

[5]ZHANG YU JIE,DU YU LU,MENG XIANG WU.Group recommender systems and their applications[J].Chinese Journal of Computers,Online Publishing,2015(38):89-90.

[6]MASTHOFF J.Group recommender systems:combining individual models[M].Recommender systems handbook.Berlin:SpringerVerlag,2011:677-702.

[7]SAID A,BERKOVSKY S,LUCA EWD.Group recommendation in context[M].Chicago,USA,2011:2-4.

[8]DYER J S,SARIN R K.Group preference aggregation rules based on strength of preference[J].Management Science,1979,25(9):822-832.

[9]BORATTO L,CARTA S,CHESSA A,et al.Group recommendation with automatic identification of users communities[C].Web Intelligence and Intelligent Agent Technologies,IEEE/WIC/ACMInternational Joint Conferences on.IET,2009:547-550.

[10]BORATTO L,CARTA S,SATTA M.Groups identification and individual recommendations in group recommendation algorithms[C].Proceedings of the fourth ACM Conference on Recommender Systems,Barcelona,Spain,2010:27-34.

[11]ARDISSONO L,GOY A,PETRONE G,et al.Intrigue:personalized recommendation of tourist attractions for desktop and hand held devices[J].Applied Artificial Intelligence,2003,17(8):687-714.

基于用户特征的研究 篇11

关键词:互联网技术;APP设计;功能管理;体验研究

移动通信技术发展脚步一直没有停息,3G网络在中国内部市场的推广效率也日渐提升,令移动互联网产业壮大。移动互联网是IT产业第三次突破,在相对社会化、位置锁定功能的吸引下,大量用户涌进,这种特定产品(即APP)开发,需要投入大量的人力和物力资源。我国的APP市场可以提供下载的产品就有数十万种类,然而其中大部分是不被人们所熟知的,这便是APP产业在服务工作中面临的最大危机。为了尽量改进不必要的烦琐操作方式,减少群众的负面情绪,必须对用户体验方面的设计做出完善处理,以促进国家网络事业的优先发展。

1 APP设计理论研究

1.1 设计管理工作的安排

设计已经成为现下社会商业战略和信息传播的主要工具,对于企业整体发展具有重要的辅助功能,所以,关于设计管理的存在地位已经得到社会的广泛认同。在企业内部环境中,设计依靠各类方式和多个层次对企业管理实现影响,无论是长远战略,还是近期细节部署,这种管理方式总能产生必要的良性效能,对企业的重要性已经成为不可否认的事实。在商业市场结构中,只有设计管理才能吸引更多的创新资源,并利用相关事务的科学识别功能建立起长久的竞争优势;在市场可供选择产品种类丰富的前提下,用户会开始注意优质产品与生活质量提升的关联,产生一定的需求标准,这类优质产品的管理也离不开设计管理的调整;设计管理不只是单纯的产品补充,关键是凭借设计激发出更多的潜能,在创新观念拓展的影响下,各国文化与经济领域有了更好地沟通媒介,社会的健康、平衡发展指日可待。

1.2 设计管理阶段分析

1.2.1 策略内容

策略内容是延展设计功能的基础,在这个环节中,工作人员应该将自身的注意力放在项目的定义、提出和改进上,保证组织策略和设计机遇的准确性。对企业和用户的各自需求掌握清楚之后,透过整体设计对企业的贡献角度进行分解。在这个过程中,企业一旦对此类策略内容予以肯定,就应该开始着手项目的成立和推广工作,保证投资主体在技术、设备等方面的支持,做好整个长期发展的计划。

1.2.2 过程分析

设计项目和相关议事主要在这个环节展开,事务进入实质性阶段,包括具有显著功能的措施、现实战略的融合计划等,促进项目的具体化,完善其可行性,这是整个阶段任务最为重视的问题。团队的创意对进程的推动至关重要,只有维持协作环境的稳定,才有助于形成视觉依靠的交流技巧,优化更多的创意和想法。对于项目的实际操作,包括实施模式、工作关系和职业态度等,只要项目材料制定完成,作品的递交将把管理的工作范畴进一步扩大,细化的内容包含条款和使用说明、更新日期等,这些设计方案为了适应现代化技术的标准,一般都会翻译成国际通用的文本模式。判断一个设计项目的成功經历,可以收货更加丰富的反馈资料,促进设计的有效应用。

1.2.3 人机界面的扩展

(1)用户的视觉体验。人体的视觉对全新场景的感知主要是从总体到局部的缩减过程,人们习惯先探测市场内部的大概轮廓,包括APP界面的尺寸、色彩等,再利用数据的收集对场景内部的对象做好分批浏览观察。视觉浏览路径也具体分为两部分,凝视和扫视。凝视过程中对读取的信息是有过思考的,是一种识别后的记忆模式;扫视主要是为了寻找目标,关于新接触的事物,人眼一般会从扫视向凝视过渡,然后再转换为扫视。一个功能界面在传递视觉信息上有着优质和恶质的区别,这些完全可以凭借个人的扫视次数做出判断,在主要信息点的强调方面,视觉噪音的减少和信息内容的衔接都将带来更加良好的回应。

(2)认知情绪的回应。在认知的研究工作方面,是被限制在尝试主体的稳定情绪条件下开始的,因为情绪是影响实验主体对APP正确认知的重要因素,但这类知识比较复杂,对实际研究工作会造成更大的困难。在科学分析原理下,理想状况下的研究数据还是可以被允许的,但是在实践中,情绪对认知的控制效果还是比较明显的。人机界面设计是APP设计工作的核心任务,用户也依赖界面获取信息,优质的界面包含社会心理学和传播学等潜在功能,这种多种学科的融合正是用户体验实效的保证。所谓的设计调查是建立在指导的动机前提下,真正掌握用户的实际需求,为今后的设计优化指清方向,尽量不偏离现实生活需要。

2 用户体验设计流程阐述

2.1 设计流程的分解

设计流程是改进产品创造技巧的规划,是利用科学手段对产品加以管理,减少产品开发周期,省去多余的资源投入,尽量迎合市场需求的过程。在APP设计中,改良型流程通过企业级软件产品而诞生,完全照搬不免存在一系列弊端。移动网络产业竞争十分激烈,而程序的迭代性又不会满足于产品的上线,更需要对用户使用情况做出统计,并记录用户期望和市场动向信息,争取做好下一版本设计的参考内容。这种市场带动的迭代性是APP设计的特征,对快速掌握用户体验感受提供保障。采用敏捷型设计的基本框架,利用高度迭代流程,综合瀑布型设计方式实现内部改良;为了方便环节间的交流,保证改动时间的充足,各个环节相对独立但相互联系;适当增加用户体验阶段的维度,明确不同环节用户体验的重要性,尽量梳理便于用户体验的方法,了解各项内容对用户的实际影响。

2.2 用户体验气氛的营造

邀请机制是一种利用对APP使用权进行限量的方法,进而充分吸引消费者的关注,尽量扩张消费者的购买欲望。正确的使用邀请机制,可以为用户提供更好的心理体验,同时保证用户数量的提升。邀请机制在互联网中已经得到广泛的应用,凭借产品在小范围的测试获得用户的测评报告,落实产品正式上线前的完善工作。邀请的关键是促成产品的稀缺,但不可忽视的是产品核心竞争优势。邀请机制在实施时应该设置较高的门槛,对种子用户进行严格筛选,避免负面评价的滋生,令产品获得更好的口碑。搜索引擎优化也十分重要,主要采取一系列不同的行动方式,增加搜索引擎到网站的目标流量。在移动网络时代下,APP改良更离不开搜索引擎的增加,主要是其对于用户寻找速度产生提升效果。

3 结语

现在的移动设备种类不断增加,关于网络软件的开发与设计工作便更加严格,主要是满足用户不同的需求标准,包括审美态度和搜索速度、创新功能等,这就要设计团队不断掌握第一手信息资料,明确时代潮流的定位和市场的空间容量,做好优化和改良,促进我国软件开发工作的不断优化。

参考文献:

[1] 姜冰.同质化时代下的情感体验设计——以移动通讯终端为例[J].北京理工大学学报(社会科学版),2011,13(06):5154.

[2] 黄晟.基于用户体验的APP设计研究[D].陕西科技大学,2012,12(11):2832.

基于儿童用户的体验模式研究 篇12

儿童作为社会人群的重要组成部分, 对于儿童处在一个成长期时, 儿童对于很多事物都有一颗好奇的心, 这个时候很关键, 是个开发智力, 动手能力等都会慢慢建立起来的时期。所以家长跟社会各界要积极地去培养儿童的这种能力的慢慢地积累起来, 让儿童在这个环境里慢慢地去形成他的人生观, 世界观和价值观。普遍重视。

爱因斯坦曾说, 是游戏, 也是美术。想象力比知识更重要, 因为知识是有限的, 而想象力概括着世界上的一切, 推动着人类的进步, 并且是知识的源泉。通过游戏的形式充分调动孩子们的五感来感知事物, 感知世界, 培养孩子们学会从不同的角度来观察事物, 并能不局限于传统的认知, 而是放飞想象力, 以美术为媒介来探索世界。而游戏是已经成为学龄前儿童生活中不可或缺的活动形式。游戏有利于他们的学习和成长, 游戏构成了这个阶段儿童的整个生活。对于学龄前儿童, 他们有较强的模仿能力和想象力, 喜欢用符号来代表周围的人、物体和地点。能够在认识过程中自然的建立一系列的“图示”, 把所观察到的所有东西都简化为单一和明了的符号, 在此基础上产生对周围环境事物的认识, 他们的心理和感知是以自我为中心的, 通过教育和引导, 可以让他们形成规则意识和他人的存在感, 产生友爱和集体意识的需求。

随着社会的快速发展和进步, 我们对生活细节的追求也愈加重视。尤其, 是对于儿童的关注更是与日俱增。儿童是未来的希望, 所以我们需要尽力的为他们创造一个安全舒适的生活娱乐环境。对儿童而言, 儿童产品市场日渐丰富, 消费群体也日益增加, 同时儿童也接受着来自各方面的信息社会的影响, 大部分的儿童也逐渐希望可以拥有自主选择的权利;对家长而言, 当今社会, 生活水平逐步提高, 物质生活也越来越丰富, 家长对儿童的教育也开始逐步完善起来。

调查发现, 许多公共空间跟私人空间的设计对成年的人体工程考虑的是比较到位的, 但是往往忽略了儿童。所以针对这个情况, 广大的家长跟社会各界应积极去改变这个现状, 通过对儿童心理跟身理的观察去改善这个缺陷。且根据一段时间的社会调查, 发现了在当下市场中对于特别针对儿童的专卖店、体验馆、活动中心数不胜数, 而以餐具作为展示内容的体验空间几乎不存在, 所以, 我们考虑为什么不可以有一家专门针对儿童餐具作为展示内容的交互式体验空间, 可以在一次消费的同时满足家长和孩子在用餐体验, 亲子关系, 娱乐活动, 信息摄取, 多元智能开发等各方面的需求呢。所以就有了Little room想法的诞生。对于儿童安全自然是最重要的, 家长应给予温暖, 爱护并且支持他, 让他在成长中慢慢地的形成安全感, 安全感更形成于明确的空间秩序和空间行为限制。对于公共空间和私人空间, 儿童有一种他自己的安全感的理念, 儿童的天真他会参与到群体的游戏中去, 而这种安全的群体游戏中, 他可以随意的发挥自己那份天真的本能。有时喜欢个人独处, 喜欢那种安全的氛围去发挥它的天真, 他们不喜欢别人动他们的东西, 喜欢更轻松、随意活动的空间。但是从空间上来说, 有时候儿童又很喜欢很空旷的空间。儿童有时候的玩耍是把一样东西丢进凳子底下, 家长帮他拿出来, 他还是会再次丢进去, 儿童会在思考, 丢进去看不到的东西, 家长怎么会拿得出来, 这个是本能的天真在感知这个空间, 他也是用一种很简单的方式去感知对这个空间的认识。儿童对空间的感知是不一样的。

基于儿童用户的体验模式研究是以儿童为用户研究对象, 以儿童作为整个设计的目标群体, 以儿童餐具为展示内容的交互式体验空间设计。通过对儿童的行为心理特点和行为规律的研究, 从幼儿的行为心理出发, 在深入了解、调查、体验儿童的行为、心理等特点的基础下设计。符合儿童在视觉心理、感知心理、思维活动、行为特点等多方面的需求。寻找真正的“童心”;创造真正的“童趣”, 营造出一个儿童需要并且喜欢的环境。在交互式体验中, 应用新科技和媒体展示手段, 增进父母与孩子的互动。

参考文献

[1]赵虎.INTERIORDESIGN[J].北京.经济日报报业集团, 2009, 48-57.

[2]哈特穆特莫根罗特.每个孩子都能好好吃饭[M].北京:中信出版社, 2010, 13-24.

[3]安妮特卡斯特, 察恩.每个孩子都能管好自己[M].北京:中信出版社, 2010.45-67.

上一篇:农村机构改革下一篇:改良早期预警评分系统