短信技术

2024-09-13

短信技术（共10篇）

短信技术篇1

2012年以来, 垃圾短信又有重新抬头之势, 并有了新的变种, 主要包括伪基站垃圾短信、i Message垃圾信息及智能手机中毒后成为“肉机”发送的垃圾短信, 其内容大多涉及反动、诈骗、买卖非法物品等违法信息。这种行为不但极大危害了用户的切身利益, 而且对于联通的品牌打造也制造了很大的障碍, 因此对垃圾短信进行治理刻不容缓。

针对此种情况, 集团公司于2012年起将垃圾短信的治理纳入KPI考核, 按月对未达到考核指标的省份进行通报及收入扣减;于2013年优化考核标准, 开展“净网”活动, 对全网和地方端口短信进行清理, 对不符合条件的端口进行关停处理;于2014年执行行业端口省间结算, 完成国际垃圾短信拦截系统扩容, 组织开展打击伪基站专项行动, 启动建设集中拦截系统。

1 垃圾短信治理方案分析

垃圾短信监控, 按照拦截位置的不同可以分为发端控制、收端控制和其他控制三种模式。其中又根据短信数据处理网元的不同分为短信中心控制模式和信令控制模式, 下面分别加以介绍。

1.1 发端短信中心实时控制模式

垃圾短信信息安全监管系统与短信中心 (SMSC) 连接, SMSC将MO/AO短信暂存并实时传递副本给垃圾短信信息安全监管系统, 由垃圾短信管理系统根据设定的判别规则对MO/AO短信实时进行垃圾短信甄别, 并将判别结果通知SMSC进行拦截或下发处理。

垃圾短信管理系统对SMSC上报的短信数据进行甄别分析, 对符合垃圾短信判别规则的短信通知SMSC进行拦截处理;对不符合垃圾短信判别规则的短信通知SMSC进行下发处理。

发端实时短信中心控制模式网络结构与准实时短信中心控制模式网络结构类似, 其中接口机可以采用与现有信息安全汇聚网关复用。

1.2 发端信令实时控制模式

垃圾短信管理系统与信令处理机连接, 信令处理机串接在LSTP与SMSC之间的信令链路中;如果建设的是HSTP, 信令处理机串接在HSTP与SMSC之间的信令链路中, 由信令处理机根据设定的判别规则, 对提交给S MSC的M O短信和SMSC发出的M T短信数据进行比对, 对符合判别条件的MO/MT短信进行实时拦截, 同时将MO/MT短信记录副本上报至垃圾短信管理系统做进一步分析处理以及数据存储。

垃圾短信管理系统对各个信令处理机上报的短信数据进行汇总分析, 根据分析结果更新垃圾短信判别规则并同步至各信令处理机执行。

1.3 收端信令实时控制模式

垃圾短信管理系统与信令处理机连接, 信令处理机串接在LSTP与MSC之间的信令链路中;如果建设的是HSTP, 信令处理机串接在HSTP与MSC之间的信令链路中, 由信令处理机根据设定的判别规则, 对下发至MSC的MT短信数据进行比对, 对符合判别条件的MT短信进行实时拦截, 同时将M T短信记录副本上报至垃圾短信管理系统做进一步分析处理以及数据存储。注:MT短信记录应包括发送方号码、接收方号码、消息内容、发送时间等信息。

垃圾短信管理系统对各个信令处理机上报的短信数据进行汇总分析, 根据分析结果更新垃圾短信判别规则并同步至各信令处理机执行。

1.4 治理方案比较

对于垃圾短信治理的发端方案和收端方案, 从监控范围, 拦截策略, 维护要求进行比对可以发现:全网发端方案和收端方案的监控范围和拦截策略基本相同, 但发端方案可以采用短信中心方案和信令方案, 监控的设备投入较小, 相比收端, 发端的性价比更高, 因此天津联通垃圾短信平台采用的是发端短信中心实时方式的方案。

2 天津联通垃圾短信治理成果

通过新建垃圾短信信息安全监管系统, 采用发端短信中心实时控制方式, 实现天津本地发端垃圾短信治理功能, 较之之前通过短信中心自带模块离线分析短信中心话单后生成黑名单的拦截方式, 拦截短信数量和范围有了很大幅度的提高。

另一方面, 针对通过大量号码池低频发送垃圾短信的行为, 如果单纯依靠垃圾短信监控系统的话, 采用严格单一的拦截策略, 容易造成正常短信的误拦, 遗漏垃圾短信。因此, 采用关键字+流量控制、系统自动处理+人工审核相结合的方式, 重点启用

(1) 降低可疑短信的门限值, 尽可能多的收集可疑短信, 对内容雷同的可疑短信进行内容分析提纯, 通过“与或”逻辑组合及时添加拦截策略, 对垃圾短信进行精准拦截。

(2) 增加了临时关键字、关键句功能, 通过人工审核将确认为垃圾短信的联系电话、网址、QQ号、银行账号等加入临时关键字, 发送3条即加入黑名单, 有效提高拦截率。

(3) 人工审核团队坚持对可疑信息进行100%人工审核, 发现一例封堵一例, 进行100%封堵;及时制作、更新监控拦截关键字, 坚持人工和智能化系统相结合, 确保不良信息7×24h审核处理的及时有效。

在多种治理举措的共同实施下, 天津地区的垃圾短信发送量大幅度降低, 垃圾短信被举报量也明显减少。通过12321和10010垃圾短信举报处理平台数据显示, 2012年天津地区点对点垃圾短信被投诉量显著下降 (其中垃圾短信被举报率=来自于10010和12321平台的垃圾短信举报数/本地短信用户数 (千万数量级) 该文中本地短信用户数以2012年在网用户数均值430万来进行计算) , 如图1所示。

3 技术发展与展望

虽然天津联通已经建设了基于短信中心发端控制的垃圾短信监控系统, 并通过系统自动处理与人工审核相结合的方式取得了较好的成果, 但是单纯依靠“关键字+频次”实现垃圾短信一次过滤的方式仍有不足, 并且人工审核工作无法做到垃圾短信的事前处理。随着垃圾短信治理工作的深入, 垃圾短信也呈现出新的发送特征。

(1) 发送者采用同音、形近、近义等方式, 规避关键字方式的拦截, 同时在其中混淆一些无意义的字符, 用来欺骗拦截算法。例如:“fa-瞟”、“货 (贷) 款”等拼音词汇变形, 嵌入特殊字符等使得目前的关键字和关键字组合失效。需要针对此类进行语义特征提取, 自动过滤关键字。

(2) 发送者采用频繁换号的方式, 每个号码都是低频发送, 模拟正常用户的发送行为进行发送, 以躲开针对发送者的异常行为进行流量探测的方法。

针对此类问题, 集团公司总部在部分省市进行试点, 开展基于可疑度计算的垃圾短信过滤方案的运行测试工作, 在垃圾短信的过滤过程中首次引入了可疑度的概念, 使用多种特征过滤及内容过滤算法对一条短信的可疑度进行估算, 命中一个算法, 给当前短信累加一个分值, 并且赋予每种算法不同的权值, 当短信的可疑度累积增加到一定阀值时, 可疑短信被视为垃圾短信。

下一步, 集团公司计划于2014年内启动的基于收端控制的垃圾短信集中拦截系统的建设, 该平台实现关键字和拦截策略的统一部署, 从而能大幅度减少垃圾短信在省际间的流动泛滥问题, 同时结合天津本地现有垃圾短信平台的优化扩容, 为用户打造了绿色诚信的网络文化环境, 实现了经济效益和社会效益的双丰收。

摘要：近年来, 垃圾短信愈发泛滥, 这种行为不但极大危害了用户的切身利益, 而且对于联通的品牌打造也制造了很大的障碍。因此, 对运营商的监管提出了更高的要求。该文综合比对了主流的垃圾短信拦截方案, 最后明确了所采用的基于发端短信中心实时控制的垃圾短信拦截方案。通过采用系统自动处理和人工审核相结合的方式, 垃圾短信治理工作取得了显著的成果。最后, 该文结合目前垃圾短信治理的形势, 对最新的基于可疑度的垃圾短信拦截机制进行了介绍, 对后期的治理工作提出了展望。

关键词：发端短信中心实时控制,垃圾短信被举报率,关键字拦截机制

参考文献

[1]张永忠, 王江.垃圾短信监管系统方案分析与实现[J].硅谷, 2012 (7) :128-129.

[2]张燕, 傅建明.垃圾短信的识别与追踪研究[J].计算机应用研究, 2006, 23 (3) :245-247.

[3]李恺明.广东移动通信垃圾信息分析与治理方案设计[D].北京:北京邮电大学, 2011.

短信技术篇2

关键词：构件技术；多媒体；短信系统

中图分类号：TN929.9文献标识码：A文章编号：1007-9599 （2010） 13-0000-02

The Design and Implementation of MMS System based on Component Technology

Lan Weiwen

(Caijiaguan Campus of Guizhou University,Guiyang550001,China)

Abstract:The component-based software development,multiplexing technique can decompose the complexity of the problem,reduce development,support parallel and distributed development,and improve the system of quality and maintainability,and can reuse previous work achievements and experience accumulation for the future development of reusable the software component.Based on the smart phones MMS client software system as the research object,proposed MMS design solutions based on component technology.

Keywords:Component technology;Multimedia;Messaging system

MMS是Multimedia Messaging Service的缩写，中文译为多媒体信息服务，也称“多媒体短信”或“彩信”。是按照3GPP（Third Generation Partnership Project，第三代移动通信标准化的伙伴项目）的标准（3GPP TS 23.140）和WAP（Wireless Application Protocol，无线应用协议）论坛有关多媒体信息的标准（WAP-206和WAP-209）开发的业务。

MMS在WAP协议上运行，因此它对传输格式并没有严格的限制，既支持CSD格式（Circuit-Switched Data，电路交换数据格式），也支持通用分组无线服务GPRS（General Packet Radio Service，通用分组无线业务）格式。其工作原理为利用高速传输技术EDGE（Enhanced Data rates for GSM Evolution）和GPRS的支持，以WAP为载体传送视频、图片、声音和文字，实现即时的手机端到端、手机终端到互联网或互联网到手机终端的多媒体信息传送。

一、MMS系统的网络结构

MMS的一个关键特征就是它能够和其他的消息系统进行互操作，比如和SMS的互连、和EMAIL服务器的互连，甚至包括如传真、语音邮件等消息系统等。MMS终端（客户端）以及实际网络环境组成如图1所示：

1.MMS Client：多媒体短信客户端，是用户的终端设备上的一个应用，它和用户进行交互，即本文开发的系统；

2.MMS Proxy-Relay：多媒体短信分发代理，MMS客户端就是与其进行通信，同时，它还负责与其他的消息系统进行通信，并且负责访问MMS服务器，有时MMS Proxy-Relay与MMS Server合而为一；

3.MMS Server：提供多媒體短信实体的存储功能；

4.Email Server：电子邮件服务器；

5.Legacy Wireless Messaging System：目前存在的各种无线消息系统，例如SMS、传真等等。

二、MMS运行平台及功能需求

（一）MMS运行平台

MMS智能手机客户端软件系统需要智能手机平台为其提供GSM/GPRS硬件、SMS网络接口支持，文件、内存管理支持，多线程的支持，以及消息机制，图形界面、基本控件的支持和实时性的保证。

本文设计的MMS系统使用的智能手机平台采用mLinux作为系统核心，mFone作为应用平台。该系统为MMS提供了所有必需的软硬件支持。该平台按照层次的结构设计，各层相对独立，通过对外接口进行层间通信，这样可在产品开发中按各层的功能和接口并行开发，然后将各个子系统组装集成，进行系统测试和验收，从而缩短产品开发周期。整个平台由HardWare、mLinux OS、mGUI及应用部分组成。在设计上采用分层结构，明确各层的功能及接口，尽量降低各模块直接的依赖性，以便于系统整体或者部分的升级。

（二）MMS功能需求

MMS客户端软件系统需要实现如下功能：

1.编辑MM：创建新的MMS信息，对MMS信息的任意部分进行修改，增加或删除背景音乐，增加或删除帧，修改所有帧，增加或删除文本，改变文本内容，增加或删除图片；

2.发送MM：发送MMS到手机或者邮件地址，具备发送、转发、回复功能；

3.接收MM：将储存在MMSC上的MMS信息接收到移动终端；

4.查看MM：预览、播放MMS信息，支持SMIL的多帧显示；

5.管理MM：划分收件箱、发送箱、未发箱、草稿箱、收藏箱的方式管理在移动终端上的所有MMS信息；对新彩信通知、下载未读、已读、已发、未发信息进行标记，对所有的信息进行删除和编辑操作。

三、基于构件技术的MMS系统设计

（一）体系结构设计

设计MMS的体系结构时，采用基于构件技术的设计，对MMS进行功能模块的提取、划分。在划分功能模块，设计构件时，并不是将功能分得越细越好，大粒度、完整的功能构件更有机会得到复用。MMS与WAP网关的网络交互需要MMS编解码功能的支持，因此，综合考虑后，将MMS的编解码、SMIL文件的解析以及与WAP网关的网络交互功能放在一个功能构件MMS核心库libmms.so中实现。系统采用层次的体系结构：上层通过下层对外提供的接口，直接调用下层的服务；下层通过上层注册的回调函数向上层传递消息；libmms.so的解码模块将彩信解码后，将图片、音频、文本保存到彩信应用的一个临时文件夹下，MMS中的显示模块直接到该临时文件夹下获取当前彩信的图片、音频、文本，并根据解码获得的SMIL文件中的彩信播放控制内容播放彩信。

（二）基于构件技术的MMS系统详细设计

1.MMS核心库总体设计。MMS核心库设计时也按照功能对其进行了模块的划分，MMS核心库的总体设计如下图3所示：

其中，MMS Editor模块负责彩信的编辑，提供接口供彩信应用调用实现MM中帧的添加、删除，帧中内容（图片、音频、文本）的添加、删除及相关播放控制信息（播放时间，图片、文本显示位置）的设置，彩信的主题、收件人、日期等的设置；SMIL Composer模块在彩信编辑完后，完成彩信播放控制信息的编码工作：将彩信的播放控制信息按SMIL语法编码到一个smil格式文件中；最后，MMS Composer模块完成彩信的编码：将编辑的多媒体消息按彩信相关协议编码到一个MMS PDU中，相比构件间的关系，MMS核心库中的各模块除了提供对外的接口供其它模块调用外，各模块间还共享数据结构的定义、能够对其他模块中结构体的成员变量值直接进行读取和设置，以提高核心库的效率。

2.文件管理的构件化设计。File Manager用于管理消息，分为收件箱、已发箱、未发箱、草稿箱、收藏箱，分别用来保存接收的消息，发送成功的消息，发送失败的消息，草稿消息，个人收藏消息。实现对MMS、SMS、EMAIL消息的统一管理。该模块定义了管理器manager，manager里面包含文件夹folder，folder里面包含文件message。

3.图片显示的构件化设计。Picture Viewer构件实现对bmp、gif、jpeg、png格式图片文件的显示。该构件主要的对外接口设计如下：

CMS_S32 InitPicViewerPlugin（）；

功能：PicViewer的初始化；

4.PUSH消息处理的构件化设计。MMS的新彩信通知、送达报告和阅读报告是以PUSH消息的形式到达手机的，PUSH消息由MCS统一处理。MCS与MMS相关的功能包括：MMS通知处理、彩信通知读取、彩信删除、彩信状态修改，通知用户彩信送达，通知用户彩信已阅读。MCS彩信模块（负责彩信相关PUSH消息的处理的模块）负责提取短信方式的新彩信通知。彩信应用将读取这些通知，并供用户下载、阅读。在此过程中，MCS彩信模块负责彩信状态的维护，具体包括彩信存储状态的维护和彩信状态的维护。

参考文献：

[1]杨杰.基于MM7API的多媒体短信增值服务平台的构建[J].科学技术与工程,2007,21

[2]王茂祥,吴振海,徐若龙.MMS系统的基本结构与功能浅析[J].江苏通信技术,2003,19,1:1-4

作者简介：

短信平台短信息分流技术研究篇3

那么可以通过哪些手段进行短信分流呢?首先, 我们可以通过互联网网站的渠道, 根据2013年的统计数据, 中国网民数量已经拉近6亿人, 近一半的中国人都在使用网络, 因此某电网公司加强网上营业厅的建设, 并已经通过多次改版和完善, 现在已经有越来越多的人在使用网上营业厅进行电费查询和业务办理;另一方面网上营业厅也开通了通过邮件订阅电费详单的业务, 以此来减轻手机短信的压力;鉴于当前移动技术的迅猛发展, 大多数用户都开始使用智能手机, 而微信已逐渐在用户之间普及, 很多企业也已经申请了企业服务号为用户提供在线服务。因此, 通过微信方式将电费短信分流出来是一个非常好的方式。

二、研究内容

2.1加强互联网渠道建设和宣传

通过对现有网上营业厅的不断完善, 使用户可能通过各种设备访问某电网网上营业厅, 让用户随时可以查询到自己所关心的电力信息, 包括:个人的电费信息、用电信息、业务办理进度、相关用电知识宣传信息等。

2.2微信企业公众帐号建设

(1) 微信企业公众号申请与使用。通过腾讯公司官方文档, 以及与相关客服人员交流后, 确认企业公众号的申请及使用, 并为信息中心申请相应的公众号。 (2) 微信企业公众号配置研究。研究微信官网管理平台, 对申请的公众号进行配置和使用, 为实际使用做准备, 如:自定义菜单、消息群发等。 (3) 电费信息生成及推送功能研究。这是本次研究工作的核心内容, 替代短信发送方式, 通过微信推送电费通知给电力客户, 从而将短信分流到微信平台。 (4) 研究企业公众号与企业级应用结合。经研究微信平台提供了多种接口模式, 可以采用此方式, 开发更丰富的微信企业应用, 给用户提供更全面的服务。根据用户最常用的功能特点, 我们主要为用户提供了如下功能, 见表1:

用户只需要在微信客户端订阅服务号并绑定户号后, 就可以享用各项服务。

(5) 菜单定义推送。目前自定义菜单最多包括3个一级菜单, 每个一级菜单最多包含5个二级菜单。一级菜单最多4个汉字, 二级菜单最多7个汉字, 多出来的部分将会以“...”代替。请注意, 创建自定义菜单后, 由于微信客户端缓存, 需要24小时微信客户端才会展现出来。建议测试时可以尝试取消关注公众账号后再次关注, 则可以看到创建后的效果。 (6) 消息推送。当用户主动发消息给公众号的时候 (包括发送信息、点击自定义菜单click事件、订阅事件、扫描二维码事件、支付成功事件、用户维权) , 微信将会把消息数据推送给开发者, 开发者在一段时间内 (目前为24小时) 可以调用客服消息接口, 通过POST一个JSON数据包来发送消息给普通用户, 在24小时内不限制发送次数。此接口主要用于客服等有人工消息处理环节的功能, 方便开发者为用户提供更加优质的服务。

技术难点:在研究过程, 我们得知微信企业公众号有诸多限制, 造成如下技术难点需要解决: (1) 公众号分为服务号和订阅号, 都分别做了信息发布的限制, 服务号每月只能发布一次面对所有粉丝的信息, 而且是相同内容的信息;订阅号每24小时只能发布一次公共信息给粉丝;因此如果需要发送群体提示信息时需要突破此限制。 (2) 推送消息的限制。微信平台对于公众号向粉丝推送消息也做了限制, 只有粉丝在24小时内与公众号主动交互过才能向其推送消息, 因此对于我们定期推送电费通知给用户来说, 就非常困难。 (3) 智能应答功能。通过用户输入的消息为用户提供针对其个人的应答, 并且要做到准确快速。

三、结论

本项目从接口设计、关键技术攻关、核心服务研发等多个方面对通过微信进行短信平台短信息分流的方法和技术展开研究。为电力用户提供更多的服务渠道, 用户不仅可能通过PC端享受电力服务, 现在同样可以使用智能手机享受相关电力服务;经济效益方面, 通过逐渐引导电力用户从短信接收电费通知切换到微信方式, 可以大大降低短信费用, 同时, 企业通知也可以逐渐过度到微信平台, 同样可以节约更多的短信成本。由此可以看出, 本项目的实施, 具有很好的经济效益和市场前景。

摘要：随着某电网公司短信平台应用的建设和使用, 短信发送量迅猛增加, 短信费用也日益增加。2013年短信量达到了2亿余条, 支付的费用高达1000万余元人民币。目前短信大量使用于营销业务和办公系统短信通知, 如电力公益短信 (电费通知、停电通知等) 、企业通知等, 其中电力公益短信占所有短信量的90%以上, 因此通过其他渠道分流电费短信通知势在必行。

短信技术篇4

银川市科协科普知识短信服务平台，从2011年11月开始试行，面向宁夏移动手机用户发布免费科普短信，每月两条（随时增加），希望对市民的科学健康生活有所帮助。虽然每条短信只有短短几十个字，但内容涉及衣、食、住、行等方面。短信目标人群从最开始在科技工作者、农村科普信息员、科普示范基地、农技协工作者等领域，现已扩大覆盖至未成年人、农民、城镇劳动者、领导干部和公务员、社区居民五大人群，接近10000人。

科普短信面向市民，也来自于市民。从平台试行至今，银川市科协联合中国移动宁夏公司银川分公司同步也开展了科普短信有奖征集活动，活动得到了社会各界的广泛关注和积极参与，截至目前共征集到科普短信1200多条，内容涉及合理膳食、科学避险、健康生活、科学常识等。科普短信征集活动长期有效，每半年评选一次，评选出的优秀科普短信通过银川市科协科普短信平台发送给广大移动手机用户。2012年，银川市科协从征集到的科普短信中评选出了100条进行奖励，并遴選出10条作为2012年度优秀科普短信。

今后银川市科协科普短信服务平台还将继续扩大受众，并实现三网发送和彩信发送，争取让更多公众从中受益。

科普短信有奖征集活动参与方式：编辑短信发送到电子邮箱：yckpw@163.com即可，参与热线0951--6888602，联系人：王文海。

（王文海编辑：周艳梅责任编辑：邹冰洋）

短信技术篇5

根据调查了解电信运营公司现有的网络硬件和人员编程能力, 利用现有的软硬件资源, 搭建平台, 开发预警系统是可以实现的。首先我们用一台计算机作为服务器, 在办公网上搭建服务器系统, 后台通过本里链接跑取区公司的容灾数据到本地, 前台筛选符合套卡行为的用户, 相关人员将平台筛选出来的符合短信套卡的用户导出后导入到BSS的CRM中的批量业务中, 批量关闭套卡用户的短信功能, 从而较实时监控用户的消费行为, 实现对短信套卡用户的实时监控行为, 通过理论推理, 短信套卡现象是可以通过预警系统监控的。短信套卡预警平台的开发首先要突破技术壁垒, 这就要求我开发的系统架构、数据库产品、开发工具 (编程语言) 、Web服务器软件等进行对比选择。所以选择开发平台和开发工具是至关重要的。

1 系统架构选择:B/S架构

我们通过客户端便利性、维护便利性和系统扩展性三个方面对B/S和C/S架构进行了对比。B/S架构业务运算由服务器处理, 客户端直接采用浏览器访问, 后台利用关系数据库系统, 以增强数据处理能力, 提高工作效率。前端用户通过Web的方式实现, 避免了C/S架构中客户端安装、维护、升级带来的困难, 降低了数据需求部门的使用难度, 故B/S架构是更好的选择。

2 数据库产品的选择:SQL SERVER

常用的数据库产品有:ORACLE、SQL SERVER、微软ACCESS、DB2、Mysql, 对于开发短信套卡预警平台来说, (Structured Query Language, 简称SQL) SQL SERVER是具有很明显的优势, 因为其他产品都是应用于大型或者是小型系统的数据库开发, 而短信套卡预警系统属于中型数据库, SQL SERVER不仅安全稳定, 还能应付常用的数据应用, 而且功能强大。通过调研各公司编程人士, 他们普遍对SQL SERVER比较熟悉, 使用率很高, 所以SQL SERVER是不需要另行购买的, 综上所述SQL SERVER是数据库产品最佳的选择。

3 开发工具 (编程语言) 的选择:ASP

开发工具即我们常说的编程语言, 在开发工具的选择有:JAVA、VB、ASP。

JAVA基于现有硬件平台, 软件已经确定在Windows平台使用, 但是因为目前没有购买专业的开发库, 所以开发人员开发系统较为困难;VB考虑到VB语言固有的特点, 对于编写大的系统时性能不高。同时, 使用VB编写的代码, 后期维护成本巨大;ASP (Active Server Pages) 是目前最为流行的开放式Web服务器应用程序开发技术。ASP基于Windows平台, 属于面向对象语言, 开发库很丰富, 而且和Sql Server数据库结合紧密, 开发效率非常高。Asp是开发短信套卡预警系统的优选工具。

4 Web服务器软件选择

Apache:Apache不需要投资, 但是当用户多的时候性能不高。开发人员不熟悉此系统。

Weblogic需要专门购买此软件, 同时要求编程人员熟练使用Java语言。对于开发此系统而言, 投资过大。

Microsoft IIS:易于安装且可以使用asp、VB、VB.NET语言, IIS使用的asp语言, 开发人员很熟悉。同时, 考虑到此Web系统在企业内网, 所以IIS的安全能够满足要求。

通过对研发短信套卡预警系统技术路线的选择, 以上对系统架构、数据库产品、开发工具 (编程语言) 、Web服务器软件等进行了对比选择, 确定了平台开发的最佳实施方案。

短信套卡预警本平台利用B/S系统架构即浏览器/服务器模式。其中服务器端:利用数据库技术每日定时将后台营业oracle冗灾数据库的用户数据及实时费用, 跑入本地Sql Server数据库服务器, 在本地Sql Server服务器中里建立数据集, 利用网站编程技术ASP/Java Script编程语言及Dreamweaver网站开发工具开发网页, 筛选每日跑入的最新数据, 将符合赠退费的用户用户筛选按网别筛选出来。

根据网站服务器地址、端口信息及分配的工号, 进入系统将每日符合短信套卡的用户按网别筛选出来, 并将符合条件的用户下载保存, 后进入bss系统批量关闭短信息服务功能。根据软件工程的设计思路及开发流程, 确定了平台开发的技术路线。

摘要：近几年由于垃圾短信泛滥, 垃圾短信让各个电信运营商的短信结算支出增加迅猛。通过大数据分析发现, 垃圾短信的是由于短信套卡产生的, 即一些经销商将开出的电话卡单纯用于发送短信, 不进行语音通话。等到发现的时候, 发送短信产生的费用已经超出了电话卡上的预存款, 所以移动业务套卡造成了电信运营商欠费额度攀升、垃圾短信居高不下, 导致公司大量成本无效支出和收入损失, 严重影响了公司的效益。开发短信套卡预警系统迫在眉睫, 而开发过程中的技术壁垒是很难突破的。

关键词：短信套卡,垃圾短信,预警平台,SqlServer,ASP

参考文献

[1]杨卫民, 谭骏珊, 汪斌.数据仓库和数据挖掘技术在DSS中的应用研究[J].计算机工程与设计, 2004, 25 (10) :1695-1697.

[2]唐磊.电信本地计费帐务系统开发[D]: (硕士学位论文) .重庆:重庆大学, 2007.

[3]张岩, 巫峡.3G业务发展趋势及平台建设思考[J].邮电设计技术, 2009, 56 (05) :3.

[4]A张惠娟 (译) .dam Jorgensen, Patrick Le Blanc, Jose Chinchilla, Jorge Segarra, Aaron Nelson, SQL Server2012宝典 (第4版) [M].清华大学出版社, 2014.5 (01) .

短信技术篇6

2011年11月,国家突发公共事件预警信息发布系统正式启动建设。2012年8月中国气象局公共气象服务中心主任、国家突发公共事件预警信息发布系统项目办主任孙健指出,将与移动、联通、电信三大运营商建立全网发布机制,通过开发、完善小区短信技术和优化组织管理流程,使运营商能够在接收到预警后在10分钟内向受影响区域公众发布。

小区短信发布预警信息相对于群发有如下优势:

(1)具有区域针对性。小区短信系统可以获取一段时间内在某一特定区域的用户号码。

(2)具有目标针对性。小区短信发送的目标不仅仅包括本地用户,还包括外地用户。

(3)具有发送及时性。由于区域准确、目标准确故可以实现较少的发送量而达到一石激起千层浪的效果。

2 系统架构

普通的小区短信系统业务处理逻辑复杂,业务发送速度慢,直接应用于公共事件应急预警其发送效果将被限制,故需要根据公共事件预警的特点对小区短信系统的架构进行重新设计,新的系统架构如图1所示。

重新设计的系统架构具有如下特点:

(1)短信发送速度快,每秒300至8000条的发送速度。此速度一个短信网关不能满足,故系统可以接入多个短信网关和短信中心进行短信发送。

(2)极短时间内可以获取目标区域的大量用户号码,即在预警短信发送开始时能获取目标区域的用户快照。

(3)支持多种协议类型的网关下发,如可以支持CMPP2.0、CMPP3.0、SMPP3.3、SMPP3.4等协议。

(4)WEB方式管理业务,只需要有浏览器即可进行预警业务部署,提供短信审核和WEB审核等多种审核方式,在保证平台安全的情况下,为使用者提供最大的方便。

(5)业务管理客户端既支持与多运营商之间的安全连接也可各个运营商分布式部署。

3 系统组成

系统由六部分组成,分别为信令基础平台、业务管理WEB平台、业务管理客户端、发送控制服务端、代理网关组和数据库。

信令基础平台为系统区域目标用户来源;业务管理WEB平台完成业务申请、审核、查询、统计等业务管理功能,系统参数配置,系统用户管理、权限管理、操作日志管理等基础功能;业务客户端完成业务发送区域目标用户获取、发送控制、发送日志处理、实时流量获取等;业务发送控制服务端完成业务发送网关组选择、网关协议选择、配置参数控制等;代理网关组实现与短信网关连接,完成短信下发。

4 系统部署

根据不同的要求系统支持两种部署方式,集中部署是系统的主要模块都部署在国家应急中心,信令基础平台部署在运营商,分布式部署则只有WEB管理平台部署在国家应急中心,其他部分部署在运营商。

4.1 集中部署方案

信令基础平台部署在各个运营商,其他部分集中部署在国家应急中心,国家应急中心通过专线与各个运营商进行连接。信令基础平台与业务管理客户端通过Socket连接传输订阅和分发信息。此种方式维护方便,硬件投资少。集中部署示意图如图2所示。

4.2 分布部署方案

分布式部署只将业务管理平台和业务管理数据库部署在国家应急中心,将业务管理客户端、业务发送控制服务端、代理网关组、发送日志数据库、网关配置数据库及信令基础平台部署在各个运营商,通过数据传输代理同步业务数据。

此种部署方式需要在每个运营商处都部署一套业务控制部分,设备投资大,由于设备多维护工作量大,出现故障不易排查。分布部署示意图如图3所示。

5 可行性分析

可行性分析首先论述系统架构可行性,即系统描述的架构有成功的案例或者此架构的组成部分有成功案例,其次论述系统的可实现性,即在一定的开发周期(此周期为3个月)能快速开发出模型。

5.1 架构可行性

目前建设的应急系统有北京应急预警发布系统、江苏移动公益短信群发平台、申通地铁应急预警发布系统。其中北京应急预警发布系统在2006年完成一期建设,2008年完成二期建设,在北京奥运、北京央视大火等事件发挥过重大作用,是一个成熟的系统。江苏移动公益短信群发平台,是一个短信高速发送(最高发送速度8000条/秒)系统,2010年建设完成,在2012年江苏台风事件中发挥过重大作用,也是一个成熟的系统。申通地铁应急预警发布系统,是上海政府部门与三家运营商共同建设的系统,是一个演示系统,建设于2009年。下面对上面三个系统架构进行介绍。

5.1.1 北京应急预警发布系统

北京应急预警发布系统采用分布式部署,业务管理部分部署在北京气象局,业务发送部分部署在北京移动机房,两地通过专线连接,通过数据代理程序进行业务数据同步,其部署图如图4所示。

比较图4与图3可以看出北京应急发送控制部分比较简单,只使用一个代理网关进行下发,下发逻辑处理由数据库控制,受限于数据库I/O,此系统每秒最大发送条数260条。

5.1.2 江苏移动公益短信群发平台

江苏移动公益短信群发平台采用集中式部署,其号码源由BOSS提供,故不需要号码采集部分。该平台操作简单,业务响应速度快,短信发送速度快(理论速度可达12000条/秒),业务生效后即有充足的号码源来满足要求的下发速率。此系统的设计充分发挥了大内存,高带宽的优势,采用WCF的STREAMED方式传输数据,数据在内存中进行处理,完全避免了硬盘I/O的瓶颈。江苏公益短信部署示意图如图5所示。

5.1.3 申通地铁应急预警发布系统

该系统由上海市委牵头组织由申通地铁、移动、联通、电信参与建设,系统设计最主要的特点是分布部署和多运营商支持。在2009年上海地铁事故的背景下,各运营商积极参与系统的设计及DEMO系统的建设,在各单位通力协作下,完成了多运营商支持、分布部署的申通地铁应急预警发布系统的演示版,为多运营商支持的架构设计积累了经验。

5.2 可实现性

由上面架构分析可知实现该架构的构件现在已经具备,需要开发的是各个构件之间的适配器,再整合公司其他项目资源后,实现此系统需要开发的适配器只有业务管理客户端和下发控制服务端之间的适配器和业务管理客户端与信令基础平台之间的适配器。

其他开发工作量主要集中在WEB管理平台,管理平台可以借鉴北京应急和公益网关平台,如果采用分布部署需要开发数据同步组件。

6 结论

此架构可以认为是北京应急系统架构和江苏应急架构的发展和升级。对于北京应急是对其下发部分的瓶颈进行改造,用公益网关替换其单一网关,使其具有高速下发的能力;对于公益平台则是将群发号码源替换为采集号码源;对改造部分作一些衔接的适配器即可实现新的架构。

从开发量和开发难度上分析,现在已经具备了该架构实现的全部构件,开发工作量集中在WEB开发和两个适配器开发及功能单一的数据同步组件的开发,故此实现周期可控,预计在3个月左右即可完成。

根据现在政府与各运营商合作案例分析,在实现中分布式部署方式采用的可能性较大,即各运营商分别投资建立一套应急平台,此平台不仅仅用于应急业务,也可用于行业应用,如在停水、停气、停电时采用此系统发送既快捷又准确。

其建设的意义是向城市应急指挥部门提供精确分众的应急信息发布、实时流量监测预警、辅助决策分析、发布信息互动等服务,在更高的技术层面上为城市应急指挥中心提供区别于其他渠道、分众准确、信息实时、畅通性好、覆盖面广的全新渠道;协助政府有关部门整合现有的突发公共事件紧急处置信息资源,建立有效的信息的获取、分析和发布的技术支撑体系,在反恐和刑事案件、消防安全、交通安全、安全生产、突发公共卫生事件、抗震救灾、恶劣气象事件(台风等)、城市公用设施突发事件管理等多个方面,帮助市政府提高在应对突发公共事件的快速反映、指挥调度和防范处理等方面的能力。

参考文献

[1]《中华人民共和国突发公共事件应对法》及《北京市实施〈中华人民共和国突发公共事件应对法〉办法》(草案)

[2]《国家国民经济和社会发展第十一个五年规划纲要》(国务院2006年3月)

[3]《国家突发公共事件总体应急预案》(国务院2006年1月8日发布)

[4]《“十一五”期间国家突发公共事件应急体系建设规划》

[5]《国务院关于加快气象事业发展的若干意见》(国发[2006]3号)

短信技术篇7

关键词：垃圾短信,文本过滤技术,分词,贝叶斯分类

一、目前现状

目前移动电话在我国正以超乎寻常的速度发展着, 根据信息产业部2006年10月24日的统计显示:到2006年9月底, 全国手机用户超过4.43亿户, 平均约每3人拥有l部手机。据统计截止到2006年9月手机短信发送量也达到3104亿条, 同比增长42.1%。手机短信发送量的增长伴随而来的就是日趋泛滥的垃圾短信充斥着我们的眼球。大量广告、诈骗性质的垃圾短信就像“牛皮癣”一样, 到了必须根除的时候了。

近年来, 人们希望通过各种方式杜绝垃圾短信, 垃圾短信过滤研究也就越来越迫切和深入。目前, 垃圾短信过滤主要有以下几种过滤技术:黑名单和白名单技术, 关键词语的匹配法和贝叶斯推理过滤法。

本论文是借鉴了在垃圾邮件过滤技术中经常采用的文本过滤技术, 并结合分词和贝叶斯分类, 实现手机垃圾短信的识别, 进而为垃圾短信的过滤服务。

二、研究内容

1、手机短信中词的匹配

目前的过滤技术大都是用词库对样本中的词进行匹配, 根据匹配程度或进行加权求和, 并利用这个和值进行过滤, 或含有个别敏感词就过滤该短信, 针对不同的反过滤策略, 出现了关键词替换表, 如拼音替换表, 向形字替换表, 同音字替换表, 如果一种匹配策略失效后, 就可以根据这些表进行其它方式的匹配, 可能产生对多个表的扫描, 虽然使词的匹配具有一定的灵活性, 但却是用时间换取了精度, 为了减少匹配时间, 本文提出了基于Hash技术的匹配算法。

2、手机短信词库的智能更新

目前过滤技术大都是以现有的关键词库为依据进行过滤, 关键词库的创建或更新主要是靠人工操作实现的, 手动添加新词或是用新词替换旧词, 所以对不同的反过滤策略的适应能力差, 现在常用的过滤方法是Byase, 它计算速度快、精确性高, 因此可以将单个词本身就看成一个样本, 将Byase的归类思想用于对词库的自动更新, 用分析产生的结果作为词的附加属性, 这个属性一方面用于以后的词库的更新, 一方面用于以后信息样本的分析依据。

3、样本的分析

以往的样本分析都是选择能够提供大量信息利于分类的词作为属性, 这样作可以降低文本向量的维数, 加快分析速度, 但是提供信息少的词可能更具有类区别能力, 因此用信息量大的词进行归类可能产生局部解, 并使分析结果的可信度降低。要提高分析结果的可信度, 可以把降维时产生的中间结果作为词的权值, 将它与词归类的风险值、词本身的匹配程度一起作为词的属性, 这样可以从多角度同时分析样本, 提高分析的可信度。

三、关键问题

1、确定词的风险系数

对词集进行降维, 用提供最多信息的词分析样本的时候, 忽略了提供信息少的词可能更具有类区分能力, 因此在词库的智能更新时, 考虑如何利用Byase过滤思想避免这种风险, 使分析更具全面性。

2、词的匹配

针对不同反过滤策略维护了若干关键词替换表, 处理速度可能因此下降, 因此考虑如何将现有的关键词替换匹配算法与Hash表的查找速度快结合起来, 添加词的匹配信息以减化匹配过程。

四、研究方法

1、用Hash表进行词汇匹配

哈希表是一种高效的数据结构。它的最大优点就是把数据存储和查找所消耗的时间大大降低, 几乎可以看成是常数时间;而代价仅仅是消耗比较多的内存。然而在当前可利用内存越来越多、程序运行时间控制的越来越短的情况下, 用空间换时间的做法还是值得的。另外, 哈希表编码实现起来比较容易也是它的优点之一。用Hash表存储词库, 词的Hash值作为它在表格中的位置信息。词匹配时先计算它的Hash值, 如果不与表中该位置的词完全匹配, 则进行关键词替换后的模糊匹配, 该词用作找到的每个词的模糊匹配信息, 以后通过查看模糊匹配信息来加快匹配速度。

2、用贝叶斯思想更新手机短信词库

贝叶斯分类具有如下特点: (1) 贝叶斯分类并不把一个对象绝对地指派给某一类, 而是通过计算得出属于某一类的概率, 具有最大概率的类便是该对象所属的类。 (2) 一般情况下在贝叶斯分类中所有的属性都潜在的起作用, 即并不是一个或几个属性决定分类, 而是所有的属性都参与分类。 (3) 贝叶斯分类对象的属性可以是离散的, 也可以连续的。

用Byase分类中的概率计算方法, 计算每个词归到不同类的概率, 文献[4]中为解决过滤中误判代价不对等问题提出如下解决方法:只有P (判断为垃圾短信) /P (判断为正常短信) ≥阀值C时, 才判断短信为垃圾短信。样本训练时可以这样理解这个商值, 每个词是等可能地出现在每个类中, 样本中人工分类错误率很小可视为零, 这样可以认为其出现概率即为归类概率, 而将它归属到其它类就会存在一定的风险, 故归属其它类的概率P=样本在该类出现的概率×误判风险, 风险值越小则样本出现在其它类的可能性越小。更新词库时, 可以将词看成上述描述中的样本, 取最小风险值作为词归入到某类的风险, 用它作归类时的权重属性。

五、结论

现在普通使用贝叶斯算法和关键词词库作为过滤依据, 词库的创建与更新主要是手动进行, 不法分子一旦掌握词库便可以采取不同的反过滤手段, 所以过滤系统的适应性差。大多数据过滤系统都用降维方法减少数据量, 选取能够提供最多信息的词作为文本向量的分量, 但是提供信息少的词更具有类区别能力, 为使分析准确率提高, 因此不将词集降维, 而将降维分析的结果用作词的权值。本研究将贝叶斯分类思想与降维方法相合, 提取词的特征属性, 以保证分析结果的可信度。

参考文献

[1]张伟, 王子轩.GSM垃圾短信过滤方案[J].电信快报:网络与通信, 2009 (3) :26-28.

[2]胡日勒, 蔡洁, 钟义信.短信过滤系统设计分析[J].计算机应用研究, 2009, 25 (3) :2557-2560.

短信中心云化技术分析及解决方案篇8

作为当今最为热门的技术之一，云计算技术目前处于发展阶段并正在逐步形成成熟的产业链。在不久的将来，云计算技术将对中国电信的各个业务领域产生巨大的影响。因此，发展云计算技术对中国电信具有非常重大的意义。

中国电信于2010年启动了云计算现场试验，在IDC及业务平台建设引入云计算技术，各省逐步建立云计算资源池，对关键技术进行了验证，并将云计算与业务平台整合相结合，实现了云计算平台的规模化部署，在云计算领域积累了一定的实践经验[1]。2012年电信某省公司响应集团要求，开始进行大型关键业务平台云化现场试点，SMSC是本次业务平台云化试点中的重要组成部分。本文主要针对该省公司本次的SMSC云化试点，介绍了该省公司SMSC网络的现状、云化部署、相关测试情况及结果等，为日后其他平台的云化提供了一定的参考依据。

2 SMSC现状

电信某省公司共有四套C网短信中心，其中SC1与SC2、SC3与SC4形成双网双平面，对业务进行全程保障，确保实现无缝容灾。C网短信中心双网双平面组网如图1:

3 SMSC云化

本次短信中心云化主要采用IaaS的服务模式进行承载。IaaS服务模式是云计算三大服务模式(SaaS, Iass, SaaS)之一。Iaa S模式所提供给消费者的服务是对所有设施的利用，包括处理、存储、网络和其它基本的计算资源，用户能够部署和运行任意软件，包括操作系统和应用程序。消费者不管理或控制任何云计算基础设施，但能控制操作系统的选择、储存空间、部署的应用，也有可能获得有限制的网络组件(例如，防火墙，负载均衡器等)的控制。

短信中心组网图如图2:

短信中心的网元设备有：信令前置机、操作维护台、业务处理机、SMPP服务器、计费服务器/数据库服务器、查询分析服务器QAS、操作维护服务器和相应的网络设备。

信令前置机：提供短消息中心和PLMN网络之间发送/接收短消息的信令通道。

操作维护服务器：操作维护台通过OMM服务器实现系统的操作与维护。包括：业务观察、话务统计、性能测量、故障跟踪与定位、系统监测与告警、计费等。

业务处理机：完成短消息的接收，存储、转发、自动重发、用户数据管理、短消息数据管理等核心业务功能。

SMPP服务器：完成SMPP标准消息和系统内部消息之间的转化，对接入的ESME进行管理和业务量统计，过滤ESME的业务消息。

计费服务器/数据库服务器：短信中心通过计费服务器连接到计费中心，传送话单。

其中，信令前置机不能云化，其余的网元设备均可以云化。电信某省公司SMSC本次现场云化试点根据集团需求，初步采用部分云化的方案，在原有SMSC平台基础上扩容建设试点SMSC的云集群，把SMSC的业务处理机模块部署在资源集群的虚拟机上，其他统计分析等模块部署在PC服务器上。形成物理机和虚拟机的混合组网模式。

4 SMSC云化测试及结果分析

本次短信中心云化试点，在实验室进行了相关功能的测试验证。测试在对短信中心的基本业务、基本功能、性能以及网管和操作维护系统测试等进行了测试，其中，基本业务测试、基本功能测试以及网关和操作维护系统测试均为短信中心的常规测试，对于云化前后，业务并没有影响。因此，本文主要介绍云化短信中心的性能测试。测试整体组网图如图3:

其中：业务处理机1和2为本次云化的业务处理机，业务处理机3为原来的物理业务处理机。本次云化短信中心的性能测试主要分为短消息系统总处理能力测试以及云化业务处理机容灾测试。

4.1 短消息系统总处理能力测试

(1）忙时系统处理能力测试

测试组网图如图3所示，通过信令前置机模拟器模拟信令前置机，向短消息中心大批量提交短消息并接收，消息平均长度为40个字节，模拟短信中心忙时消息提交数，来测试SMSC忙时处理能力，此时观察信令前置机模拟器统计界面上的MO/MT计数，并观察短消息中心硬件指标(CPU占用率，内存占用率)，测试结果如下：

短消息中心处理速度趋于恒定、不小于中国电信要求(忙时系统处理能力不低于500条消息/s)的速度成功接收并下发短消息，信令前置机模拟器统计界面的MO/MT计数几乎相等并且各硬件指标均在允许范围之内。

(2）每接口每秒转发消息数测试

测试组网图如图3所示，通过模拟器模拟ESME，向短信中心提交短消息，逐渐增加每秒发起的条数直到达到系统瓶颈，来测试短信中心的忙时处理能力。

持续提交一段时间后，观察模拟测试仪器统计界面上通过SMPP提交的消息请求和应答数，达到稳定值后停止提交，记录下短信中心统计的每接口每秒SMPP消息处理数并观察短消息中心几个硬件指标(CPU占用率，内存占用率)，来测试测试SMSC对SMPP协议的支持能力。测试测试结果如下：

SMPP每接口每秒消息处理数符合中国电信要求，(发送请求消息数-接收消息响应数)/发送消息数<10-7各项硬件指标均在允许范围内。

4.2 云化业务处理机容灾测试

短消息中心的容灾解决方案主要分为以下两方面：

IASS云平台本身具有的容灾机制，可以保证某一台虚拟机在出现问题的时候，立即启用其他可用的资源代替，从而在硬件资源层面保证系统的容灾。

基于短信中心的双网双平面解决方案，同样也适用于云计算架构，根据广东电信现网情况，并没有改变原来的双网双平面系统，所以在应用层面能够保证系统的安全性。

(1）云化和非云化业务处理机容灾测试

实验室短信中心组网图如图3。业务处理机1和业务处理机2为两个云化的业务处理机，业务处理机3为原来的物理业务处理机，其余模块均正常运行。将物理业务处理机3关机来模拟宕机，测试云化业务处理机的容灾能力，测试组网如图4:

测试结果显示：云化业务处理机1、2将物理业务处理机3的业务接管，业务使用正常，并没有没有造成任何影响。

(2）云化节点之间的容灾测试

当短信中心只有云化的业务处理机1跟2的时候，将业务处理机2关闭，模拟宕机，观察业务的切换，测试组网如图5:

此时，短信中心的所有业务都被云化短信中心1所接管，业务正常使用，没有受到影响。此时逐渐恢复业务处理机2和3，短信中心工作逐渐恢复正常。

4.3 测试结果分析

本次测试主要进行了短消息的基本业务测试，功能测试性能测试及网管和操作维护测试。

其中，基本业务测试主要包括本地MOMT测试和应用消息类测试等;功能测试主要包括了短消息的存储、转发、重发等基本功能测试;性能测试主要包括了系统总处理能力测试和业务处理机容灾测试两大部分;网管和操作维护测试主要包括了网管模块的性能、配置等测试。各项测试结果均达到预期，验证了短信中心云化后的功能，实现了本次测试的目的。

5 结束语

随着IT技术的演进，基础架构方面也在推陈出新，伴随虚拟化技术的不断成熟，云计算也发展到了新的阶段。作为IT技术最为领先的通信行业，云计算对中国电信的未来发展有着举足轻重的重要意义。因此，中国电信某省公司开始进行大型关键业务平台云化现场试点，本次SMSC云化试点作为本次业务平台云化的的关键部分，成功的验证了大型平台云化的可行性，对其他平台的云化建设具有很大的参考价值和指导意义。

摘要：近年来, 随着云计算技术的逐步发展推广, 大型业务平台云化成了必然趋势, 为了迎合这一趋势, 2012年, 电信某省公司开始了大型业务平台云化试点, 试点业务平台为CDMA短信中心 (简称SMSC) , 并在实验室进行了相关测试工作。

关键词：云计算,大型平台云化,短信中心,容灾测试

参考文献

时刻防备短信诈骗篇9

“我行从您卡中扣款1200元……”近日，北京市的王女士收到这样一条短信，让她感到十分惊讶。中国工商银行客服人员提醒，工行不会使用手机号码通知客户信息，用户收到此类短信，应向110报案，谨防上当受骗。

莫名的短信

2011年12月27日，北京市的王女士收到了手机号码“15673364482”发送的这样一条短信：“截止2011年12月27日，我行从您卡中扣款1200元，详情请与010-56230840联系（工商）。”

记者根据王女士提供的发短信的手机号码查询到，发信息的手机号码归属地为湖南株洲联通，而咨询电话则是北京的座机。

据王女士称，她确实有一张工商银行的储蓄卡，是单位办理用来发工资的，而每次发完工资，王女士都会第一时间把钱取出来，“卡里根本就没有那么多钱，从哪儿扣的呢？”这条莫名的短信，令王女士很是诧异。

无独有偶，北京市的李女士近期也收到了类似的信息：“建行通知:于2011年12月26日将在您账上扣除1200。详询联系0530-5018-305”。李女士说，她查询手机号码归属地，竟是湖南湘潭的，而咨询电话却是山东菏泽座机。“我根本没办过建行卡，扣哪里的钱呢？”李女士拨打咨询电话，并编了一个假名和假账号，对方却说“经查询，你办了一个透支卡，扣的钱是年费”。

而李女士的丈夫也曾在2011年12月26日和27日，两次接到相同内容的扣款通知短信，发来短信的手机号也是同一个。“我老公的工资卡就是建行的，接到这两条短信把我吓坏了，赶紧让我老公请假去银行查了余额。”李女士说，查询发现建行卡里的钱并没少，但为了保险，她已经让家人把钱全取出来了。

手机号码无人接听

2011年12月28日，记者根据王女士和李女士提供的短信提示，多次拨打发送信息的手机号，一直无人接听。

随后，记者分别拨打了短信中提供的咨询电话。电话“010-56230840”的接線员表示，她是北京市朝阳区安定门工商银行分行的客服，扣除的1200元是办理的信用卡年费，如有疑问须提供姓名、身份证号、手机号码等进行查询。

而电话“0530-5018305”的接线员是一名带有很浓南方口音的女子，她自称是山东省菏泽市牡丹区牡丹路建设银行信用卡客服中心。当记者否认曾在菏泽办过建行卡时，该女子说银行电脑不会随便乱发短信，需要提供姓名和手机号进行查询。记者随口编了一个名字，约半分钟后，女子称“你11月28日在我行申请办理的一张额度为10万元的信用卡，担保公司为万通贸易有限公司，卡号尾数为3987，扣除的1200元钱是该信用卡的年费。”

记者表示从未办过该卡也不认识担保公司，对方开始询问是否在建行办理过其他存取款业务，并索要账号及卡内金额统计。当记者再次否认后，对方匆匆挂断电话。

银行：会用统一电话通知客户

2011年12月29日，记者就此事分别致电中国工商银行客服热线95588和中国建设银行客服热线95533，得到的答案一致：银行不会通过手机号码给客户发送此类短信，也没有统一给客户发过扣费的短信通知。

此外，中国工商银行00199号客服表示，如果遇到此类情况，须向110报警。

随后，记者拨打110报警，接线民警表示，年末此类短信诈骗事件频发，如果遇到此类情况，要做到不听、不看、不信、不转账、不汇款，并及时向警方举报，谨防上当受骗。

短信技术篇10

关键词：垃圾短信过滤,Android,朴素贝叶斯算法

0 引言

自动高效的过滤垃圾短信是当前手机应用中必须解决问题之一。目前使用较多的垃圾短信过滤技术普遍缺乏自适应学习能力, 不能应对当前发展迅速、形式多样的垃圾短信。本文在规则过滤的基础上, 结合基于文本分类以及朴素贝叶斯理论的过滤方法对垃圾短信进行分类, 并提出了进一步的改善措施。

1 朴素贝叶斯算法

1.1 贝叶斯定理

贝叶斯算法是以著名数学家托马斯.贝叶斯 (Thomas贝叶斯) (1702-1761) 命名的一种基于概率分析的可能性推理理论, 通过分析过去事件的知识, 来预测未来的事件。贝叶斯过滤法对大量用户已经判定的垃圾短信和正常短信进行学习, 根据垃圾短信和正常短信中相同词语出现的概率对比来确定垃圾短信的可能性。

贝叶斯定理描述如下:

其中p (A) >0, 由全概率公式可得

在公式 (1-2) 中, p (Bi|A) 为后验概率, p (A|Bi) 为似然概率, p (Bi) 为先验概率。

1.2 朴素贝叶斯定理

朴素贝叶斯过滤技术以贝叶斯定理为基础, 并假定各个属性直接是独立地来进行预测, 把从训练样本中计算出的各个属性值和类别频率比作为先验概率, 然后利用贝叶斯公式计算出其后验概率, 并选取具有最大后验概率的类别作为预测值, 在垃圾短信过滤应用中有广泛应用。

设有m个样本空间{c1, c2, …cm}, 短信d中有n个特征项{w1, w2, …wn}, 对于给定的类ck (k=1, 2, …, m) , d属于类ck的概率为

由贝叶斯概率公式可得:

其中:

公式 (1-4) 中, p (ck) 为先验概率, 很容易计算, 但p (d|ck) 的计算比较困难。为了简化计算, 引入了条件概率独立假设, 即假定各特征项之间是相互独立的, 这就是朴素贝叶斯过滤器, 那么公式 (1-5) 就可以转换为:

其中, |Sk|表示类别ck中的训练文本数量;|S|表示训练文本集总数量。

在短信训练集中只有两个样本空间, 一个是正常短信, 另一个是垃圾短信, 所以对于样本空间m的值在实际应用中应为2。

1.3 朴素贝叶斯算法应用于短信拦截的缺陷

朴素贝叶斯文本分类算法:

p (ck) 为先验概率, p (d|ck) 为类条件概率, p (ck|d) 为后验概率。对于短信训练集来说, 朴素贝叶斯算法的样本空间只分为垃圾短信和非垃圾短信两部分。为了保证公平性, 训练集中正常短信的文本个数和垃圾短信的文本个数是相同的, 即p (cspam) =p (c1egit) , 对同一文本p (d) 不变, 因此后验概率的大小主要是由类条件概率决定, 但由于它过多的简化使用对于分类很有用的信息都丧失了, 进而使得分类效果不是很明显, 误判率难以降低。

2 朴素贝叶斯算法的改进

2.1 类条件概率

p (xi|cj) 为属性xi在类别cj出现的概率, 其中, N (X=xi, C=cj) 表示类别cj中包含属性xi的训练文本数量;N (C=cj) 表示类别中cj的训练文本数量;M值用于避免N (X=xi, C=cj) 过小所引发的问题;V表示类别的总数。

2.2 长度特征提取

每条短信长度为70个中文字符, 通过对短信长度统计, 得到如下结果。

从上图可以看出, 不同的短信长度所对应的为正常短信或垃圾短信的概率都有所不同, 因此, 垃圾和非垃圾短信在长度上有很明显的区别, 正常短信的长度一般集中在30个字符以内, 垃圾短信则集中在40~70个字符之间。对于70个字符以上的短信, 可能是祝福类的短信或者是手机通信套餐之类的短信, 这些都属于正常短信, 所以放宽了它的概率值。

2.3 改进的朴素贝叶斯算法

首先利用求得的正常短信中最大的p (xi|cj) 并将此概率对应的词语与垃圾词库中的词语相匹配, 如果匹配成功那么在得到的各个属性的总和的类条件概率的基础上再加上一定概率的值, 此值必须通过多次的测验来给出。以此来扩大相应类别的概率值, 避免出现大的错误率。经过调查发现不同长度的短信对应为垃圾短信或正常短信有一定的概率值, 因此, 当求得后验概率后还应加上相应短信长度所对应的概率来加大分类的精确度。

3 短信过滤处理过程及结果

算法改进后, 短信误判率明显降低, 测试短信数量及实际测试结果如表2所示。

4 结束语

本文针对传统的朴素贝叶斯算法对垃圾短信的分类精准度与识别率不足的确定, 提出了基于改进朴素贝叶斯算法的垃圾短信过滤技术, 该算法通过改进概率算法将朴素贝叶斯算法更好地适用于垃圾短信过滤器, 并且根据短信的长度, 在求得的后验概率的基础上提高一定的概率值, 降低正常短信被判为垃圾短信的概率, 从而最大程度减少误判率。

参考文献

[1]张东亮, 董礼.基于改进的朴素贝叶斯算法在垃圾短信过滤中的研究[J].计算机测量与控制.2012, 20 (02)

[2]丁岳伟, 潘涛.利用贝叶斯算法过滤报文内容分析系统中的垃圾短信[J].上海理工大学学报.2008 (01)

[3]郑炜, 沈文, 张英鹏.基于改进朴素贝叶斯算法的垃圾邮件过滤器的研究[J].西北工业大学学报.2010 (08)

【短信技术】推荐阅读：

春节短信送祝福-春节短信问候语-羊年春节短信07-23

立秋祝福短信-最新立秋祝福短信07-11

关心短信：关心男朋友短信08-12