Teradata

2024-09-09

Teradata(共4篇)

Teradata 篇1

1 Teradata的体系结构

自诞生以来, Teradata数据库经历了许多重大转变, 仅从版本号上看, 就从Teradata V1发展到了Teradata V2R4;从运行平台上看, 也从封闭转为开放, 由最初只能在专用系统上封闭使用发展到了如今可以在开放的通用系统上使用, 在设计上和实现上遵从非共享 (share nothing) 的体系结构。

2 Teradata数据库的数据分配机制

Teradata数据库采用哈希算法作为数据分配机制。将标的主索引作为哈希算法的输入值, 并且利用一个矩阵结构的HASHMAP, 将哈希运算计算出来的输出值通过此矩阵与系统中的各个AMP进行影射。

在Teradata数据库中, 用户与数据库是不一样的两个概念。

数据库是一个可管理的对象或者单元, 它由表、视图、宏等基本对象组成, 并有相应的访问权限来控制客户端的操作。与此同时, 数据库也常用来表示由RDBMS管理的整个系统, 因此容易引起混淆, 具体意义应根据上下文来确定。

数据库有一个重要概念——PERMANENT SPACE (简称为PERM SPACE) , 即永久空间。在创建数据库时, 需要定义其物理存储空间——也就是真正用来存储空间的上限——的大小, 这就是PERM SPACE。PERM SPACE虽然用来存储真正的数据记录, 但它只是一个逻辑概念, 并没有预先分配。当数据库的尺寸超出PERM SPACE的限制时, 有的数据库需要重新规划、分区之后再加载数据, 而Teradata数据库最重要和吸引人的特性之一便是它不用这样做, 只要系统中还有多余的空间, 就可以动态修改PERM SPACE值, 而不需做任何数据库重组的操作, 这对于数据库管理员而言是非常有意义的。

除了PERM SPACE以外, 数据库还有另外一个概念SPOOL SPACE, 它也是逻辑上的一个概念, 表示该数据库使用的SPOOL空间不能超过此上限。SPOOL空间用于存储系统处理交易请求的一些中间结果。和永久空间一样, SPOOL空间也不是预先分配的。事实上, 整个系统中的空余空间都可以用作SPOOL。

让我们举一个例子来说明PERM SPACE和SPOOL SPACE:假设一个Teradata系统所拥有的永久空间为2GB, 共有3个数据库A、B、C, 其永久空间定义均为500MB, SPOOL空间定义均为200MB, 实际已使用的空间分别为400MB、300MB和200MB。这样, 系统中尚未分配的永久空间为:

2000MB–500MB–500MB–500MB=500MB

系统中尚空闲的永久空间为:

2000MB–400MB–300MB–200MB=1100MB

A、B、C三个数据库尚能使用的永久空间分别为:

500MB–400MB=100MB

500MB–300MB=200MB

500MB–200MB=300MB

当某个数据库继续增长时, 比如往数据库A中再增加约100MB数据, 系统将提示空间溢出。此时, 可以通过MODIFY DATABASE命令从系统中尚未分配的500MB永久空间中分配一定的存储空间给数据库A。

另外, 对每个数据库定义了200MB的SPOOL SPACE, 表示在此数据库上的操作能使用的临时空间不能超过200MB。系统在处理交易请求时, 临时空间的使用是在什么存储位置, 则视实际情况而定。换言之, 系统中未分配数据记录的永久空间为1100M, 这些永久空间均可动态地被用作SPOOL SPACE。

对每个数据库定义一个SPOOL SPACE, 只是为了安全上的考虑, 防止不适当的数据库操作将系统中的未分配空间耗尽, 从而影响其它用户的使用。举例来说, 如果数据库A的SPOOL SPACE定义为1000MB, 针对数据库A的一个复杂查询可能没有设计好, 比如对两个大表的连接操作是所谓的笛卡尔乘积 (Product Join) , 这时A的SPOOL SPACE很快就会到达极限, 如果系统中能使用的SPOOL空间总共只剩下100MB, 而此时恰好有其它用户同时在访问数据库, 就一定会产生SPOOL空间溢出, 无法处理交易请求。因此, 在定义数据库时, 除了适当控制永久空间外, 也必须合理地定义其SPOOL空间。

创建一个数据库的命令举例:

CREATE DATABASE Test Base AS PERM=200000000, SPOOL=100000000;

该命令创建了一个测试数据库Test Base, 其永久空间定义为200MB, SPOOL空间不能超过100MB。注意, 在Teradata数据库系统的缺省方式下, 是不区分大小写字母的。

3 拥有者与创建者

拥有者也称为父辈 (Parent) 。我们知道, Teradata数据库系统的空间分配是一种如图6-2所示的层次型结构。在这样的结构中, 一个对象是其下面所有对象的拥有者, 而一个对象由谁创建, 谁就是该对象的创建者。

DBC是所有其它对象的拥有者, 而所有这些对象都是DBC的后代或孩子。ADMIN是其下面所有对象的拥有者, 但与Sys Admin、System FE等无关。同样, USERADMIN拥有用户USER1、USER2、...、USER9, 但不拥有APPL1、APPL2这些结构上与其无关的对象。对用户USER1来说, USERADMIN、ADMIN和DBC均是它的父辈。由此可见, 一个用户或数据库可以有任意数目的父辈, 也可以有任意数目的后代。

拥有权并非一成不变, 可以在一定的条件下进行转让。例如, 通过DBC或ADMIN登录系统, 可以将APPL1的拥有权从ADMIN1转让给ADMIN2。转让命令为:

GIVE APPL1 TO ADMIN2;

当然, 这要求发出这条命令的用户具有在ADMIN2下创建用户的权限。需要注意的是, 拥有权可以转让, 但创建者是不可以改变的。换言之, 一旦一个用户A创建了另一个用户或者数据库B, 那么A就永远是B的创建者。

摘要:Teradata数据库自发明至今已经经历了许多重大转变, 已经从版本1 (TeradataV1) 发展到了目前的版本2 (TeradataV2R4) , 运行平台也已经从封闭的专用系统转变到了开放的通用系统, 但是最基本的体系结构是一致的, 始终遵从非共享原则。主要体系有单点SMP体系结构, 多节点MMP体系结构。

关键词:Teradata,数据库,数据分配

Teradata 篇2

数据社会化

“数据社会化(Socialization Data)”是此次Teradata用户大会的关键词之一,究竟什么是“数据社会化”呢?数据社会化是指集成传统及非传统来源的数据,从而展现企业在全球市场、社区或生态系统中更为全面的定位情况。

Teradata业务拓展与市场营销执行副总裁Darryl D.McDonald解释说 :“在Web 2.0时代,收集数据的渠道和数据的来源越来越多,绝不仅限于公司内部,而是越来越呈现社会化趋势,譬如RFID、智能设备、传感器、社交网站等,要想把这些杂乱无章的社会化数据与公司的客户、供应链、销售业绩、合作伙伴等商业信息联系起来,并从中发现有价值的信息,就需要社会化BI。”Darryl D.McDonald认为,社会化BI可以驱动企业的创新,并由此塑造出自身与众不同的竞争优势。

Darryl D.McDonald还在大会上播放了一段视频《美联航弄坏吉他》,这个经典案例从一个侧面描绘出了什么是社会化BI。

2009年,加拿大乡村歌手戴夫•卡罗尔乘坐美联航的飞机,结果他那把价值3500美元的吉他在托运时被弄坏了,但美联航却以种种理由推卸责任,或者拖延时间。后来,卡罗尔创作了《美联航弄坏吉他》这首歌,他以幽默的口吻叙述了事情的经过,并且还拍了个更有趣的MV,并把这个MV放在了YouTube上。结果,卡罗尔和他的乐队“麦克斯韦之子”迅速“火”了,专辑销量大幅提升!甚至有其他航空公司主动联系到卡罗尔,向他提供免费旅行。泰勒吉他的老板亲自打电话给卡罗尔,要送他两把吉他,就连美国脱口秀女王奥普拉•温弗雷都向他们发出了访谈邀约。网友们在观看了MV后,纷纷发表评论批评美联航,美联航形象受到影响,而且非常巧合的是,就在这段时间内美联航的股价下跌10%。

Darryl D.McDonald认为在Web2.0时代,网络关系对于企业至关重要,因此绝不能忽视这部分数据的收集、分析和利用。譬如:零售商可以通过客户的实时评论与投诉,来降低联络中心成本并提高客户满意度;电信公司通过“客户之声”应用程序来掌握客户关系管理信息,从而帮助降低客户流失率,并缩减呼叫中心的成本。

完整的企业生态系统有多个信息入口,譬如:互联网、社交网络、Email、呼叫中心等,其中还包括很多诸如图片、音频、视频等非结构化数据。“对于数据仓库而言,如何合法收集非结构化数据,并对其进行数据分析,依然是个技术挑战,将非结构化数据转化为结构化数据的技术很复杂。”Teradata公司首席技术官Stephen Brobst说,Teradata公司正在致力于研究非结构化数据,希望能为用户提供结构化与非结构化整合在一起的数据分析。

当前,已经有一些企业开始了它们的社会化数据之旅,洲际酒店集团就是其中之一。他们基于苹果的iPhone开发了一种应用,酒店的客人们通过iPhone就可以非常方便地完成酒店预订等商务活动。据统计,这个新渠道开通之后,洲际酒店集团通过移动终端进行预订的收入达到250万美元/月,比去年增长了400%。社会化数据的效益不容小视!

应对PB级挑战

“Big Data(大数据)”也是此次Teradata用户大会的关键词之一。Big Data是指某个数据存取点的数据量非常之大,以至于利用常规的软件工具已经难以对其进行搜集、管理和加工了,其数据规模往往达到了PB(1024TB)级。例如,AT&T公司每天传送的数据量高达19PB。常规技术已经难以应对PB级的挑战,要对如此大规模的数据量进行高效处理需要一些特殊的技术手段,诸如:MPP(大规模并行处理)数据库、Hadoop平台、云计算平台、网络存储系统等。

在技术方面,Stephen Brobst认为,此次用户大会有一大技术亮点,就是Teradata与开源架构Hadoop实现整合。“Hadoop是一个知名的开源架构,可以更容易开发和运行处理大规模数据,最早由Google发明出来。被中国企业广泛采用,包括中国移动和一些大银行在内的很多中国客户都在使用Hadoop,把Hadoop整合到Teradata数据库之中,可以基于此开发出更适合中国用户需求的解决方案。”Stephen Brobst介绍说。

谈到云计算,Stephen Brobst认为,“私有云在未来的3〜5年将会有巨大的发展,很多企业在目前大力发展企业内部的云计算环境,Teradata则能凭借虚拟化技术、硬件存储功能、可扩展性为客户提供全面的解决方案,Teradata用户现在就可以使用云计算。”

专注数据仓库30年

从1979年成立至今,Teradata始终专注在数据仓库。今年,Teradata还入选了“2010年道•琼斯北美及全球可持续发展指数”。

Teradata总裁兼首席执行官 Mike Koehler称,“在公司运营方面,Teradata一直重视四大领域的投入:一是技术研发,今年上半年增加了20%的研发投资;二是专家顾问服务,扩充了30%的专家顾问;三是合作伙伴和解决方案;四是客户服务,全球客服队伍扩大了20%。”

谈及中国市场,Mike Koehler说:“中国市场是Teradata实现业务增长的重要机会,在过去的三四年中,中国市场是Teradata全球增长最快的两三个市场之一,并且这种状况仍在持续。”Teradata大中华区总裁辛儿伦介绍说,除了传统的金融、电信行业外,制造、政府、航空等行业都是Teradata在中国市场重点拓展的领域。另外,Teradata在北京的研发团队已经有了200多名工程师,从研发团队也可以看出Teradata对中国市场的重视。

链接

Teradata新产品速递

在本次数据仓库用户大会上,Teradata发布了一系列新产品和解决方案:

Teradata数据库13.10

这是首款时间感知数据仓库,拥有时序分析功能,有助于客户更轻松地理清企业业务交易及活动的历史脉络;采用增强型压缩技术,具备高级压缩功能,可从容应对多达 20 倍的大数据需求;采用Teradata 开放式并行框架,可快速添加旨在支持复杂并行分析的新嵌入式服务。

统一逻辑数据模型架构和产品组合

Teradata统一逻辑数据模型(Teradata Unified LDM),可以使企业的业务流程模型化,可快速构建业务分析解决方案,全面查看企业业务。

Teradata新增数据仓库专用平台系列产品

(1)Teradata动态企业级数据仓库5650,性能提升43%;

(2)Teradata超高性能专用平台4600;

(3)Teradata数据仓库专用平台2650,集高性能和易用性于一体;

(4)Teradata巨量数据专用平台1650,性价比高和扩展性强;

(5)Teradata数据集市专用平台560,将入门级性能和容量推向新高度。

Teradata加速分析解决方案(Accelerated Analytics)

提供全面的高性能分析工具,以Teradata独有的云技术为驱动力,为业务决策提供支持;包含如下功能:应用开发、时间感知(Temporal)、分析功能、处理大量数据的功能、地理空间技术、联机分析处理(OLAP)优化、数据浏览等。

地理空间智能服务

Teradata 篇3

本届峰会云集了大中华区和全球电信业、银行业、保险业、邮政业、制造业和电子商务等领域的领导厂商、Teradata的合作伙伴和Teradata的高层主管。与会者将通过业界领导厂商的真实案例, 了解如何运用数据仓库和企业级分析技术协助企业更快、更好地制定决策, 成就“睿智无限”的商业智能, 赢得领先的竞争优势。

通过与业界领先的厂商建立广泛密切的合作, Teradata致力为客户提供更高的数据仓库投资回报率。最近, Teradata与世界领先的商务软件供应商SAP AG达成新的合作协议, 将携手为客户提供基于Teradata数据库平台的SAP NetWeaver R商业数据仓库解决方案 (SAP NetWeaver BW) , 满足客户期望获得访问详细企业数据的更快速的、统一的途径, 以获得更佳商业可视性的需求。双方将通过此次合作共同提供无缝集成的可扩展的解决方案, 协助客户将数据整合到同一个数据库平台上, 降低总体拥有成本。

此前, Teradata还联合SAS推出了联合优势计划, 帮助企业在Teradata企业级数据仓库环境中更快速、更高效地应用SAS市场领先的软件。该计划则是双方总体战略合作伙伴关系的第二步, 未来双方将继续致力为客户提供快捷的分析洞察力, 帮助客户更敏捷地响应市场环境变化。

Teradata 篇4

通过对客户的新增来源和离网去向进行分析,找出了绝大部分客户的来源和流向,进而引发该省运营商认识到其客户发展过程中存在的十大问题。例如,某地市客户入网后当月离网的客户占比在50%以上,而且这些客户的入网渠道大都集中在某几个指定专营店;某个以农业为主要产业的地区,新增用户并且经常在城市通话的客户数是新增并且经常在农村通话客户的多倍;某地区重入网用户比例偏高等。

引发发展策略研究

新增来源和离网去向分析发现的十大客户发展问题,引发了该省公司对于其客户发展策略的研究,主要从品牌形象宣传、资费策略、渠道管理、客户忠诚度计划,农村市场等细分市场发展等方向入手,研究现有策略的市场有效性,根据客户的行为表现,对部分策略做适度调整。

重视增强精细化执行手段的研究与实践

【Teradata】推荐阅读:

上一篇:甲醇储罐区下一篇:天线偏向开关

本站热搜

    相关推荐