国内云计算和数据中心领域最具规模和影响力的标志性盛会,第十二届中国IDC产业年度大典将于12.21-22日在国家会议中心举行。在昨天的主会场上,多位领导及嘉宾对目前数据中心整体市场进行了分析与点评,在今日的数据中心技术创新分论坛上,多位嘉宾将会对数据中心的技术创新进行分析与解读,让我们共同迎接今天的数据中心技术创新分论坛。
国内云计算和数据中心领域最具规模和影响力的标志性盛会,第十二届中国IDC产业年度大典将于12.21-22日在国家会议中心举行。在昨天的主会场上,多位领导及嘉宾对目前数据中心整体市场进行了分析与点评,在今日的数据中心技术创新分论坛上,多位嘉宾将会对数据中心的技术创新进行分析与解读,让我们共同迎接今天的数据中心技术创新分论坛。
中国IDC产业年度大典作为国内云计算和数据中心领域规模最大、最具影响力的标志性盛会,Infortrend大中华区总经理杨文仁出席此次会议,并发表《混合云应用与数据中心》主题演讲。
以下为Infortrend大中华区总经理杨文仁演讲实录:
我今天过来主要要分享一些混合云,数据中心里软件怎么去实施,怎么去落地。
第一,混合云,重新定义数据中心服务。混合云是混合哪些云?公有云、专有云、行业云、私有云、数据中心也是一种云。定义它是重新把不同的云串连起来,怎么利用不同云之间的优点、缺点构建数据中心的应用。
这张图讲得比较落地一点后面会有几个案例分享,混合云在数据中心里面是这样的架构。我相信这两天有很多的会议应该会讨论到类似这样的产品架构,你看到右边所谓的公有云,你看到它跟下面的这块架构会很像,公有云有一些读取计算能力,有对象、存储、数据库。下面这块在每个数据中心都非常常见,你会看到虚拟化,有微软、Infortrend、开源的。Infortrend是长期耕耘在数据存储的厂商,是一家上市公司,我们着力点在这样的混合云里面怎么去帮助混合云落地。你会看到左边这块,这个数据,我们让它可以跟公有云这边互相来对接,如果你从线下IDC的数据机房,你会看到下面的这些设备,它是可以直接使用到,而且连接到公有云里面。从公有云的角度会把公有云的资源落地到IDC的数据中心,那这块是近期我们在国内碰到比较多的一些需求,就是这样的架构里面延伸出来的。你看到各省政府建了很多云,当然也希望要求各省下面的单位开始使用云上的资源,这样的冲突最近很多,它建了一堆数据中心,下面有排斥,我们把线上的云,延伸到地级市里面的数据中心里,你不需要把所有的数据、所有的应用直接部署在云上面,而是直接部署在IDC,你的数据中心里,你既然要使用云,那跟你的数据中心里面的某些协议又要对接,因为你的数据中心原来是光纤,可能是NASA,或者是像超算的,这些协议要透过一台设备转接到云里面,两边的数据,两边的资源才能真正共享,这是我们在数据中心里面架构的一个产品。
第二张图,你会看到混合云无论是线上的公有云,还是私有云,你会看到它混合云改变了原来的IT三大件的使用和采购的整个环节。原来你会看到一堆预算列出来,可能这个项目采购的是一堆交换机和存储,当然都需要参考需求、预算、招标。当你导入整套线上、线下的云,改变其他的使用流程,你不需要买任何硬件,而是使用它。你选择系统里面多少计算资源,多少内存资源,多少存储资源,拉一拉,你的整套系统就可以部署。它会延伸什么问题?你会发觉你今年用的预算比以前来得高很多,而且超出很多,这个已经在发生这不是一个大家讲的计划,我们看到了像阿里去年应收六十几亿,国内已经很多很大型的客户都部署到云里面,年底结算下来它的费用比预想的高。用量一大,数据一大,的就有成本的考量,数据安全的考量,它要往下面来移,我们就要解决这中间怎么做数据,不只是数据,是应用、数据怎么搬迁,把它买回去到下面来,那这块是我们在着力的地方,这是第二个我们看到它的架构。
这张图会看得更仔细,下面会有不同的计算,或是不同云之间的应用。你看这边是公有云,你会看到中间这块会有(英文),最左边会看到传统的XEU,这些都可以把它混合成一个混合云,上端开始做应用管理,上端三部分会从三个角度来看第一是用户端架构好,去使用这些存储、计算资源,中间这块运维的人,就要满足这些使用者,要多少计算,要多少空间,它分配给它,当然以决策者来讲,他要看的是下面那么多云,到底是买物理机好,上公有云好,还是架构私有云,私有云里面,你看商业化,还是看一些(英文)消耗资源是多少,它可以比较出哪家共有云,阿里也好、腾讯也好,价格是多少。我在上面的成本核算出来多少,比对下面给出一个决策,我哪些应用应该放在哪些云。这些云可以让你自动迁移。今天讲的东西是离计算比较远的东西。
我们再讲刚刚这三个PPT,再延伸下来我们如何把它优化。
你会看到这张是第一个架构,左边这块是一个硬件设备,它不是服务器,任何商业化的东西不是开源的东西,它是一个商业化的设备,所有理念都是以嵌入式来提供的。刚刚有提到数据中心的节能,这台设备16个盘,一万转,在中国移动里面的测试能耗只有202瓦,那相当的低。这台设备扮演什么角色?当然它跟云端不是一个复制的概念,如果复制,你会看到外面一堆产品都有,很多网关会做复制跟云端怎么资料同步。这台是把云模拟到线下,所以它有三个模式可以做,一个是当缓存,数据都是在云端,使用都在现场的IDC里面,这应该比较好懂,你会看到家里的机顶盒,为什么有机顶盒,当作缓存先下载下来不会有延时,就如同我们现在整个存储系统会有内存一样,先到缓存再到云上面。
本地使用就不会有网路中间延迟的问题,近端你会看到这张图,它对现有的一些IDC的架构不需要任何改变,就可以把现有的数据开始使用云上的空间,使用云上的资源,如果它原来是FC就直接上FC,它整个架构就会跟云做对接。如果它原来是IP也不需要改变,我刚才提到,类似像SaaS、NaaS也好,这些都只能在一台机器地,这台机器扮演的角色就是不同的协议之间要把转换成云使用的协议,使用对象的协议。对象有它的优点也有缺点,跟原来传统数据中心的架构还是有差异的。以这样的方式就可以在这台机器里,如果要设一个(英文),其实这个(英文)可以是云上的目录,你使用的只是云上的目录。
我刚才提到很多各省厅在建云的时候,怎么让它的省里面的云用起来,到地级市以后,地级市使用IT设备,就无性中把云上的IT资源,不需要改变架构直接用起来。
第二个就是分级模式,一看题就知道它是混合线上先下所有的空间和数据,这些数据会依照读取的次数,或者你设定的时间阶段也好,它会自动把数据分布在云里面,还是说分布在近端里面。
第三个就是所谓的同步模式,云可以当作两地三中心的第三中心,你不需要耗费另外一个资源再建一个数据中心,只需要当备用,你可以轻易地跟公有云厂商租用一个空间,把它当作一个容灾的地方。备份是把资料备份到上面,你会看到云提供另外的计算,它可以做到高可用,做到容灾,上面的应用碰到整个系统,它可以在上面有虚拟机把它提取,它可以接管整个应用,因为它同时在连线阶段,是这样的一个云跟线下的架构。
我们再看这套云,我们呈现的东西不是服务器,它是嵌入式的设备。你看右上角这块,它的架构里面是(英文),在运算所有的IO,各种协议要配合不同的硬件,光纤需要有光纤的通道,你不需要更换设备,因为它里面是一个可以移动的通道,更换不同的光纤。你可以看它的延迟率相当的低,所以特很适合在一些视觉系统,尤其是最近的一些人脸识别,如果你要跑NaaS,你可以更换一般IT,可能是万兆光口的,或者是电口的协议,直接在上面来跑。所有控制节点里面每一台GS,我们想到混合云,它都是互相在做资料的同步,跟云之间是另外一个协议,彼此之间通过缓存,或者的缓存会做同步,所有的状态会做同步,所以它有高可用,它不会有单点故障。当你更换新的设备,新的设备进来,旧的设备的配置也会同步到新的设备里面来,当然下面的对策是在跨协议讲的,它是可以多个控制器,同时在读写一个,所以平时它的性能会增加,当它碰到物体的时候它可以做高可用来接管这样的设备,这跟云之间就开始有不同的文件、数据切片的协议,来做到这样的架构。
刚提到这里面那么多数据在里面跑,会用到缓存,用到固态盘,那它里面的保护措施是用超级电容,不是外面的UBS,或者是BBU,所以我们在国内很多军工集团,在合作的产品里都有这样的产品,因为它适合在移动的设备,移动的设备就是潜艇、飞机,因为这上面不允许有像类似锂电池这样的,包括我们近期在夺的一些高铁项目,上面的数据采集也都是这样的设备。你会看到超级点虫用在卫星,因为卫星的供电量是有限的,它不是在每个数据中心里有一堆直流电源。
当然线上是公有云,线下是很多私有云跟超融合。怎么真正让它落地下来,它不是单单一个口号,也会看到国内很多厂商,可能三年前是分布式厂商,去年他又变成是一个超融合的厂商,它今年可能开始讲它是一个AI人工智能厂商,其实他在做什么,他自己都不清楚,他一直在跟着跑,这是没有价值的。讲到线下的超融合,当然也很多国内、国外的厂商在做,我们做哪一块,因为线上的计算,我们讲的虚拟机这一块,很多人做得很好,当然主流就是我刚刚提的,这块不是我们在着力的地方,我们着力的地方看到超融合碰到什么问题,我们有没有办法去解决这个问题。
我们看到所有现在在推超融合的厂商,它面临的问题就是说它的超融合存储、IO的性能跑不起来,所以这样的超融合只能当备份用。我们是在超融合的VM里面放了一个Infortrend的算法在里面,它叫CVM,它的做法就是每个CVM下面可以挂,现在我们的产品系列里面最高等级,一个CVM可以挂一千六百个盘,是很大的盘。你可以看到它是两个两个做副本,可以确定上面的数据是高可用。解决了几个问题,刚刚讲到最近在数据中心里面会提到分布式,如果真的你有去切入到分布式的话,如果它跑起来是十几个节点、二十个节点,问题不多,当大的节点一大,像优图节点可能是几千个,你会发现它下面的硬盘可能就几十万颗,它会发现系统开始不稳定,而且可用性不,原因在于一堆硬盘的管理会占用上端CPU的资源。CPU本来是给应用的,结果都被拉去管理这个硬盘。以分布式来看,它的价值就在于一堆副本在一堆硬盘里做迁移,做搬迁,耗掉一堆CPU,耗掉一堆交换机上面的资源。我们这样的架构实施起来,所有的数据在底层自己交换掉,它不需要到交换层,不需要到CPU里面,现在一颗(英文)的CPU,我们大概用到(英文)就可以管理一千五百个硬盘。也就是说它原来是几万块的硬盘,缩减到现在只有二三十九快的大硬盘,每个硬盘都是我们认为的两个T那么大,结果它占了整套系统可用性相当高。这个应用在分布式里面是这样用,用在超融合也是这样用,用在混合云也是这样用,这是基本的一些产品设计的架构。
因为分布式在数据中心的架构比较久,近期的状况就是一堆大型的分布式如果碰到数据中心系统的可用性问题,我们的方案,我们的产品导入的速度就相当快,整个核心在于这块,你会看到每个介质,同时都会存在,谁也取代不了谁,所以为什么要混合云,混合云会不会取代某些线下的一些存储设备,服务器设备,会,而且取代的速度相当快。我们看到的是说,云上的应用发展得很快,国内的阿里速度相当快,问题是它能不能全部期待,没办法。因为每个介质的特色不一样。从这点你会看到内存也是存储,它的问题就是快,它只要一没电,资料就不见。它的优势在哪里?它跟第二层的固态盘,我们的技术在于,在预算IO下来的时候,在内存做拦截,做取用,做分析,做比对,然后百让它落到盘,落到盘前处理一堆的IO,因为后续的SSD有它读写的次数。每个介质都有它存在的价值,也有它的特色,我们是怎么把它应用起来的。
你会看到这些案例都已经在使用了,它不是我来讲方案,这是在使用,当然这些案例都是我们跟阿里巴巴一起完成的项目跟案例。这是浙江,你会看到里面的配置在现场有X光机、核磁共振机,这些机器不可能搬到阿里的机房,它为什么用到阿里的机房,因为阿里的机房可以用大量的计算做图形比对,它有大量的GPU运算。讲得比较简单一点,现在大量的搜集各个医院的病例,搜集完了以后,每个医生的注解,从一片、两片,累计到现在几亿片,几亿片里,我下一次再拍一个片,系统到云上面一比对,有一万多张98%是雷同的影像,这一万多张先前被判定什么病,几率多少它就写出来,片子越高准确性就越高。
它怎么让这个系统搬迁到云端,这台设备可以当作像(英文),一台车出去把它迁到里面,然后再往里面倒,倒完以后后面就是增量,你会看到这家医院里面的数据,现在线上已经有几亿个档案在里面,单单线上查几亿个档案,我们下一个场面,如果没有这套系统你可能跑几个小时,跑不出什么东西来。怎么把Infortrend放在线下里面,然后找到它要的东西以后,再把相关的数据留下来,这是整套系统的架构。
接下来会看到零售业,这些零售里面一堆影像会在店里面被截取出来,截取出来以后,再同步到网路上,开始做各个点、各个行为、各个特征的识别,然后反馈给系统来讲每个人的购物行为。
当然你把它导到一个智慧城市的视频系统里,你就很容易懂,现在这是属于中低端的机器,GS2000,它直接放上摄像头,只要把这台机器放里面,不用装任何动它会把影像前部都截取到这台机器来,这些影像就会同步到云端里面,那云端做什么?还是做人脸的识别,这样的系统已经建构完成了。同时它跟现有的这些系统有什么不同?它同时间还可以回放。现在公安破案大部分说两百个人找电脑把这些档案一路一路回放,找到对的人。后续不用那么多人找,你只要把图象放进来,系统会帮你比对,他曾经在哪路影像出现过。
这个看得更清楚了,这个已经有三个机场的航站楼开始部署,本地会放三十天,一百八十天到云里面,航站楼布三四千个镜头,每个镜头会跟地图配合在一起,在哪个地图的镜头里面,曾经拍过这个人,它会画出这个人的轨迹,已经走过了很容易去看到,最开始是累计经验去判断他下一个会出现在哪个镜头,这样来讲,就是把线下的影像透过混合云,线下的机房到大型的超算中心来做预测,落做人脸的比对,这是在PUC的阶段,PUC节是在现场做测试,是计划3月份,你会看到他们做产品的公测。
当然还有类似的应用,这是一个影院,国内蛮大的院线,它透过公有云,影片播放里面有不同的广告、片头,它同步在一个档案放到云里面,它会同步到五十个电影院,每个电影院里又有三十到五十个不同的播放厅,一个档案到下面的GS,GS给三十个厅,同时播放。这样的系统,你只要档案脱离,这一整套架构,这些档案是不能播放的,这样的播放架构在整个混合云里。
当然这是国内的基因公司,国内大概有二三十家比较大型的基因公司,都已经导入这样的系统,它线下在公司里有一堆基因检测的测试仪,因为基因很特别,它有很小的档案,也有很大的档案,它把每个基因序列打开以后来做比对,来做分析,然后再包成大档案来做会诊,这前块的东西要预算,它需要大量的超算,现在它不需要,因为它不是每天在做,所以它现在做完以后数据会送到阿里里面,开始做大型的超算比对,结果出来再返回线下,给相对应的接口做接管。这样的应用在大气也是一样,南方一个省的气象局就导入这样的技术,它以前可能需要大量地分析一些卫星云图、气象云图,这样它就省掉大量的超算系统。
当然你会看到算完以后的基因回传近来怎么样提供给我们国家的基因数据中心,再提供给所有的基因公司来做研究、验证。
这是国内最大的一家药厂,不是制药,它是研发药,它研发所有的东西的一些产品的资料,会透过这样的系统到云端里面开始来做悲愤,做使用,再提供给所有的制药厂,制药厂再做一些研发药。
这是一个容灾云,酒店原来需要两地三中心,它现在不需要,它所有的东西可以同步到网路上,线上整套系统跑起来,成本比单独建一个数据中心成本低很多。
现在的产品大概有五个型号。从低端到高端,每个都是性能、带宽都是企业级的,到机房里不需要改变任何的机房架构,你可以使用任何云的资源和计算空间。公有云怎么落地到每个地级市,每个分公司,让地级市和分公司,真正可以使用到而不是把整套系统搬到云上面来,这是一套很完整的混合云的架构跟产品。
编辑:NIKI
国内云计算和数据中心领域最具规模和影响力的标志性盛会,第十二届中国IDC产业年度大典将于12.21-22日在国家会议中心举行。在昨天的主会场上,多位领导及嘉宾对目前数据中心整体市场进行了分析与点评,在今日的数据中心技术创新分论坛上,多位嘉宾将会对数据中心的技术创新进行分析与解读,让我们共同迎接今天的数据中心技术创新分论坛。