DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

博睿数据的运维智能化新概念,构建服务可达的IT指标体系

博睿数据是国内一家老牌应用性能管理服务商,十几年来,一直专注于通过数据技术赋能IT运维,帮助企业提升整体竞争力。2021年春,博睿数据COO吴静涛在一次媒体沟通会上介绍了新的IT指标体系——服务可达,同时也介绍了构建新指标所需的数据链DNA以及7种能力。

服务可达的数据链DNA这种提法是博睿数据独创的,其核心思想是要从过去以应用为中心,转变为以用户为中心的指标体系。不禁要问,服务可达是什么?服务可达的数据链DNA又是什么呢?

新的IT指标体系:服务可达

70年代的IT产业绝对是以计算为中心来构建的,以IBM大型机为主心构建了一个以计算为中心的数据中心,直到现在,大型机在许多大型机构的最核心业务系统中仍占据关键地位。

经过近二三十年的发展,在新千年前后,在互联网爆发的前夜,开始出现了以应用为中心的数据中心。又经过了二十多年的发展,现在也基本都是以应用为中心在构建越来越复杂的IT体系,从数据中心建设、运维体系、应用开发、客服中心等都是如此。

为了评判IT系统的可用性水平,业内出现了许多关键指标,比如,RTO、RPO、可用性、可靠性等等。

以RTO为例,它是指从灾难发生到系统恢复至正常状态的时间,银行明确规定RTO时间必须控制在半小时以内,如果没能达到这一水指标则会是很严重的问题,反过来说,这也说明这些指标非常基础。

过去二十年来的IT指标体系都是为了应用有更高的可用性,博睿数据提出的指标是以用户为中心的服务可达,应用可用并不意味着服务可达。两者最大的区别在于,前者是以服务提供商自己的视角出发,关注自身服务的可用。后者则是从用户视角出发,则关注用户的最终体验。

博睿数据COO吴静涛

这种转变背后的驱动力是什么呢?吴静涛表示,“随着95后逐渐成为了消费市场的主力,他们有着巨大的消费潜力,他们对在线服务的可用性和体验的要求极高。对于企业来说,如果提供的服务没有好的使用体验则会错失这些消费人群。”

构建服务可达所需的数据链DNA

首先,作为服务首先得有一套可稳定运行的业务应用代码,代码运行在一个现代化数据中心里,数据中心要有可靠的基础设施,同时,数据中心通过网络向外提供服务,为了优化用户体验,需要构建非常多的CDN基础设施,来把用户要访问的内容放在离用户更近的地方,最后才会触达用户的智能终端。

在以上云管边端所有部分都有较高的可用性的基础上,才有可能达到服务可用。但用户端有许多不确定性,如果用户所处的环境信号较差,如果用户的设备型号太老或者用户设备的型号太特殊,都有可能带来问题。

为了照顾更多用户的使用体验,吴静涛认为,“服务提供商应该去做用户型号分析和性能和分析,给设备性能强的用户推荐丰富的界面,给设备性能较差的用户推荐简洁的页面,不能怪用户设备问题,要求用户换设备才能使用服务。这就是典型的从用户角度思考问题。”

作为服务的提供商,想要获取以上云管边端所有环节的状况是相当困难的,而博睿数据则拥有从代码到用户的全过程,取得每个环节数据的能力,这就是博睿数据所说的数据链的DNA。

所谓数据链DNA主要包括三部分:D指的是DEM用户数字化体验管理,收集用户体验的数据。N指的是NPM网络性能管理,跟踪网络传输的数据路径的情况。A就是APM应用性能管理,跟踪每行代码的运行效率,数据库调动效率。

将DNA三部分结合起来,就能够看到从用户终端到应用代码的整个流程,一旦用户体验下降,就需要用一个指标表达出来,这就是博睿数据所说的要构建新的IT评价指标体系。吴静涛表示,“新的IT指标体系能帮助客户利用数据链DNA提升每个用户的体验。”

为了做到这点,博睿数据提供了7种能力。

以7种能力提供完善的DNA技能

在客户端部分,博睿数据能监测到客户端应用的实际性能表现,既可以通过自有的PC浏览器和手机端APP用脚本进行自动测试,也可以监测真实用户的使用数据,只要嵌入了博睿数据的SDK就能看到APP每行代码的运行效率,这一套监测系统本身需要适配多种运行环境,其实也非常复杂。

边缘节点CDN部分要怎么看呢?博睿数据能检测到CDN节点的运行状况,实时提供检测性能表现数据,这点也非常重要。

吴静涛举例说,“比如证券用户的行情数据要利用某CDN做分发,但该CDN被杀毒软件的升级数据占用了,这就会影响证券用户的使用体验,甚至会有造成不必要的资金损失。而如果能看到CDN节点存在的问题,快速迁移到服务品质更高的CDN节点上,则会有效避免此类问题。”

数据中心部分要怎么检测呢?博睿数据日常检测全国各大云以及北京各个周边BGP机房的服务品质,给企业在选择云和数据中心服务商时候参考,还能为企业出定制化的测评报告,帮助企业选择性能更好或者更具性价比的云服务。

在门户网站部分,博睿数据非常擅长的页面性能调优也能发挥优势,博睿数据能对门户网站的页面加载情况进行分析,然后提出有针对性的优化建议。

在网络部分,博睿数据的NPM能实时对流数据进行抓取分析,并且还对流数据路径进行判断,快速发现和排除网络节点上的故障。NPM与APM结合,能弥补APM不能探知网络全路径的不足,获得更全面的信息。

在PaaS平台和API管理方面,博睿数据能实现逻辑自动拓扑可视化,快速发现API异常,对于如今应用API调用链越来越复杂的现状非常有实用价值。

最后一个要提的就是APM应用性能管理了,作为优化代码的利器,博睿数据的APM能通过字节码注入来实现对代码执行效率, SQL语句调用效率的监控。

吴静涛表示,“同时具备以上7种能力的公司,目前全中国仅博睿数据一家。”

博睿数据独有的能力意味着什么呢?

首先,可以肯定的是,博睿数据的这种能力颇具突破性。博睿数据创始人兼CTO孟曦东表示,博睿数据能帮助企业技术人员发现更深层次的技术问题,能告诉技术人员进一步优化的方向,同时,博睿数据在让包括工程师、客服人员等人群都能快速高效用起来,帮助企业提升业务服务水平。

博睿数据创始人兼CTO 孟曦东

比如,由于博睿数据能拿到实时、在线的流数据,所以,可以基于这些数据可以做VIP客户的全栈溯源,实时帮助客户解决问题,让用户的反馈,客服的沟通与工程师解决问题之间的路径变得更为顺畅,提升用户的使用体验。

又比如,基于应用的深度追踪功能,博睿数据可以图形化展示应用间的调用逻辑拓扑,展示调用的次数、时间、延迟等数据,基于这些数据利用AI提供报警、根源分析能力。这意味,以前靠重启无法解决的许多应用问题靠机器学习的智能分析,问题溯源能力可以解决。

当构建了服务可达的评判指标后,当用户体验指标下降的时候,博睿数据可以快速跟踪到底哪个节点下的哪个用户在下降,互相之间的调用逻辑是怎样的,甚至哪个代码造成的都能追踪到,基于这样一套全新的逻辑提升用户体验。

吴静涛表示,“这都是全新的运维理念,是运维智能化,而不是自动化运维,因为没有任何人为介入的操作是非常危险的,各个行业的运维都需要人为的介入。

服务可达能改变以应用可用为主的评判指标,以用户为中心的服务可达,通过数据链的DNA能检测到服务的全流程,能更好更快也更准确地查出问题所在,从而提升最终用户体验。

未经允许不得转载:DOIT » 博睿数据的运维智能化新概念,构建服务可达的IT指标体系