DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

智慧法院,从“数据专享云”,从“分布式存储”开始

党的十八大以来,党中央高度重视发展数字经济,将其上升为国家战略,从国家层面部署推动数字经济发展。为了贯彻实施国家战略,最高人民法院正在积极推进和部署智慧法院系统的建设,为数字经济保驾护航,适应数据经济发展新时代的需要。

“照镜子”,差距显而易见

针对打造智慧法院总目标,最高人民法院提出了“六个统一”的总体要求,即统一运行网络、统一基础设施、统一数据资源、统一管理平台、统一安全策略和统一标准规范。早在2016年7月,最高人民法院就发布了《关于全面推进人民法院电子卷宗随案同步生成和深度应用的指导意见》,将焦点集中在数据的应用和共享。

如果我们把最高人民法院的这些纲领要求视为一面镜子,对照之下,就不难看出当前工作的差距和距离。以华东某省高级人民法院为例,该省已经构建了“全省电子卷宗系统”和“科技法庭系统”,实现了案件审理流程的信息化,以及全部庭审音频、视频信息的全记录,为法院工作目标管理和科学化决策奠定了数据基础。

但是对照最高人民法院的要求,差距和问题就暴露了出来。该省法院大部分数据以中级人民法院为单位分散存储,受条件限制,无论是应用服务器还是数据,大多没有高可用集群和容灾备份的保护方案,容易出现业务服务中断,造成数据无可挽回的丢失。

与此同时,数据的分散部署带来了技术管理以及信息共享上的复杂度,影响数据的深度应用。

为了扭转系统应用中的这些问题,以省高级人民法院为核心的“数据中心专享云”方案提到了议事日程。

专享云平台方案跃出水面

通过缜密科学的调研,自2017年以来,“全省电子卷宗系统”累计积累并存储了840TB左右的数据,并且按照每年新增500TB的速度发展,其数据以图片、PDF、Word等非结构化数据为主,数据访问形式以FTP为主,按照NAS文件目录方式组织数据,其文件目录深度高,涉及5~6级的文件目录深度和100左右的目录宽度,单目录文件数量在1000以内,文件大小在100KB~70MB不等。从需求来看,对于电子卷宗的数据访问存在高并发、高带宽、低延时和高可靠的性能需求。

与之相比,“科技法庭系统”对性能的需求稍差,但对于海量化的容量需求较为迫切,全省“科技法庭系统”现有数据量约为300TB,按照全省每年约200万件案件预估,每个案件平均占用存储空间1GB测算,全省每年新增数量应该到达约2000TB的规模。

针对目前的现状,如何才能够提升数据的保护和应用的水平呢?

为此,该省高级人民法院提出了建设“省法院数据中心专享云平台”的思路,依托该政务云,完成初步的业务上云业务,通过本地数据的上传备份,在实现数据集中同时,也为省法院、中级人民法院业务应用双活,创造了条件。

该省法院为此确立了“省为枢纽、地市为重心”的建设原则,以实战应用需求为牵引,边建边用、以用促建;通过构建服务资源目录,以实现本地服务资源的集中管理和统一编目,实现本地服务资源目录向省法院管理平台的扁平化汇聚。该系统建设完成之后,省所属各级法院部门就都可以接收系统分发的服务资源目录信息,极大提升数据信息共享,提高各级法院平台的联动水平。

浪潮K1 Power分布式存储方案大显神威

在技术方案的选型上,浪潮AS13000G5-Power分布式存储方案胜出并最终中标。

这是基于Power平台架构的分布式存储系统,使用了分布式架构,每个节点都是一台独立的浪潮K1 Power服务器,拥有独立内存和硬盘。

与传统的集中式存储不同,分布式存储以通用服务器为基础,在容量扩展、性能和价格等方面均占据优势。以容量扩展为例,分布式存储采用了目前流行的横向扩展方式,存储性能随服务器节点数量的增加而线性增长,容量与性能可无上限扩容。

对标x86通用服务器的方案,浪潮K1 Power FP5280G2或浪潮K1 Power FP5466G2服务器在性能和稳定性上的优势明显,这也是Power服务器的特点所决定。唯一会让用户感觉担心的是Power服务器的价格,但是经过浪潮多年的潜心研究和发展,浪潮K1 Power的价格已经可以接受,而其所具有的高并发、高带宽、低延时和高可靠的特性,与此次省法院数据中心专享云的需求高度契合。

分布式存储是采用两级哈希算法,通过构建全局唯一标识(OID)的扁平化命名空间,对数据进行存储和管理。当数据进入存储系统,数据会被切片,按照一定大小(默认为4MB,可根据纠删策略调整)散布到不同存储磁盘或不同节点,其目的是为了发挥多磁盘IO的吞吐能力,提高数据存储和访问,以及数据重建的性能。

为了确保数据存储的万无一失,分布式存储系统提供了多副本和纠删码的2种数据保护方式,从而防止磁盘和节点故障所导致的数据丢失,这里分布式系统也利用了多磁盘所带来的好处和能力。数据切片会被分布式系统散布在不同的机柜(机架)、不同的服务器节点,以及不同的磁盘,无论是数据访问,还是故障导致的数据重建,这种数据分布和部署方式,都可以发挥充分利用每个磁盘IO的能力,性能接近全部磁盘IO的总和。这与我们所熟悉的单一磁盘单一文件存储,在性能上有着天壤之别。

这种数据分布和切片需要用到强大的计算处理能力,所形成的结果也被称为为元数据,为了防止元数据管理成为分布式存储的性能瓶颈,这里就需要用到集群,以使得元数据处理性能可随系统规模线性扩展,元数据存储需要使用SSD,利用SSD存储介质IOPS的优势;此外,目录管理也需要借助负载均衡等技术手段,确保分布式存储系统能够满足性能的需求。

小结

分布式存储系统的特点与省法院数据中心专享云平台的需求无缝契合,而浪潮K1 Power方案的选型,更使得省法院数据中心专享云在高并发、低延迟等性能表现上得到进一步加持。与此同时,数据中心专享云的上线不仅解决了以往应用中所存在的数据缺乏容灾备份保护的难题,随着数据的集中,也为各级司法部门的业务联动,以及数据深度应用创造了条件。

数据中心专享云一小步,智慧法院建设一大步,也是尤为关键的一步,其经验和实践应该引起业内足够的重视。

未经允许不得转载:DOIT » 智慧法院,从“数据专享云”,从“分布式存储”开始