DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开
DOITAPP
DOIT数据智能产业媒体与服务平台
立即打开

这些字儿也太太太太太太难认了,AI能不能拯救我?

春节长假正式进入倒计时,各位小伙伴是不是已经盘算好了去哪里一浪?你是回到青山绿水的家乡被“催”,还是在灯红酒绿的都市里找“堵”?

但要说这外出旅行,最尴尬的事情,“不认字”绝对是其中之一。

这个“不认字”说的可不是日常使用的汉字,更不是“茕茕孑立,沆瀣一气,踽踽独行,醍醐灌顶”,毕竟咱都是受过教育(刷过抖音)的文化人。

但是这名胜古迹、风景园林里的字实在是太难认,比如曾经爆红网络的我国书法界“四大奇观”:

被认成“采药超人”的“大道无为”……

明明是“宾至如归”,越看越像“妇女之宝”……

不是“坐月子”更不是“坐尺子”,而是“千人坐”!

到底是什么想象力,才能把“勤能补拙”误认成“杜甫能动”啊!

如此看来,上到书法名家的亲笔提匾,下至自然景观的刻字石碑,书法的背景、字体都如此多样化,“认字”的人可能真没有几个。

虽然你对这些字看不出个所以然,这届程序员们却get了“涨姿势”的新方法……

前不久,2019 数字中国创新大赛全面开赛。华为作为大赛的出题方之一,提出了“文化传承——汉字书法多场景识别”的赛题。参赛者将进行AI模型训练与应用开发,实现书法字体的自动、实时、准确识别。

现如今人工智能技术发展迅猛,在手写中文识别方面也已经有了很大的突破。华为的技术工程师中也有书法爱好者,大家头脑风暴后提出了使用文字识别服务(OCR)来识别书法艺术这个赛题的想法。

目前,华为云EI的文字识别服务(OCR)已应用到多个行业,实现信息高效精准的数字化。例如,在物流业,帮助德邦等物流公司识别快递单;在医疗业,帮助医疗机构识别各种医学化验单;在金融业,帮助保险公司识别各种保单等。

此外,作为本次大赛的“兼任导师”,华为云还送给了选手们一款参赛必备神器 ——一站式AI开发平台ModelArts。ModelArts主打一站式、全流程、易用、高效、便捷……可以说是“AI开发者的福音”。

为什么这么说?随便举个例子。早前,斯坦福大学最新公布的DAWNBenchmark成绩排名中,在图像识别(ResNet50-on-ImageNet,93%以上精度)的总训练时间上,ModelArts以9分22秒的成绩,拿下全球第一,大幅领先于其他选手。

那ModelArts又是何方神圣?概括来说,它是华为云面向AI开发者最新推出的一站式全流程开发平台。具体来说,它可以提供海量数据预处理及半自动化标注、大规模分布式训练、自动化模型生成,及端-边-云模型按需部署能力,帮助用户快速创建和部署模型,管理全周期AI工作流,可实现更低成本、更快速度、更极致的体验。

对于行业以及开发人员来说,这个也不难理解。在华为云“普惠AI”的大旗之下,ModelArts也成为践行该理念的一把利器,真切地为AI开发者提供通往AI化的普惠之路。

  AI开发者之幸:将简单易用进行到底

说了那么多,也是时候来体验一下这个以艺术之名,面向AI开发者的ModelArts真正的实力了。

作为一个媒体工作者(开发小白),前段时间我也试图体验了一番这个简单易用的平台。

首先我们进入ModelArts官方首页,点击立即使用,就进入了看似高深,实则可以零门槛上手的体验过程。

首次进入,我们会看到几组悬浮的指引提示,标注着各个功能板块。在自动学习模块,你无需写代码,只需要上传数据,自动学习的UI向导就能引导你完成数据标注,并且自动训练出高质量的模型。

具体可分为上传数据>图片标注>自动训练>一键部署几大步骤。

我们以图像分类,即识别一张图片中是否包含某种物体为例具体展开。

最近某个大神级的人物在朋友圈分享了一句话,叫「你未看此花时,此花与汝心同归于寂;你来看此花时,则此花颜色一时明白起来。」颇有哲理,我们这次训练的目标就拿花来入手。

此次训练我们无需丰富的数据集,只是因为在ModelArts的市场板块里已经备好多个强大的数据集供我们测试使用。

在市场板块中,我们找到了诸多已经准备好的API、模型和数据集,其中就有一个名为“Flowers-Data-Set”的数据集,我们将其直接导入我的数据集,完成第一步数据准备工作。

值得一提的是,在整个过程中,都会有一份详细的堪称葵花宝典式的用户指南,详尽的阐释着每个细节。

有了数据,下一步就到了训练模型环节,也就是训练作业。

作为新手,我们根据操作指南填写以上看似陌生的数据参数,填写完成后,点击创建即进入了训练的过程。

我们注意到整个训练过程用时11分31秒。

模型训练完成后,可以创建预测作业,将模型部署为在线预测服务。 同样填写和选择一些参数和数据。最后模型状态为“正常”,表示创建成功。单击部署-在线服务,创建预测服务。

在预测服务阶段,即可上传所需要识别和检测的图片来进行测试了。

不用怀疑,以上体验正是来自于一个文字工作者,也就是毫无代码和开发能力的小白用户。正是得益于简单易用的平台特性和指导手册的“保姆式”教学,我完成了的AI开发的经典路径:从数据准备到训练模型,再到最后的模型部署和测试。

你无需知道过程中的那些生僻的参数代表什么意思,直接根据流程指引即可完成开发流程。这正是这个叫ModelArts的平台所迸发出的魅力和吸引力。

如此不难看出,ModelArts上手快、训练快、上线快,从数据到自动学习、再到训练和部署样样精通,图像识别、视频分析、语音识别、产品推荐、异常检测等场景全部适用,传说中的极致性能真不是浪得虚名。

1月30日,ModelArts已经结束了为期两个月的全球公测阶段,宣布正式上线,为新用户提供了价值约400元的免费试用包体验ModelArts。

如果你在为模型训练时间长苦苦挣扎,因为没有适用的数据集而放弃关于人工智能的小创意,那么就让华为云ModelArts来匹配你无处安放的才华吧~

未经允许不得转载:DOIT » 这些字儿也太太太太太太难认了,AI能不能拯救我?