热点新闻

关键字:

人工智能(AI)、算法、建模、机器学习、神经网络、自然语言处理、客服机器人,本篇重点在对数据智能化应用的理解


人工智能简介


1. 人工智能的发展

1956年,“人工智能”这个词首次出现在达特茅斯会议上,标志着其作为一个研究领域的正式诞生。六十年来,人工智能经历了三起两落,目前处于第三起飞阶段,发展潮起潮落的同时,基本思想可大致划分为四个流派:符号主义(Symbolism)、连接主义(Connectionism)、行为主义(Behaviourism)和统计主义(Statisticsism)。

大家经常听到的图灵测试(The Turing test)是在1950年早期测试人工智能的一个测试,指测试者与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。进行多次测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。

目前,世界各国都开始重视人工智能的发展。

2017 年6 月29 日,首届世界智能大会在天津召开。

美国2016 年5 月发布《为人工智能的未来做好准备》;

英国2016 年12月发布《人工智能:未来决策制定的机遇和影响》;

法国在2017 年4 月制定了《国家人工智能战略》;

德国在2017 年5 月颁布全国第一部自动驾驶的法律;在中国,据不完全统计,2017 年运营的人工智能公司接近400 家。

2. 人工智能的定义

人工智能定义颇多,个人觉得《人工智能标准化白皮书(2018版)》中的解释比较全面些,它是这样定义描述的:人工智能是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。模拟、延伸、拓展这三个动词个人觉得用的恰到好处,精髓之所在,模拟即像人一样(可以听、看、说、做),延伸即像人一样,但是比人可预见的做的更好(识别的更快、做的更精确),拓展即可以做人做不到的(例如上一篇提到的聚类)。

总的来讲的话人工智能是一门知识工程,是机器模仿人类利用知识完成一定行为的过程。根据人工智能是否能真正实现推理、思考和解决问题,可以将人工智能分为弱人工智能和强人工智能,简单划分,弱人工智能的产物表面看着像智能的,其实并没有自主意识,当前主流研究还是存在此领域,如语音识别、图像处理和物体分割、机器翻译等方面都已经取得了重大突破,这些可以处理些初级、简单、重复的问题,并且可以做的比人类要好很多。强人工智能是指真正能思维的智能机器,并且认为这样的机器是有知觉的和自我意识的,这类机器可分为类人(机器的思考和推理类似人的思维)与非类人(机器产生了和人完全不一样的知觉和意识,使用和人完全不一样的推理方式)两大类。举个列子:2001年史蒂夫·斯皮尔伯格导演的《人工智能》中的机器人小孩大卫就是类人机器人,具有喜怒哀乐;《机械公敌》、《终结者》等等这种大片中的机器人攻击、灭杀等反人类的行为就是非类人机器人。《人工智能标准化白皮书(2018版)》:强人工智能不仅在哲学上存在巨大争论(涉及到思维与意识等根本问题的讨论),在技术上的研究也具有极大的挑战性。强人工智能当前鲜有进展,美国私营部门的专家及国家科技委员会比较支持的观点是,至少在未来几十年内难以实现。当然,也许再过不久,在马路上和你擦肩而过的可能不一定是人类。

任何一项新的技术或发明都可能会带来好坏两面,只是大家都在期待好的一面比坏的一面发生的几率高。为了更清晰明确的去研究、设计、开发、应用人工智能,有时候不得不制定或定义一些原则或者需要遵守的一些特征,还是引荐下白皮书中的内容。

3. 人工智能的特征

    1) 由人类设计,为人类服务,本质为计算,基础为数据。

    2) 能感知环境,能产生反应,能与人交互,能与人互补。 

    3) 有适应特性,有学习能力,有演化迭代,有连接扩展。

 人工智能这三个特征的重要程度类似大数据的4V,能理解这三个特征基本上能把住人工智能的脉了。

4. 人工智能的框架图

框架图中包含了角色、过程(数据—信息—知识—智慧)、功能,个人感觉挺有用,也放了进来,想深入了解人工智能的话,这张图需要吃透,白皮书中有明确的解析,这里不再赘述。

图片1.png

5. 人工智能关键技术

民政与人工智能结合,是将人工智能所用到的技术应用到民政业务上,达到可以解决民政业务存在的问题或者对其业务能够改良、优化、完善的目的。

民政业务前两篇都有介绍,现在主要介绍近二十年来人工智能领域关键技术,包括机器学习、知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术。

篇幅有限只说下个人对机器学习的简单理解,百度百科定义:机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。可能有些人觉得模糊,咱们不妨这样捋一捋:人工智能的前提是数据,就像婴儿的茁壮成长离不开优质奶粉一样,注意是“优质”,这里就体现了ETL产品的重要性点击了解中科恒运ETL产品人类通过书本来获取知识,形成自我的认知体系来解决问题,机器目前也一样,只不过机器通过数据来获取知识,形成模型来解决问题(解释、预警、决策等),解决问题是否智能化,取决于模型是否适用和高效,模型是通过算法来构建的,算法中就会用到运算、参数、规则、方法等等,一个好的模型要经过反复无数次的训练后才可以进入测试模型阶段,通过测试后方可进行评估,评估不达标依然不能成为合格的模型,更不会投放到市场。机器学习按照学习模式来划分为监督学习、无监督学习和强化学习(数据篇已介绍),按照学习方案来划分为传统机器学习和深度学习,传统机器学习包含相关算法包括逻辑回归、隐马尔科夫方法、支持向量机方法、K 近邻方法、三层人工神经网络方法(神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型)、贝叶斯方法以及决策树方法等深度学习是建立深层结构模型的学习方法,典型的深度学习算法包括深度置信网络、卷积神经网络、受限玻尔兹曼机和循环神经网络等。深度学习又称为深度神经网络(指层数超过3 层的神经网络),卷积神经网络、循环神经网络是两类典型的模型。卷积神经网络(CNN)常被应用于空间性分布数据,常用于图像处理(过程:特征提取-映射-函数-识别);循环神经网络在神经网络中引入了记忆和反馈,常被应用于时间性分布数据,常用于手写识别、语音识别(产品:科大讯飞、小米音响等)。

人工智能关键技术结构图:

图片2.png




人工智能在核对系统的应用重点



篇幅有限,还是以核对业务为例,一方面核对业务数据量相对比来讲还是有的。前两篇都有提到核对业务,大家应该比较熟悉容易理解。

民政的核对系统是在申请人的授权下,通过税务、房产、保险、金融、车辆等部门或机构提供的社会救助家庭收入信息,与社会救助申请人申报的家庭收入和财产进行比对,从而准确核算申请人家庭收入和家庭财产的一种方法。这一方法改变了社会救助部门传统的“估算”做法,为认定社会救助对象奠定坚实的基础,有效的减少了骗保等的发生。

1. 目前问题

目前在骗保、漏保、关系保方面还存在或多或少的问题,因为来主动申请低保的人员一般都是比较弱势群体,申请过程中填报资料就会遇到“关系保”问题(村长、支书隐瞒或者延迟,不作为,乱作为,授权书不受理,不登记,或者登记后不录入,不入库,不办理,拖延办理等情况等)。导致一般农户觉得被不公平对待,放弃低保的申请,从而导致基层矛盾凸显。办保难、流程繁琐等问题还是普遍存在。

针对漏保问题:传统方式,通过扶贫基层领导走访调研进行摸查,但是这种方式耗时耗力,且可能因为主观意识性存在偏差;数据方式,可以通过增加低保潜在人群的来源和数据进行预先比对来确定是否漏保,理论可行,但是这种情况是在没有得到用户授权下进行的,不满足目前的社会救助办法。

2. 解决思路

在目前已经实现的核对系统基础之上融合、选取弱AI中比较成熟的技术来转变服务方式来规避或解决目前存在的问题,服务方式由被动服务转主动服务、由人工服务转机器服务、由信息化服务转智能化服务。

3. 实现方式

机器为体,智能为用。

4. 建设内容

以智能机或AI自助机(专用或通用)的形式部署在街道和乡镇向群众百姓进行主动的低保预审智能服务,配套内容:微信公众号、短信服务平台、公共服务平台等。AI自助机具体硬件配备(集成处理器、存储、芯片、显示器、网络网管等)、功能不再阐述,如有需要可在建设方案中完成。

具体流程:问答、认证、授权、预审、打印、结果、复审。

5. 流程概述

5.1 问答

默认情况下,AI自助机的显示屏播放自助机的作用、目的、意义以及使用流程,告诉、引导百姓来如何使用。当申请人触摸屏幕时视频播放完毕,进入首界面,界面包含常见问题、法律法规、智能客服、在线办理等功能模块。若还有疑问未解决的话,可以点击进入智能客户进行问答。

图片3.png


概述

申请人可以通过语音或文字输入进行简单的人机交互实现问题的对答,若不满意的话可以联系在线客服(核对中心办事人员),在线视频解决问题。

相关AI技术
(1) 自然语言处理;

自然语言处理(Natural Language Processing)基于并行计算、分布式爬虫系统,结合独特的语义分析技术,一站满足NLP、转码、抽取、数据抓取等需求。

包含了词法分析、句法分析、篇章分析。

(2) 客服机器人(机器人自动回复、语音交互、人工在线客服);

客服机器人(Customer Service Robot)依托腾讯领先的自然语言综合处理能力,深度学习企业自有知识库,构建能够在多渠道随时响应客户问题的智能客服机器人,同时支持与内部业务系统交互,帮助企业以更低的人力成本更智能地全方位触达客户。

a) 语音转文字

实时语音转文字,针对业务领域定制识别模型,保证识别准确率,快速响应客户问题;

b) 知识库

支持批量导入知识库,系统快速起步;使用中,智能分析未解决客户问题,高效更新知识库;完善的语料质量监控,对知识库质量进行有效监督,促进既有语料不断优化;

c) 多轮会话

基于上下文的多轮会话能力,不仅支持业务资讯类问题的自动回复,同时满足业务操作类问题的引导交互;

d) 面向业务开放

提供 API 及 SDK 接入方式,与内部业务系统无缝对接,有效整合企业数据,让服务更智能。

e) 语音合成

实时文字转语音,多种音色可选,支持定制自有发音人,让客户服务更加具备企业特色。

f) 人机无缝衔接

机器未解决问题或关键业务问题,无缝对接人工客服,平衡服务效率与满意度;

g) 自动问题分配

可以根据业务体系、工作量、既往服务史等规则,自动分配人工客服;

h) 机器人推荐回复

通过与客户 CRM 系统或大数据平台对接,可以智能推荐个性化的回复,供人工客服参考。

5.2 认证

申请人需要通过身份认证后才可以进行业务的办理,保证是当事人在办理,而非代替。与高铁站、机场进站类似,拿着别人的身份证是不能进站的。

图片4.png


认证概述

申请人站在AI自助机前方,通过刷身份证和人脸识别(按照动态要求进行:眨眼、摇头)比对后完成统一性身份认证,身份认证通过后,申请人进行下一步授权;

通过身份证读卡器或身份证OCR识别获取到身份证号码、性别、年龄、家庭住址、个人照片、籍贯等减少录入信息,另外通过摄像头采集头像照片,并与其身份证上的照片进行比对确定统一身份(高铁站已经实现)。

认证相关AI技术
(1) 身份证OCR识别

识别身份证正反面识别,一次扫描即可识别身份证号、姓名、有效时间等所有字段。

(2) 人脸别对

根据面部特征,计算两张人脸的相似度,自动进行身份鉴别。

(3) 唇语活体检测

通过对一段随机读数字的自拍视频进行唇语检测或者对一段摇头眨眼张嘴的视频进行相关动作检测,从而确认当前用户为真人。

5.3 授权

按照相关法律法规,申请人需要授权给核对中心后才可以查询、核对自己的相关信息(车辆、房管等)。核对系统中类似申请人在人工窗口填写办理的授权书,核对系统办理过程中需要乡镇或街道办事人员将申请人的填写后的授权书进行扫描入档,才可以办理后面审核审批业务。

签字授权

通过申请人的签字来授权。

签字授权概述

在屏幕上显示出“授权书”相关条款,申请人在仔细阅读后在AI自助机的触摸屏幕签字区域进行签字完成后提示在指纹区按指纹,系统进行识别是否完整有效,最后确认后提交授权。(需要抽取单独保存签字图片以及指纹图片,方便后期查询或比对使用)

图片5.png

签字授权相关AI技术
(1) 指纹识别

根据指纹特征,自动进行身份鉴别。

客服机器人
客服机器人概述

选择此模式后,AI自助机显示屏中会出现虚拟的卡通人物或远程的真实办公人员与你对话,偏引导性对话如:

“您好,请问您是张三吗?是的话请回复是并点头回应。”

“您正在办理低保预审流程,现在是否同意授权***核对中心对您的信息进行查询?是的话请回复是并点头回应。”

通过对申请人回复的语音的识别以及头的方向识别进行判断是否进行下一个步骤,此全程通过AI自助机的摄像头进行录像录音进行保存并传输到服务器中作为授权性文件。

客服机器人相关AI技术
(1) 声纹识别

声纹识别(Voice Print Recognition)作为生物识别的一种,是根据说话人的声波特性进行身份辨识的服务。身份辨识与口音无关,与语言无关,可以用于说话人辨认和说话人确认,广泛应用于金融安全、智能家居、智慧建筑等领域。(后期可实现说话辨认)。

图片6.png

(2) 客服机器人(机器人自动回复、语音交互、人工在线客服)

客服机器人(Customer Service Robot)依托腾讯领先的自然语言综合处理能力,深度学习企业自有知识库,构建能够在多渠道随时响应客户问题的智能客服机器人,同时支持与内部业务系统交互,帮助企业以更低的人力成本更智能地全方位触达客户。

a) 知识库

支持批量导入知识库,系统快速起步;使用中,智能分析未解决客户问题,高效更新知识库;完善的语料质量监控,对知识库质量进行有效监督,促进既有语料不断优化;

b) 多轮会话

基于上下文的多轮会话能力,不仅支持业务资讯类问题的自动回复,同时满足业务操作类问题的引导交互;

c) 面向业务开放

提供 API 及 SDK 接入方式,与内部业务系统无缝对接,有效整合企业数据,让服务更智能。

d) 语音转文字

实时语音转文字,针对业务领域定制识别模型,保证识别准确率,快速响应客户问题;

e) 语音合成

实时文字转语音,多种音色可选,支持定制自有发音人,让客户服务更加具备企业特色。

f) 人机无缝衔接

机器未解决问题或关键业务问题,无缝对接人工客服,平衡服务效率与满意度;

g) 自动问题分配

可以根据业务体系、工作量、既往服务史等规则,自动分配人工客服;

h) 机器人推荐回复

通过与客户 CRM 系统或大数据平台对接,可以智能推荐个性化的回复,供人工客服参考。

5.4 预审

申请人在授权通过后,在AI自助机显示屏中显示出个人信息:姓名、身份证号码、性别、年龄、家庭住址、个人照片、籍贯等以及办理流程、办理结果通知方式、以及其他需要注意事项,确认信息,点击提交,弹出对话框,需要输入手机号以及关注微信公众号,通知结果所需,提交后台核对系统进行后台预审(转入核对系统待审核阶段)。【后续将推出:机器学习在核对中的应用】

图片7.png

5.5 打印

完成预审操作后,系统将自动进行打印票据,进行脱敏处理,票据内容包含:姓名,办理流水号、办理时间,办理地点,办理机器编号,预计返回结果时间,二维码(通过二维码输入流水号可查进度信息)其他信息等。

图片8.png

5.6 结果

当核对系统完成比对后将核对报告以短信或者微信的形式告知申请人,若通过则可以在自助机上打印结果并填报个人银行卡信息,领取结果方式可以通过输入人脸识别、语音识别、指纹识别、流水号+手机号、微信扫描认证、手机验证码等任意方式获取打印结果。领取结果完成后到民政局进行现场报备,完成最终的确认。

图片9.png

5.7 复审

每年(时间长短可以后台设置且可以主动提醒)申请通过人员需要在自助机上进行复审,在自助机上进行再次认证(按照动态要求进行:眨眼、摇头),主要确定申请人是否在世,预防低保人员去世后还在领取低保金,杜绝资金浪费。

图片10.png

目前核对系统已经在大部分地区建设完毕,成为了社会保障体系的重要组成部分,相信通过核对系统基础之上融合、选取弱AI中比较成熟的技术来转变服务方式来规避或解决目前存在的问题,服务方式由被动服务转主动服务、由人工服务转机器服务、由信息化服务转智能化服务,可以更加的提高社会救助公信力,能够减少“开着宝马吃低保”等严重损害政府形象,同时不断的完善社会救助制度的建设和救助体系,保障贫困群体基本生活、促进社会稳定发展。

当然不可逃避的是民政面对的是弱势群体,可能要受限于文化程度、年龄跨度、区域差异化等等,也就意味着对人工智能产品设计要求极高,不仅要简单实用,还要安全可靠,这也是极大的考验与挑战。



人工智能在民政其他方面的应用



1. 人工智能在养老领域

目前来讲常见的有智慧养老,在养老院通过各种简单的传感器,把老人的身体情况,比如血压、心跳、脉搏、呼吸、运动情况、睡眠情况等等数据,自动统计记录分析,然后传给医生或者家人,以保证能够及时了解到老人的身体状况,并给出最合适、及时的医疗救助。同时,医生根据传感器数据以及健康知识库,通过数据挖掘、建模分析,给出最适合老人个人的医疗方案、药物等。依据病人个人的习惯、心态、爱好给出最具个性化的医疗方案大概也是未来医疗行业的发展方向。

不久的将来将出现智能机器人来进行养老服务,毕竟现在正值中年二拖四的现象还是常见的。

2. 人工智能在社区领域

 安全是社区的基础,人工智能在社区重点人群身份识别上也发挥着很大的作用。(参考白皮书)。

①设计一套高清人脸采集系统,实现高质量的人脸自动抓拍、自动识别、自动比对、自动报警、轨迹回放等功能,做到“人过留像、留特征、留轨迹”,实现“由像到人”、“由人到案”业务模式的改变和创新。

②在社区各主要场所人员进出通道合理设置高清人员卡口监控点,形成覆盖全部区域人员监控,实现严密的监控覆盖,全面记录城市出入及内部通行人员。

③依托专网,运用成熟的SOA 体系框架,搭建人脸信息综合应用平台,实现全社区人脸卡口数据的实时转发、统一存储、深入分析、深度应用。

④人脸信息综合应用平台与民政、公安业务信息库建立连接,提供人脸布控及动态比对预警、人员轨迹追踪查询、人员身份鉴别查询等实战应用功能,为社区治安防控、刑侦破案、反恐防暴等工作提供有力支持。


结束语:

到此,《民政智能篇》已接近尾声,人工智能可以做的很多很多,但是受限于数据孤岛、数据质量、数据安全、数据技术等多因素影响,还有很远的路要走,个人能力有限,大家可以多多关注民政、关注人工智能的发展,相信会有更多的收获。

与此同时《我为什么做民政》系列也即将结束,相信大家在这三篇中已经找到了答案,真诚的再次感谢您的耐心阅读。

最后,我在此呼吁更多的小伙伴可以加入我们中科恒运股份有限公司的团队里来,让我们一起努力,一起奋斗,一起拼搏,一起去做一些有意义的事情。

文章所有内容仅代表个人观点,如有不适请多包涵。



  

联系邮箱

电话联系

QQ