热点新闻

回顾,上一篇《民政业务篇》主要以民政业务为主线进行了阐述为什么做民政(点此查阅),今天分享的《民政数据篇》将以民政数据为主线来进行阐述通过数据化或者数据赋能帮助民政事业发展,相比上一篇可能会略专业点,关键字:数据、民政数据、数据思维、大数据、数据驱动,篇幅4千字左右,阅读时间约为12分钟。

本篇重点在对数据的理解,理解了数据即理解了今天所讲内容的80%。大家对数据的认知、理解和运用,可能都有自己的见解,我也讲下自己对数据的认识——数据世界(这种认识是站在数据角度看待事物的思维方式,所以求同存异,一旦有了数据思维,那么外行也会对互联网、物联网、云计算、大数据、人工智能、区块连、边缘计算、虚拟现实都会有新的认识)。

在哲学唯物主义中经常提到世界是由物质组成的,在数据领域中,我认为世界是由数据(数字、文字、图像、声音等等)来组成的。

640.webp.jpg

世界中所存在的物质(实物或非实物)包含了属性和关系两大内容:

先看属性,属性可以分为根本属性和本质属性。物质的根本属性是运动,而时间和空间是物质运动存在的形式;本质属性即物质本身具备以及特有的属性。属性可以通过数据来进行分解、表示、表达出来,举个例子:比如,位于中国北京东城区的低保户小明在2018年5月10日领取了上个月低保金,小明的性别男,身高175CM,年龄58,健康状态差,伤残二级等。这个事件或者活动里面包含了时间、地点(根本属性)、姓名、年龄、性别等(本质属性),而这些都可以被数据来记录、表达和保存。

再看关系,关系为物质与物质之间的联系,比如人际关系、亲属关系、外键与主键关系等。举个例子:小明在办理低保户过程中要审核家庭成员中的收入、支出、财产,这就涉及到查阅、比对亲属关系;同样在前期申请低保过程中,也要经历过层层审核、审批流程。在这些流程中要和社区人员、民政局办公人员等产生联系,由谁来办理、什么时间办理、办理过程的材料准备、办理结果反馈、办理评价等等,其实都是在产生着不同的关系,其实这个过程或联系本质是数据状态的变更和流转,这些关系都可以用数据来记录、表达和保存。

总结之,属性和关系都可以用数据来记录、表达、保存,那么物质就可以用数据来解释,再进一步,世界就可以用数据来解释,更不用说民政事业了。

传统的民政事业工作经历了无纸化、传统信息化后逐步步入现在的数据时代,也在展望未来的智能时代。但是在多年之前,民政传统的信息化建设摸索前进阶段相对比较独立,不同的理念、不同的厂家、不同的语言、不同的数据库,各自为政,缺少顶层的设计,导致内部各部门之间数据标准不规范、不统一,无法内部交换共享,更不说与外部对接。通过2014年民政部关于发布《民政业务数据共享与交换标准编码》行业标准有效的解决了不规范、不标准,不统一的问题,但是在具体实施交换共享的时候还是会遇到很多难点和阻力,如对线路问题、信息安全、数据隐私等方面的考虑,还存在极少心态不够开放,保守自封的现象存在。

640.webp (1).jpg

好的方面来看,这两年如火如荼的景象还是常在,这不仅仅是因为一些国家政策的扶持(《全国民政标准化“十三五”发展规划》、《民政信息化中长期规划纲要(2009-2020年)》、《促进大数据发展行动纲要》、《大数据产业发展规划(2016-2020年)》等),更是因为民政主管以及基层人员对数据重视度在不断提升。

2017年12月8日下午,习近平总书记主持中央政治局第二次集体学习时强调:“实施国家大数据战略“,同时指出,”善于获取数据、分析数据、运用数据,是领导干部做好工作的基本功”,意味着大数据已经成为国家发展战略。

目前,中国超80%的数据在政府手中,尤其是政务领域中民政行业的数据的量、种类、真实性、时效性、价值性更是为大数据的应用提供了先天的优势。紧跟国家政策,充分利用数据来对管理和服务做出一些贡献,这也是我为什么做民政的主要原因之一。

说数据不提大数据技术显得有点low,很多人都在打破砂锅问到底,问大数据到底是什么,其实我想说大家买车的时候可能大部分时间关注的是价格是否有优惠、开得是否省油、车是否有劲儿,而不是关注自然吸气或涡轮增压的原理。

大数据可以通过数据采集或感知获取、预处理、分析(偏已有需求进行建模,如分类、线性回归、监督学习)、挖掘(偏无预先需求或主题如聚类、神经网络、无监督学习)、展示(偏技术的不讲,感兴趣的话可以单独出一篇)等过程实现以下价值:简单粗暴的分为三类,第一类是对发生的事物具有可解释性。发生了什么,为什么会发生(比如经常用到的就是用数据说话,再比如大数据的分析结果可以解决2017年全国发放的低保金比2016年高21.3%这个疑问,再比如经典的案例美国的犯罪率与冰淇淋销售率的关系,当然这里强调下是通过各种因素来进行相关性分析,而非因果性分析);第二类是对未来事物状态预警,可能会发生什么,发生后是好还是坏,个人感觉预警比预测的寓意更加深一些,预警在预测基础之上还要有一些标准体系、规范、参数等的制约(比如:某市低保户在2020年5月份人数会超过提前已规范的基准线人数100万,判断会对财政支出造成影响,发出预警警告);第三类是对现在发生的或未来可能发生的事物做决策时提供辅助支持,基于前面两类来确定如何做(比如:发出预警信息,某市低保户在2020年5月份人数会超过提前已规范的基准线人数100万,大数据根据分析建议增强某区的教育救助比例或提高某批次具有劳动力的低保人员的就业几率,同时推荐给出哪里缺少相匹配的就业岗位以及联系人联系方式,就业成功率能达到多少,处理后会避免多少损失,达到期望值多少等)。

640.webp (2).jpg

个人认为民政领域想要通过数据来解决问题有两种模式,问题驱动模式和数据驱动模式问题驱动以解决问题为主,从问题本身出发,一般适合前期没有数据储备的情况,大数据之都贵阳前期采用这种模式较多。问题驱动的主线为:问题在哪里?---->数据在哪里? ---->办法在哪里?如民政中的低保识别问题,问题在于:无法核实申请低保人员是否可以满足条件(收入、支出、财产等),存在骗保问题,申请人说自己没车没房没存款,传统手段走邻访舍很难客观的判断,甚至还有出现低保用户已经身亡,却依然在发放低保金;数据在于:工商局(是否注册公司)、税务局(交税情况)、银行(存款情况)、人社(是否有医保)、房管(是否有多余房产)、公安(是否有车辆、是否乘坐高铁飞机)、民政(是否身亡)等;获取办法:专线、政务外网、接口、离线、前置系统等。只要获取到真实的数据,后面就交给大数据应用来解决问题吧,就类似数据是土壤,像资源,解决问题的大数据应用就像生长在土壤上的花草树木,这些植物可以开花结果供人欣赏和食用,可以释放氧气供人呼吸。

第二种模式数据驱动以数据为主,从数据本身出发,一般适合前期已经有数据资产储备情况,数据驱动的主线为:数据建模(抽象、归纳、建立,注:很多时候都是尝试选取现有模型后调参)---->验证模型(训练、矫正、迭代)---->应用模型(解决、预防、决策问题)。如,通过民政已有积累数据对低保人员进行建立低保人员模型,来快速判断是否为低保对象,同时可以为申请人员进行贫困指数(不同维度分析,健康状态、就业状况、文化程度、劳动能力、残疾状况等)自动分析汇总得分,达到一定分数即可通过,并对未来低保人群走势进行预测,描绘出低保对象画像(标签化),有效避免骗保、漏保现象。

640.webp (3).jpg

民政数据也可以在社区、养老、救灾等公共服务上发挥巨大作用,例如通过数据GIS地图解决居家或社区养老某些问题,通过感知(数据分析结果)、主动收集(线下填报、走访等)或被动获取(APP物联网关、穿戴设备、传感器上报等)社区老人的服务信息内容(年龄、性别、健康状态、兴趣、爱好、时间、地点、注意事项、服务类型包含做饭、看病、陪同等等),对其进行数据分析后分类排序展示地图上,系统后台智能匹配或推荐慈善总会或文民办中的志愿者或社工人员数据(服务范围、地理位置信息、有效服务时间、专业特长、服务质量、是否有证书等),对与其匹配率达到80%以上的对象进行短信、微信、电话等多渠道通知确认是否可以接受服务任务,实现最短时间就近匹配服务,服务后进行评价考核监督,同时也可以通过反馈数据来对志愿者进行奖励或对工作人员的升迁、评优起到一定辅助作用,形成闭环,类似嘀嘀叫车服务,同样原理在救灾方面也可以应用。

篇幅有限,还有很多民政业务可以通过数据来进行解决问题或优化流程,不再一一举例。民政内部数据本身就比较丰富,包含了社会组织数据、婚姻数据、志愿者数据、殡葬数据、慈善数据、社区数据等等,这里还要重点强调的是民政的核对业务。核对业务包含了与外部委办局数据(税务、工商、公安、人社、房管、教育等)、金融机构(银行、股票机构等)、互联网数据(购物、旅游、酒店、舆情等)的交换共享,这就意味着民政可以获取的数据范围会大大扩充,当然并非其他委办局全部的数据,甚至有的需要进行脱敏处理后交换共享。虽然国务院颁发了各种促进数据交换共享的文件,但是介于目前实际情况中的种种因素,各部门协调起来比较麻烦,流程比较繁琐,配合比较滞后,导致现在进展并不是非常顺利,很多时候数量还是小一些,级达不到P级,种类由于“隐私”、“涉密”等原因没办法丰富,另外部门与部门之间的数据存在“打架”情况(不一致时有发生,比如在公安中是未婚,在法院中可能离婚等),这是事实,当然大家不用着急,相关部门早已意识到而且颁发了很多推进和实施方案,相信在不远的几年内,掌握在政府里的80%的数据会不断逐步地开放共享出来,真正发挥数据价值,做到数据多跑路,群众少跑腿。

640.webp (4).jpg

到此,《民政数据篇》已接近尾声,通过目前的数据条件可以做的还是很多的。中科恒运已经在研究或者已经将一些大数据成果在实践、应用,但是还有很多要完善和提升的地方。也许新技术、新创新的发展就是逐步而来,不可急于求成,但是我们也要不断尝试的去探索、推进,如果可以的话进行一定的倒逼,最终盘活数据资产,使得数据能够发挥出它的威力和价值,使其为百姓生活、企业决策、国家治理带来更加优越的服务。

下一篇《民政智能篇》将阐述如何将人工智能赋能民政事业,如何使得民政业务管理智能化、服务百姓智能化,若感兴趣,请关注下一篇《民政智能篇》,感谢您的查阅! 

注:文章内容仅代表个人观点,如有不妥之处或不同看法欢迎交流、指正。


联系邮箱

电话联系

QQ