探索12345数据宝矿-第一篇

12345热线在日常运营中不断产生着各类运营数据,这些数据日积月累形成了数以十万计、百万计甚至千万计的数据信息,这些信息代表着最准确最直接的民生诉求、体现着各级政府部门最真实的执政绩效、蕴涵着社情民意热点民生态势,可以说是支撑政府科学决策和推动社会治理科学化的数据宝矿,这些数据越来越被各地政府重视,那么12345热线到底有那些数据有什么样的分析方法?最终能呈现出什么样的价值? 我们不妨抽丝剥茧,一一分析。

       第一篇     备菜:12345数据源分析与探索

       第二篇     炒菜:12345数据分析方法论

       第三篇     上桌:12345数据分析需求与成果


第一篇:12345数据源分析


说起12345数据源,我们最容易想到的就是来电记录、通话录音、工单记录、知识库和CRM,这些当然是12345热线最基础,最直接的数据,但并不是全部,为了帮助大家系统化的理解12345数据,用如下逻辑架构图展示:

1582857111507842.jpg


最上面是我们标准的12345闭环工作流程,为了支撑这个流程需要静态的基础数据,与此同时流程运行中又在源源不断的产生着动态的运营数据,这样构成了完整的12345数据源体系。

一、12345数据源分类介绍

       为了方便理解现将12345数据源分为静态数据动态数据基础数据辅助数据结构化数据非结构化数据, 相关名字定义未必专业科学,只为了方便归类和理解。


1582857182776763.jpg

   1、静态数据  支撑平台运营的基础数据和辅助数据,是非运营中产生的相对固定的数据,一般需要在系统上线前准备就绪,包含:

     1)基础支撑数据:如12345涉及的部门及联系人、工单分类标准,工单内容热点标准、工单流程等...

     2 )  辅助数据:为了让12345大数据分析更加精准科学可以引入城市人口法人信息库、机构组织库、GIS地理信息库等第三方辅助数据。

 这两项构成了12345静态数据;

      2、动态数据   指12345在实际运营过程中产生的数据, 从数据表现形式上分为结构化数据和非结构数据。

1)结构化数据:包括来电群众信息CRM数据、运营中不断完善的知识库数据、不断产生的工单数据等。

2)非结构化数据:包括通话录音数据、群众提交和职能部门办理中产生的图片数据、视频数据、音频数据等;

动态数据是12345数据宝矿的主体,随时时间的积累数据量越来越大,也是12345大数据分析的主要对象

二、12345热线标准化数据探索

    在以上数据中有一类数据特别重要,暂将他们命名为“标准化数据”,包括工单类型、CRM类型、热点类型、渠道内容等,这些数据是座席记录工单、部门处理工单时通过人工方式或通过AI智能研判时产生的,相当于群众身份、工单内容的特征标签,这个标签对12345大数据分析来讲非常重要,可以说没有了这些“标签”,工单数据就少了灵魂。目前关于工单热点分类国内尚无统一标准,这就对全国各地热线数据的对比分析造成了一定的障碍,当然通过强大的文本语义分析工具可以对工单标题内容进行自动分类,但是仍然无法替代工单内容人工分类的作用。 

目前各地12345工单内容分类方式、数量、颗粒度不尽相同,如某些省会城市的工单内容按四级900余种设计,也有部门三四县城市采用的是三级200余种的标准。

另外工单内容分类方式存在着地区差异,如北方有暖气供热方面的特殊诉求,南方有水产养殖方面的特殊热点,需要各地市在参考借荐的基础上因地制宜形成本地特色的12345标准化数据体系。

与此同时要根据民生诉求的发展及时更新,如新冠疫情、网贷等新事务出现后要及时更新补充。


 除了工单内容,对CRM群众数据的标注也非常重要,如群众的职业、年龄、性别、沟通时的语气语态、历史诉求记录等,这些数据对于大数据分析也很重要,建议有条件的地市在工单内容中加入信息采集。

三、12345数据源管理的问题及思考


1、数据分析的基础是数据源   

所谓巧妇难为无米之炊,12345数据分析的成果很大程度上依赖于数据源,因此请特别重视数据源,数据源的收集与座席一线工作存在一定的矛盾,数据源越丰富座席操作越复杂,作者本人在参与很多地市12345项目升级时就遇到座席对新平台操作抵触的情况,建议数据源采集以智能化+人工方便并行,尽量减少人工操作,但同时要加强培训,强化座席的数据意识,提升座席数据分类能力;

2. 普遍重动态数据,轻静态数据 

静态数据虽然不是12345数据核心,但是对工单数据的质量至关重要,特别是静态数据中的标准化数据,是12345数据体系的地基,对大数据分析更是非常关键,在国家标准形成之前希望各地市通过借荐学习确保标准化数据的科学、合理、完善。

3. 非结构化数据蕴藏宝矿  

12345运营过程中产生的通话录音数据、工单相关的视频、音档、图片数据都是非结构化数据,而录音数据通过ASR语音识别生成文字后,可以通过文本分析技术中的热词、新词、高频词分析,成为社情民意与舆情监测的重要数据来源,并可对工单信息形成非常好的补充;

4、辅助数据

 辅助数据包括企业法人信息库、组织机构数据库、地理信息数据库(包括小区、建筑物)等,这些数据对于12345平台大数据分析非常重要,建议通过地区大数据交换进行相关积累。有助于大数据分析中的精准分析,如涉及市场管理部门的数据分析中企业数据、涉及教育问题会用到学校数据、涉及物业服务的小区和物业公司数据等等,都将对12345专报分析提供重要支撑。

5、标准化数据建设至关重要

我们期待有实力的组织或机构能在全国范围发起12345标准化数据的建设项目,也希望各地12345运营主管积极配合,使整个行业早日形成国标+省标+市标的相对标准又符合地方特色的灵活的标准化体系,并对突发事件能够建立起专业权威以及快速的标准化数据响应机制,让全国各地的12345平台都有可以参考的专业标准。

上一篇:探索12345数据宝矿-第二篇...
下一篇:疫情之中困难重重,金讯通攻坚克难...

分享到