数据治理分析平台汇聚多渠道热线数据源网格数据、传统媒体、信访数据、领导信箱、网格舆情、社情民调、互联网+督察、人民网留言,对数据清洗加工,应用AL大数据分析模型实现热线挖掘、智能预警、趋势预判。进行数据采集、规范加工、算法模型应用。
数据规范加工是统一数据标准、完善数据元素的基本功能,利用NLP自然语音处理和大模型应用技术,为系统内置开发了丰富的数据规范算法,围绕人、时、地、事、涉事主体、业务标签等实现了从诉求内容中自动提取人名信息、时间信息、标准地理信息(省、市、区、街镇和经纬度信息)、涉事主体信息、诉求要素标题信息等。
以规范加工后的高质量数据元素为基础,设计、开发多维度的数据分析模型,实现数据分析,包含了关联分析模型、智能分类模型、筛选算法模型、相似工单研判模型、业务归口模型、聚类分析模型、热点分析模型、新点分析模型、苗头性问题模型、堵点分析模型、区域顽疾分析模型、高频高发分析模型。根据数据分析需求,利用业务标签筛选专项数据记录,按数据分析模型运算应用,交叉分析具体的热点、新词、苗头性、治理顽疾或高发频发等问题。
通过与生产系统对接自动获取全市12345热线平台所沉积的数据信息。主要包括来电数据、通话录音、工单数据、知识库数据和群众信息。
1)数据源探究-12345数据体系及问题分析
2)数据治理流程逻辑
3)12345数据源支撑体系--结构化&非结构化
4)数据治理方法论
系统对采集的12345诉求数据进行清洗加工和规范标准处理,根据清洗模型清洗过滤掉无效数据,根据规范标准模型提取要素丰富数据元素和标准化数据元素。
1)数据规范化--分类标准与标签体系建设
2)热线行业创新的地方标准
支持关联分析模型、智能分类模型、筛选算法模型、相似工单研判模型、业务归口模型、聚类分析模型、热点分析模型、新点分析模型、苗头性问题模型、堵点分析模型、区域顽疾分析模型、高频高发分析模型等算法开发及应用。