大数据时代背景下的统计改革
大数据,一个被普遍认为具有数据体量巨大、数据类型繁多、商业价值高、数据更新迅速、获取方式灵活等多重特点的新概念,已经成为继云计算、物联网之后,全球信息技术领域的又一热议。大数据时代的滚滚浪潮,不断冲击着政府统计管理体系和统计理念。大数据对政府统计工作带来的影响前所未有,加快研究利用大数据来推动统计改革和促进统计工作,是我们面对的重大课题。
一、“大数据”的内涵及其统计功能
(一)接触大数据,了解大数据。 尽管对大数据还没有形成统一的概念,但实践与应用走在了前面。学术上的主流定义认为,大数据指的是所涉及的数据量巨大,无法通过目前主流软件工具,在合理时间内达到有效抓取、管理和处理,并形成为决策中有价值的信息。大数据一般可分为结构化数据、半结构化数据和非结构化数据,并且是以非结构化数据为主(大体上,结构化数据占10%、半结构化数据占5%、非结构化数据占85%),包括所有格式的办公文本、图片、各类报表、视频、音频等等。大数据的实质是在数据传输、收集、储存的基础上,对数据的分析挖掘,并由此获得凭直觉难以发现的有用信息,从而揭示数据隐藏的规律和发展趋势,为决策者所用。
(二)大数据的功能。 首先是数据采集有别与传统的统计方法,广泛使用的传感设备、信号识别技术,数据收集编译和可扩展的存储系统等,使数据收集的时效提升,积累和存储方便快捷;其次是大数据的筛选分析功能在提高和优化业务方面具有更强的统计优势;第三是大数据的处理技术使汇总的资料规模更大且更具多样性;第四是大数据在处理跨部门、跨领域的预测中占据更多优势,预测的倾向性更注重相关关系,大数据功能的统计色彩极为丰富。
大数据时代,每个人的身边都存在着海量、丰富并且可深入挖掘的数据与信息,人人生产数据,时时产生数据。在方兴未艾的大数据时代,对统计工作者而言,最大的考验和“本领”是看能否对这些海量的数据信息进行充分的开发,找出数据之间隐藏的“规律”与“关系”与利用,深度开发利用大数据,使大数据为我所用,成为中国统计基础数据的“第二轨”,更好地服务于经济社会发展。
(三)使用大数据。 大数据与政府统计的结合,可以使统计结果更精确、统计频率更快速、统计内容更完整。可以用全面数据代替抽样的局部数据,获取的数据更全面、更准确。大量互联网、物联网、行政记录等电子数据的易获取,由此将转变统计机构获数的传统方式,为政府统计收集可能涉及的大数据的渠道和源头多种多样,政府统计在大数据的主要生产者和利用者中逐步扮演主角;将大数据处理转化成为结构化类型,将大数据进行分类或分层,使之范围清晰、含义明确,将统计结果经过统计模型检验以验证其科学性,辩明“杂音”,将大数据“脱敏”,使之合乎法律依据,由此对政府统计处理大数据需要增强一些基本要求和条件;大数据占较大比重的非结构化数据,使政府统计的数据处理不仅要处理结构化数据,而且也要善于处理非结构化数据,由此催生将非结构化数据转化为结构化数据的理论、方法和技术的研究和应用。
大数据是正在到来的数据革命,它将改变政府、商业与我们的生活。大数据之大,不仅仅在于容量,更在于通过数据的整合和分析多次利用,发现新知识,因此,大数据作为不会枯竭的资源,正在成为国家和政府层面的发展战略。因此,将无所不在的网络数据、物联网数据、行政管理记录、企业销售记录、搜索记录等海量数据纳入统计范畴,融入到政府统计中来,及时捕捉反映现在和预测未来的动态信息,政府统计功能大转变的良机看好。正如马建堂局长所说:“大数据极大地丰富了当前统计改革的内容,并对改革目标的实现起到促进作用”。
二、当前政府统计的改革与发展现状
在中国统计改革创新史上,自2011年启动而备受关注的以企业一套表为核心,以调查单位名录库为基础,以统一的数据采集处理软件为手段,以统一的联网直报系统为平台的统计“四大工程”建设,掀开了中国统计改革大序幕,谱写了统计信息化、公开透明化的新篇章,成为推动统计生产方式和生产流程再造最为炫目的“利器”。它成功地建立了统一完备的“基本单位名录库”,使“要有数、先入库”成为现实,“不入库、没有数”成为共同遵守的规则;它强有力地推行企业“一套表”制度,实现了统计的统一规范,增强了调查效能;它卓有成效地搭建了一个功能强大的“数据采集处理软件平台”,减轻了企业统计负担,提高了数据质量;它全面推行了安全高效的“联网直报”系统,提升了企业和基层统计机构信息化水平,实现了统计流程的再造。包括广西1.5万家在内的全国70多万家“四上”法人单位在统一的数据采集和处理平台上,通过互联网直接向国家数据中心或国家认定的省级数据中心报送统计数据,中国统计数据生产方式从此焕然一新,统计改革迎来“直报”新纪元。
随着统计“四大工程”建设的深化拓展,服务业统计、城乡住户调查一体化、房地产价格统计制度方法、社会科技和文化产业统计、就业与工资统计制度、能源环境统计以及工业、投资、贸经统计改革接连启动,GDP核算方法改革、新型业态分类标准、统计指标环比、统计质量保证框架、普查和抽样调查方法的创新精彩纷呈,各项统计制度改革顺利推进。统计改革与发展态势超乎统计人的想象,超出公众的预期。
历时三年来的改革,为全面深化统计改革,应对大数据对政府统计的挑战打下坚实的基础。当前, 全面深化统计改革正在全国如火如荼地展开,远景目标之一是到2015年实现“三个全部”,即:所有由调查对象填报的调查全部通过互联网直接向国家数据中心报送;所有现场调查全部由调查员手持电子终端现场采集数据并通过网络直报国家数据中心;全部国家统计调查均在统一数据采集处理平台进行数据处理。
改革成果是喜人的,但改革之路也充满艰难。当前政府统计遇到的问题,主要表现在统计制度难以满足统计需求的增长、统计产品落后于实际需求、统计标准制定滞后于形势发展的需要、统计数据的再利用程度低、新领域统计方法创新不足、服务业统计薄弱、采集的数据质量不高、发布的数据权威性受到挑战、部门统计管理协调有待强化等方面。为此,政府统计改革应多集中于紧扣时代需求、跟踪决策效能、改进统计制度、丰富统计指标、创新调查方法、强化质量控制、拓宽服务领域、夯实基层基础、改善统计用户关系、加强部门统计管理、整合大数据资源等方面。
三、大数据时代背景下政府统计面临的挑战和机遇
统计工作是党和国家实现科学决策、推进国家治理体系和治理能力现代化的重要基础。统计的基本任务是对经济社会发展情况进行统计调查、统计分析,提供统计资料和统计咨询意见,实行统计监督。统计已成为国家搜集资料、弄清国情、制定决策的重要手段和依据。政府统计数据是大数据的组成部分,统计部门是发展大数据的重要力量,在大数据时代背景下,政府及经济管理部门更需要通过统计了解经济的规模、结构、发展水平、效益等动态,企业、社会公众更需要通过统计数据知晓商务活动、产品市场、收入预期的走势,政府统计工作既面临着严峻挑战,也面临着难得机遇。
(一)当前统计工作面临着新的课题。 党的十八大以来,以习近平为总书记的新的中央领导集体,对经济增长速度观、科学政绩观、统计改革提出了一系列新思想、新观点、新论断、新要求,体现了中央对统计工作的高度重视,对统计数据质量的高度关切,为确立统计发展新理念,全面深化统计改革指明了方向。十八届三中全会明确提出,建立国家统一的经济核算制度、完善就业失业监测统计制度、建立创新调查制度、完善收入分配调控体制机制等具体改革任务。2014年1月16日,国家统计局出台的《全面深化统计改革总体方案》,提出建立健全科学完整和有效引导科学发展、提质增效、转型升级的统计指标体系,全面反映五位一体总体布局建设进程的统计制度体系,宣示了国家统计局推进统计改革的决心和勇气。在贯彻落实全面深化统计改革的进程中,如何理性地看待经济指标与社会人文指标的取舍,处理好经济社会发展的长远利益与短期成效之关系;在经济社会发展的进程中,如何客观地对政府重大决策进行统计监测,真实地反映发展成果?在建立政绩评价指标体系的实际操作中,如何科学地赋予考核指标的权重,存量与增量、总量与结构、速度与效益、数量与质量、平均与差异等量化指标,熟重熟轻?在大数据时代对政府统计工作产生巨大冲击的背景下,如何有效地推动统计改革适应新时代的要求,更大程度地满足政府、部门和社会各界对统计信息的刚性需求?如此种种,政府统计部门的国家意识、使命意识、责任意识和担当意识,责无旁贷。
(二)当前统计改革面临着新的难点。 统计制度只有不断改革与创新,才能保持统计发展的活动和动力。众所周知,投资、消费、外贸出口是支撑经济发展的三驾马车。过去,为顺应刺激经济发展的要求,投资的过度膨胀导致其占GDP比重偏高,引起社会对投资统计数据的质疑。今后,为顺应专业化管理的要求,政府部门分工将越来越细,统计改革遇到的新难点将不可避免。目前商贸、第三产业尤其是服务业数据分散在众多行业主管部门,由于缺乏数据资源整合,统计体系呈现“碎片化”特征,严重制约了消费信息使用的完整性有效性。针对这些难点问题,加快投资统计改革,打破消费数据沉淀于消费者手中的格局,消除服务业统计资源的“部门化”、挖掘游离于市场调查的“网络型”大数据,进而提高统计改革的针对性,势在必行。
(三)当前数据采集处理技术遇到的新难题。 大数据体量之大,意味着数据生产者并非统计部门一家独尊,大数据挖掘技术的诞生,各类网络技术记录下原始数据的可测量性、各类行政记录中统计数据的可查询性,各类商务活动中市场信息的可搜索性,迫切需要政府统计跟上互联网、物联网、云计算等数据智能化采集技术应用的步伐。大数据商业价值之高,意味着IT技术与统计工作的深度融合趋于成型,政府统计实行“联网直报”所包含的企业属性信息、商业秘密等统计原始数据,在频繁的网络在线活动中需要更强的技术安全保障,统计数据安全性受到巨大挑战。大数据处理速度之快,意味着数据处理与分析技术并非统计部门独有,统计工作以分析处理结构化数据的技术优势不再一枝独秀,对大量存储于各处的所有格式文字、图片、视频、音频、社交信息等结构化或半结构化数据进行挖掘,分析非传统统计意义的数据之间的内在关系,生产出高质量的统计数据产品,政府统计增强数据存储能量,提升处理技术,大势所趋。
(四)当前统计服务面临着新的变化。 随着以电子商务、即时通讯、搜索引擎和网络游戏为主体的网络经济迅速发展,数据将实现全社会共享,社会公众对数据的需求层次、质量和公开、透明的程度将不断提高,GDP、CPI、PPI、PMI、甚至还有房价、工资、就业等统计指标的发布,不仅各级政府官员及其管理决策者关心,企业经营者同样需要。而大数据时代催生的大批民间咨询、市场调查、网络调查机构的服务领域也将从商务领域向公共领域渗透,官方统计有可能不再作为获取公共统计数据信息的唯一渠道。在同样的价值需求下,社会公众可能更加关注统计数据的产品属性,倾心于以可视化和即时交互方式带来的便利性,统计服务多样化、统计产品市场化,统计数据发布公开化、透明化,人心所向。
(五)当前统计需求面临着新的机遇。 需求是统计的生命之源,大数据时代对政府统计推动调查制度健全、业务流程再造、服务领域拓宽、技术人才培养,无疑是一个良好的机遇。现行政府统计推行的“联网直报”系统、手持PDA采集系统、电子记账系统、地理信息系统和遥感测量技术在统计调查中的应用,促进政府全面统计和抽样调查制度的改进,制定或再造适应大数据的业务流程成为必然;大数据为扩大统计资源获取空间,丰富统计产品功能,提升统计信息社会价值,提供了共享平台,推动政府统计部门提升统计服务能力,提高数据挖掘分析能力、拓宽统计产品服务范围、树立政府统计权威性成为必需;大数据促进政府统计工作思维的大转变,各项统计工作更加专业化,数据网络技术性要求更高,统计服务能力技术保障性更强成为必要。面对大数据,人才是关键中的关键。在统计机构现有人员中,开放人才培养使用的大门,实施对各级统计人员统计能力的大轮训,实施对统计专业技术人才队伍的大培养,开辟经济、大数据知识的大讲坛,实施对重点领域人才和统计领军拔尖人才的大交流;建立大数据应用知识新学科,让更多的大数据知识走进讲堂,让更多的数据分析专家、学者和科研人员掌握打开大数据之门的金钥匙、参与大数据的分析研究,时不我待。
四、把握大数据机遇,促进全面深化统计改革
作为统计工作者,我们更多时候在问自己,面对大数据,统计还有没有优势?统计的优势如何发挥?大数据时代背景下,政府统计无疑仍然是宏观经济数据的主要直接生产者,无疑是大数据挖掘、整合、研究、应用的主要承担者、推动者和引领者。大数据研究运用需要“百花齐放、百家争鸣”,但统计标准和法律规范最终也应达成共识、趋向统一。这也是对社会的负责,对公众的负责。我们有理由相信,不久未来,统计将成为最吃香的职业之一,但也必须清醒地认识到,坐失统计改革良机,就会失去大数据的话语权,统计事业发展的成本和代价就将大大增加,从某种意义上说,主动应对大数据的挑战,主动顺应中国改革的趋势,加快推进中国政府统计的改革,将是对统计理论和实践的重要贡献。政府统计作的许多铺垫工作和实质性改革,为应对大数据的挑战创造了先机:
(一)以新理念设计统计改革。 国家统计局制定的《全面深化统计改革总体方案》提出以改革创新的精神攻坚克难,破解难题,显现出大周期设计、整体设计之理念。《方案》规划了以建立健全反映五位一体总体布局建设进程统计制度体系为亮点之一的统计改革总体目标,提出了切实可行的5项任务和14项重点工作,对改革任务和重点领域的统计工作提出了明确的时间表和路线图,陆续出台了推进统计改革落实到地的具体方案,内容涉及到14个方面的重点改革。比如陆续印发了《建设现代化服务型统计行动方案》、《网上零售统计改革总体方案(试行)》、出台了京津冀协同发展统计监测工作的指导意见、实施《部门服务业财务统计报表制度》和《部门服务业综合业务统计报表制度》、开展了固定资产投资试点、健康服务业单位认定、统计指标分类标准制定等,以此引领和指导其他行业领域的改革,取得良好成效。
广西立足区情,及时成立史上规格最高的全面深化统计改革领导小组,在国家《全面深化统计改革总体方案》的框架上,本着既符合国家统计局确定的统计改革方向,又突出了广西统计改革的特色,制定了《广西全面深化统计改革实施方案》,设计了33项改革任务,并将统计改革部署上升到自治区政府层面予以推动,提出改革的首要任务是加强国民经济核算工作,其次是加强重点专业领域统计制度方法改革,包括建立健全网上零售统计调查方法体系,利用大数据把网上零售纳入社会消费品零售统计中。第三是建立对广西政府重大战略实施的统计监测体系,使之成为有特色的亮点。第四是将解决影响统计数据质量和统计服务水平的问题作为改革任务,努力提高统计反映新形势、解决新问题的能力。
今年以来,广西密集部署和推出了改革思路的一系列动作,印发了《广西统计质量保证框架管理体系(2014年)》、《广西反映经济转型升级统计指标体系测算方案》、《广西季度地区生产总会统一核算方案》、《市县区其他营利性服务业增长速度测算的方案》、《地方统计调查项目审批工作流程(暂行)》;开展全面建成小康社会统计监测工作、固定资产投资统计改革试点;推动桂林市服务业统计改革综合试点进入实质性阶段,为充实网络交易大数据采集提供示范性经验;与自治区商务厅研制《广西重点企业电子商务统计报表制度》;结合经济普查结果,开展大数据在贸经统计中的综合开发应用工作等新举措,初步形成了自上而下、顶层设计、部门协同、上层推动的统计改革新格局。
(二)以大服务彰显统计魅力。 在政府“两公开、一服务”理念推动下,伴随统计“四大工程”建设的深入推进和统计改革的全面深化,以及市场化、信息化、国际化的加速发展和大数据时代对统计工作的影响,面向党委政府决策、面向社会公众、面向调查对象做好服务的“三个面向”统计的服务功能越来越重要。面对复杂多变的经济形势、更加艰巨的工作任务,国家统计局提出了建设现代化服务型统计的目标要求,广西统计局主动作为,加强对重点行业、重点项目和重要指标的动态监测,系统研判各行业和各领域运行变化趋势,深入重点企业开展经常性调研或专题调研,准确把脉全区经济形势,及时向自治区党委、政府报送统计分析、统计信息。重点打造的《广西统计专报》、《统计要情手册》、《广西统计年鉴》成为自治区领导必看、必讲、必带的常用资料;重磅推出的若干统计分析和研究课题,获得自治区领导高度评价和重要批示;重力解读的统计数据和信息,深受社会的关注。
广西统计局推动大服务格局的形成。 推动自治区政府行文部署、有10多个厅局单位参与的建立重大战略决策实施进程的统计监测报告制度及工作协调落实长效机制,以及服务和促进稳增长、调结构、转方式、惠民生政策措施的落实。内容包括广西与全国同步全面建成小康社会;把广西打造成西南中南地区开放发展新的战略支点;建设21世纪“海上丝绸之路”;中国-东盟“钻石十年”开放合作战略;实施北部湾经济区和西江经济带“双核”驱动发展战略等等16个重大战略决策。
广西统计局充分挖掘统计资源、建设宏观数据库以创新服务。经过半年来的努力,与清华同方公司提供技术支持的广西经济社会发展宏观数据库建设接近尾声,涉及工业、农业、投资、商贸、服务业、科教文卫、民生等29个行业主题,7500张表、加载数据90多万笔,包括广西区域内国民经济各个行业部门的主要行政记录、自治区、市、县区的国民经济重要统计数据;全国31个省市的主要指标数据、国际主要经济体的指标数据、中国与东盟国家的主要指标数据。数据库预计将在今年9月在线运行,届时,社会公众可以通过自治区统计局外网查询数据、访问垂询。
(三)把握大数据良机助推统计改革正当其时。
面对大数据来袭,国家统计局局长马建堂去年10月在国际研讨会上慷慨致词: “大数据潮流浩浩荡荡,逆之者败,顺之者昌。中国统计系统要做拥抱大数据的弄潮儿。”政府统计的职能依法赋予,因而拥有其他部门所无法比拟的优势。在大数据时代背景下,政府统计研究制定的统计分析与统计方法、统计标准、统计法律法规仍然是大数据有效采集和应用的基本遵循。
应对大数据必须基础建设及时配套。 时至今日,以周期性普查为基础,以抽样调查为主体,以必要的全面报表、重点调查等为补充的统计调查方法体系日臻完善,政府统计对数据资源的采集与应用依然处于主体地位,政府统计面对大数据,并非束手无策。对于直接生产大数据的企业单位名录,已经是一库在手,并且经常性地动态更新维护;对于规上企业,采用在线联网直报,至于规下企业采取多方采集,抽样方法和电商企业合作办法解决。政府统计主要以企业“一套表”联网直报为主,结合运用抽样调查来搜集基础数据,实现了统一制度设计、统一布置调查任务、统一确定调查单位、原始数据由政府统计和主管部门直接采集、统计过程高度可控、数据集中存储处理和多工具分析,这些较为规范的统计方法,为开展大数据抓取、处理、分析和应用奠定了基础。
着力研究大数据的关键性问题刻不容缓。 国家局已经组织、参加国际国内多次研讨,开展与阿里巴巴等10多家电子网络交易企业建立大数据应用战略合作,与厦门大学开展大数据标准与统计应用研究,与厦门赛凡信息科技合作开发研究等等。当务之急是,政府统计必需努力推动大数据研究应用的有关基础性工作,解决难题:1)统计标准及统计制度和相关法规(行业标准、统计范围、统计指标的口径、计算标准等);2)大数据挖掘与处理技术研发。调查方法的创新、采集方式的完善、信息化基础的再建、数据处理的改进、分析手段的创新;3)政府统计推动与政府部门之间、政府统计与电商企业合作,形成大数据资源联合与合作挖掘、共享机制。积极应对数据利益格局,增强统计改革合力,发挥各方面优势,开放式统计工作才能走在大数据时代的前列。正如马建堂局长所说:“唯有改革,中国统计才有出路。唯有创新,中国统计才有前途。”
先行先试的统计创新理念值得提倡。 广西统计局审时度势,以敢为人先的精神先试先行,“广西大数据与宏观统计监测中心”项目建设起步良好。今年3月份全国“两会”期间,全国人大代表、广西统计局局长杨和荣向大会提交了中国加紧研究大数据标准和应用的提案,并接受了中国新闻网等多家媒体采访、报道。目前,在省级层面,广西率先在全国31个省级统计系统举起大数据之旗帜,筹建“广西大数据与宏观统计监测中心”项目。此举得到自治区党委政府的充分肯定,7月16日,广西自治区党委彭清华书记到广西统计局调研时指出,广西统计系统要主动适应国家关于统计改革的部署和大数据时代发展潮流,要主动适应大数据时代潮流,当好大数据应用的排头兵和先行者。在自治区党委政府领导的重视支持下,自治区发展改革委等部门正在帮助自治区统计局“广西大数据与宏观统计监测中心项目”抓紧立项,有关事项正在紧锣密鼓当中。
“广西大数据与宏观统计监测中心”的建设目标是充分利用大数据技术,通过研究制定大数据统计标准,建成大数据采集和研究应用基地,挖掘大数据资源价值,发挥大数据的预测功能,实施大数据应用示范,建成大数据资源库和广西宏观经济与社会发展信息资源库,建成大数据与宏观统计监测资源共享服务平台,实现大数据与宏观统计监测资源的交换(交易)与共享。为统计调查对象和社会公众提供更加全面、准确、高效的服务, 为推动广西大数据产业发展服务。
大数据是“未来的石油”,得数据者得天下。大数据,看似抽象,却时刻发生在我们的周围;笔笔数据,看似简单,却蕴涵着丰富的市场信息;条条信息,看似独立,却构建起密切关联的价值链条。统计与数据密不可分的天然联系,统计是大数据时代的宠儿。只有积极拥抱大数据时代,勇做大数据的弄潮儿,挖掘数据宝藏,做大数据开发的强者,才能自信、自如地徜徉畅游在大数据的海洋中!
主要参考资料
1.许小乐,“大数据”与政府统计改革,调研世界2013年第5期;
2.国家统计局印发的《全面深化统计改革总体方案》、广西统计局制定的《广西全面深化统计改革实施方案》;
3.报请自治区政府印发的《关于进一步加强统计工作的决定》;
4.大数据与宏观统计监测中心项目立项有关材料;
5.自治区统计局人事处、综合处、贸经处、服务业处、研究所、资料中心提供的有关资料。