【稿件来源】南方日报出版社

【作者】蓝云


         《从1到π———大数据与治理现代化》,蓝云编著,南方日报出版社2017年5月版。 

天天说舆情,日日道舆论,但到底什么是舆情、舆论,两者有何关联?舆论场又是怎么一回事,中国是两个舆论场吗?存在“舆情学”吗,舆情研究的基本价值、共识及公理在哪里?舆情与“国家治理体系和治理能力现代化”又有何关联……这些问题,值得深入探讨。

“舆情”并非正式学术用语,却是个热词,在百度上搜索词条,共有2,190,000条信息。在中国语境里,“舆情”一般指“与公共事务或公共管理有关的在新媒体平台上有高显示度和关注度的传播事件”。有学者从民众社会政治态度和国家管理的角度,将“舆情”定义为“在一定的社会空间内,围绕中介性社会事项的发生、发展和变化,作为主体的民众对作为客体的国家管理者产生和持有的社会政治态度。”丁柏铨教授在《略论舆情——兼及它与舆论、新闻的关系》中阐述,舆情的内涵既可以是公众的意见,也可以是公众的情绪。这个定义突出了民众与国家管理者之间的利益关系,反映民众对国家管理者行为的评价、认同和接受程度等方面的内容。

“舆论”是个学术用语,是“公共舆论”简称,在上个世纪50年代开始社会学和传播学就有研究,指“大众对某个公共议题的关注和意见”。《中国大百科全书·新闻出版卷》的“舆论”专条中释义为“公众的意见或言论”。舆论所对应的论,在古汉语中通“伦”,原指条理。据考证,古代书籍的写作体例分为“著作”“编述”“钞(抄)纂”三大类,由钞(抄)纂而成的书籍,古人称为“论”。现在一般是指一种学说或者是分析阐明事物道理的文章、理论和言论。

舆情没有公认的英文,在英文学术里,一般和舆论一样,翻译成Public opinion,也有偏重公众情绪研究的专家,将舆情翻译成Public emotion或Public sentiment。舆情翻译的困境,与“网络问政”一词是一样的。2009年在法国巴黎,笔者作为中欧社会论坛中方组组长与欧洲同行交流时,也是苦恼“网络问政”一词无法恰当翻译,只好用“网民的公共参与”( Public participation of Internet users)代过。

按照笔者的理解,舆情、舆论最大的区分在于向度,“确定性”是其中标杆。舆情是公众对公共事件或人物多向度的意见、建议、情绪的总和,与不确定性有关,是多向度;而舆论就是公众对公共事件或人物相对一致的意见,体现为单向度或双向度,与确定性相关。

对一起具体的事件而言,公众的多元化意见、情绪、意见走向是一种过程,是动态呈现,会有起伏,最终会达到一或两个平衡点、共识点(这种共识点可以理解为“最大公约数”)。其间的过程,更多呈现为舆情,结果更多呈现为舆论。

对一些地方官员而言,“正面舆情”“负面舆情”“好舆情”“坏舆情”等涉及到价值性的判断经常脱口而出。其实舆情作为公众意见的集结,有其客观属性,不依主体的价值、道德评判而左右其存在或演化,用“真实舆情”“失实舆情”等客观性判断会更准确。舆论则包含一定的人为意志和政治属性,可以有正负、好坏之分。在这个层面,舆情与舆论的异同,类似于新闻与宣传。

在实务层面,通过公众讨论、事件纠正、媒体传播、主体博弈等内向力量,舆情将被引导、演化。当舆情产生聚集时就可以向舆论转化,这种转化,除主体的自身因素外,在很大程度上还取决于外部的环境。一般情况下舆论需要舆情的支撑,也总是由舆情发展而来,但舆情不一定上升到舆论,如可以通过工作疏导,消除在萌芽状态,也可以通过强权管理,暂时压制。对舆情的引导就是要使舆情不转化为舆论或转化为良性舆论。“舆情引导”相比,目前更常被官员、媒体使用的是“舆论引导”,严格说来,有些使用是不当的。笔者认为,舆论引导是指媒体,尤其是主流、传统媒体,形成相对一致的意见,短时间内集合成一股集中化的外向性力量,以此来引导、带动社会方方面面,实现相对一致的行为。

明确了舆情、舆情的含义,也就不难理解舆论场。“舆论场”一词最早源自新华社前总编辑南振中,他于2011年7月撰文指出:在当下的中国,客观存在两个“舆论场”,一个是党报、国家电视台、国家通讯社等“主流媒体舆论场”,忠实宣传党和政府的方针政策,传播社会主义核心价值观;一个是依托于口口相传特别是互联网的“民间舆论场”。

“场”原本是物理术语,有引力场、电磁场等概念。能成为舆论场,必有组织中心、话语体系、指令系统、运转通道、运营模式、人员组成、退出机制等要素。笔者认为,按此要素,影响中国民众的有3.5个舆论场,前两个与南振中先生说法一致,第3个是以CNN、BBC、《纽约时报》等为代表的国际媒体,第3.5个是数量众多、影响力不一的海外华文网站。由于技术平台、信息传播等限制,第3个、第3.5个舆论场以往作用于中国民众的力量有限,可以视同不存在,但随着全球化的进一步推进、国内多元化传播格局的进一步巩固,3.5个舆论场共同发力的叠加效应将更加明显。

分析舆论场,其中一个要诀就是研究话语体系,同样一个意思,同样一句话,在不同的舆论场会用不同的说法。这里面最有代表性的,就是外交辞令,“热情交流”“友好交流”“坦诚交流”“坦率地交换了双方意见”等说话对普通民众而言,意思是差不多的,似乎都很友好,但对外交战线人员来说,含义是大相径庭的。一段时间来,笔者也不太明白外交辞令为何这么拗口,对为何不用大白话也不太理解,直到有一天翻阅前外交部长黄华的著作《亲历与见闻——黄华回忆录》,方才恍然大悟:外交辞令就是一套密文,对文本内容适度加密(不过这种加密的层次、密级,不是特别高),外交工作的特殊性导致一些信息没必要让全体国民轻易了解,只让相关人士掌握即可。不同的话语体系,有其身份识别、价值认同、文本加密等功能。一个能在内心接受并使用“萌”“屌丝”“给力”等网络说法的官员,其基本立场与网民基本理念应不会差距太远。

按照来源来说,舆情可以分为网络舆情、社会舆情和媒体舆情。网络舆情因其庞大的数据量、快速多维的传播特性、便捷的集纳特点、意见的多元化、相对原生态等,可以也应该成为舆情的主体部分,但网络舆情不能成为舆情的全部。按照中国互联网信息中心CNNIC在2015年7月21日发布的调查报告,我国网民规模达6.32亿。这个数字也就是说,全国居民中,一半以上还不是网民。网民中,有发言、转帖、评论等行为的又是少数。经适度校正后,网络舆情可以成为舆情的最真实、最丰富部分。“重视网络舆情,但不单单依赖网络舆情”,这也是日常走访中多地党政官员反复强调的一个观点。或者可以这样说,不重视网络舆情,就是瞎子聋子,如果只重视网络舆情,就可能是偏听偏信。

正是有了网络舆情、社会舆情和媒体舆情“三情融合”的理论认知,南方舆情数据研究院先行先试,在全国范围内建立了一个真正完整的、全维度的舆情数据库,含网络舆情数据库、社会舆情数据库和媒体舆情数据库,个大数据库项目成功的重要支撑。

新闻行业人员广泛接触社会各行各业、深入各类热点事件现场,上达庙堂,下通乡野,具备较好的业务素质,是优秀的舆情信息搜集者、研判者。记者所掌握的新闻素材,在报纸、网络上呈现的,只是其中一部分,其他素材可以转化成舆情产品。

一件事件或一个线索的新闻价值、舆情价值有交集,但不完全一致。有的事件(线索)新闻价值大,但舆情价值未必高,这种事件往往是已经发生或确认发生的;有的事件(线索)舆情价值大,但新闻价值未必高,这种事件往往是还没发生的,属于非确定性。2014年4月5日,广东省东莞市裕元鞋厂发生了数万工人参与的停工事件,此前的3月29日,南方舆情数据研究院通过《南方日报》公开预警,这种建设性的舆论监督,促进了事件的良性、快速解决。该起事件,被一些学者称之为 建国以来最大的停工事件”,南方舆情之所以能成功预警,就得益于对2014年1、2月南方报业读者报料(投诉)电话的大数据分析,这些分散的、语焉不详、时间不一的读者单个来电,新闻价值未必大,很难在报纸上单个刊登新闻,但舆情价值非常高。4月上旬,舆情从隐性成为显性,事件爆发,中外媒体广泛报道,新闻价值大大提升,舆情价值逐步降低。一般说来,客观性、显性内容属于新闻,而网民情绪等主观部分、隐性及猜测性部分、应对及关联性部分,属于舆情。厘清这些,新闻作品与舆情报告的界限,也就清晰了。媒体采编人员多一些智库分析、舆情提炼思维,只会提升、强化媒体报道质量,而不是相反。一份立场鲜明、数据扎实的舆情报告,同样能推进社会公平正义、实现新闻理想。参与信息服务、新型智库建设,对处于转型升级阶段的中外主流媒体也是一条新路。英国《经济学人》2013年的收入为3.46亿英镑,广告收入只占3成,智库服务、政府咨询等服务业务占了7成。

一名合格的舆情分析师需要具备哪些要素呢?其一,需要数据搜集能力,在网络时代,尤其要谙熟互联网各个平台及工具,实时掌握一手信息;其二,需要信息处理能力,最好有一定的数理统计知识或思维,能提炼、集纳、压缩海量数据;其三,需要专业分析能力,对某一个行业有长时间跟踪及研究,像医生职业一样,提倡舆情分析师的业务分工,做“专科式”分析师,而不是“万金油式”,从长远来说分析师的职业认证、资格认定,势在必行。

目前关于舆情的各类书籍、讲座、培训比较多,其中不乏一批专家学者、业内人士、党政官员的真知灼见,但也充斥着民间“阴谋论”、网络段子、新闻案例的简单汇编,严格地说来,“舆情学”并未真正成型。一门学科,必有其基本概念、基本前提(公理)、推导过程和成功作用社会的实例。以欧几里得《几何原本》为例,23个定义、5条公理和5条公设,推导出一个纷繁复杂、多姿多彩的现实世界。当我们在现代社会感叹航天飞机、摩天大楼的神奇时,有多少人有能明白其中有2000多年前一位古希腊老人的重要功绩。

如果说,一定要在当下建立“舆情学”体系,除了上述谈及的舆情、舆论、舆论场、新闻等定义之外,还有必要确认几个基本共识(也就是无需证明的“公理”),这些公理涉及民主与法制、公平与效率、人与物、集体与个体等若干组关系。几乎在每一起焦点舆情事件中,这些关系都会被拷问一遍,比如在2013年“7·23”温州动车事故中,是推进高铁尽快恢复通车,还是集中力量抢救小伊伊;2015年“6·1”长江沉船事故中,媒体的关注点是应该集中在讴歌救难官兵,还是哀悼死难者。这种拷问背后,是不同的舆情应对思维,是舆情学公理,也是公共管理人员的执政理念。建立舆情学的过程,正是中国互联网生态逐渐清晰、国家治理体系逐步建成的过程。

能成为一个独立的学科体系的另一个标准是,能进行数学模型,进行数理推算。现代科学认为物质、能量、信息是客观世界里三个基本要素。舆情正属于信息范畴。1948年,香农发表标志性著作《通讯的数学原理》,“信息论”由此横空出世。信息论里的诸多研究方法,有助于舆情研究,比如说“信息熵”的概念

“信息熵”也是舶来品,源自物理学上标志无序状态的“熵”。前文已述,某件舆情事件越是无序、不确定性越大,民众的多元性意见、建议就越多,其舆情价值就越大,舆情引导、事件处置的目标就是降低这种不确定性。笔者建议,我们可以定义“舆情熵”概念,来标示舆情事件的不确定性。

【举例】假设甲地的天气预报为:晴(占4/8)、阴(占2/8)、大雨(占1/8)、小雨(占1/8),假设乙地的天气预报为:晴(占7/8)、小雨(占1/8)。试求两地天气预报各自提供信息的平均舆情熵。若甲地天气预报为两极端情况,一中是晴出现概率为1,而其余为0;另一种是晴、阴、小雨、大雨出现的概率都相等,为1/4。试求这两极端情况提供的平均舆情熵。
    解:甲地天气预报构成的信源空间为

则其提供的平均信息量即信源的舆情熵

(注:对数以2为底,与二进制相对应)

同样的办法,可以计算出乙地天气预报的舆情熵为0.544比特,乙地天气预报比甲地的平均不确定性小。

甲地的两种极端情况,舆情熵分别为0、2比特,也就是本起舆情坐标系下的最小值、最大值。

2015年5月29日,国家卫生和计划生育委员会通报,广东省惠州市出现首例输入性中东呼吸综合征确诊病例。经历过“非典”疫情考验的中国、广东在处理此类公共卫生突发事件时,已经是驾轻就熟,使出“最快速地通报输入病例”、通过微信等平台“最广泛地提醒病人出行路线及可能感染的人员”、“最大公开度地播报病人治疗情况”等组合拳,事件很快平息。本起事件的舆情熵指数,也经历了从大到小的过程。

正常情况下,舆情熵指数为非负数,0是最小值,标示处于稳定、均衡状态。特殊情况下,舆情熵指数为负数,也就是出现了我们通俗意义上讲的“舆论反转”事件,其间数理推导过程,另文阐述。

建立舆情熵指数,能较好地对各类舆情事件定量,也从数学模型上解释了为何遇到重大公共危机事件时,公共管理部门必须快速表态、不隐瞒,以免公众恐慌、社会危机。南方舆情研究院的所有同事,愿与各界师友、各位同行共同努力,逐步建设有中国特色、南方特点的舆情学体系。

广东是改革开放前沿阵地,毗邻港澳,是经济大省、人口大省、外来务工人员大省,同时也是群体性事件发生数量大省,各类舆情事件层出不穷,社会治理难度非常大。2014年2月24日,中国社科院法学院研究所发布《2014年中国法治发展报告》,对近14年间的群体性事件特点进行了梳理,发现过半数以上群体性事件是因平等主体间纠纷引发,官民纠纷引发位居其次。各个省份中,广东以占全国总数30.7%的比例居首。

经过三年的努力,南方舆情的用户数量超过150个,广泛覆盖省内21地市和部分省直机关,在服务用户数、项目签约额、综合影响力方面,南方舆情已经做到了广东省第一。在推动各地市“建立健全科学决策机制”、有效化解群体性事件、打通官民沟通渠道、促进社会公平正义等方面,南方舆情团队做出了一定的贡献。

整体而言南方舆情数据项目包含两个范畴,舆情与数据两者互为主客体互为支撑,齐头并进。既有舆情的数据化,搭建大数据平台分析舆情事件,并充分采用数据化的手段呈现研究结果;又有数据的舆情化,在广阔的数据领域抽取与舆情、治理相关的部分,专注数据治理构建成熟产品满足用户需求。“舆情+数据”这种组合模式,也宣告了新时期的治理方式,必须借鉴新型的数据化手段,才能现代化治理之道。(蓝云/著)
(编者注:全文具体表述,含数学公式、符号以及脚注等,以南方日报出版社正式书面出版物为准)