首页 资讯 > 内容页

对话摘录:研究数据哪里来?

时间 : 2023-02-25 10:02:37 来源:公共管理共同体
编者按

2022年“对话佳作”共推出45篇推送, 访谈内容涵盖如何关注选题、如何进入选题、如何利用数据、如何拓展研究等问题。从本期开始,版块整合2022年访谈中的共性话题,通过不同学者对同一问题的多样化思考,以实现“博观而约取”之效。本期的话题是“研究数据哪里来?”(点击题目可进入访谈原文)


(资料图)

访谈摘录

01

王凡凡、管兵

Q:本文不显著的研究结论是否对文章最终的发表带来了困难?您可以分享一下在投稿过程中审稿专家提出了哪些质疑吗?又是如何回应的?

王凡凡、管兵: 计量结果显示为不显著时,这种结果很难发表;因为不显著可能是因为变量缺失;计量结果只能“证伪”,不能“证实”。我们认为,基准回归模型中主要核心变量的系数“不显著”是超出我们这篇文章预期的结论之一,但也是我们这篇文章最为重要的结论之一。 我们不认为一项有意义的研究的基本特征是核心变量必须是显著的。实证结果发现了跨区域合作并不能显著改善安全生产治理效果,而如何利用理论、数据和模型去解释这种“不显著”背后的原因,比简单得出“不存在影响、没有影响、没有关系”这样的结论似乎更加有意义,这也是我们这篇文章想做出的尝试和努力。 我们 将样本划分为原位城市和新进城市的目的一方面是为了检验研究假设,另一方面也是为了解释“整体城市层面的回归结果不显著”这个问题。 从效果来看,尽管扩容政策并未整体上改善城市的安全生产治理效果,但我们对不同性质的城市进行分类回归发现,扩容政策对原位城市和新进城市的安全生产治理效果的影响非常显著,但作用效果相反。这样的结论是符合我们预期的,说明高危产业的转移致使原位城市和新进城市在扩容政策中的受益情况存在差异,这可能是导致扩容后整个区域安全生产治理效果不佳的关键原因。但这还不足以说明高危产业确实存在空间上的转移。 于是,在审稿专家的指引下,我们再次完善了空间回归模型,分析了整体城市和新进城市的空间溢出效应发现,在考虑空间溢出效应的情况下,整体城市的核心自变量变为显著,说明要准确分析跨区域合作对安全生产治理效果的影响还应当将所有城市类型纳入空间回归模型之中。 正如审稿专家所提示的那样,“不显著可能是因为变量缺失”。 绝大部分模型和方法都存在它的局限性,或者说绝大部分模型或者方法都不可能完美地估计核心自变量的回归系数,我们只能尽可能地将那些可能影响城市安全生产治理效果的变量纳入模型。 值得欣慰的是,聂辉华、肖兴志、高恩新、姜雅婷等学者的观点启发了我们的思考。我们在稳健性检验中考虑了相关因素之后,我们发现基准回归结果的结论是可靠的。特别是,空间溢出效应分析提供了“高危产业能够在扩容之后的区域内部之间进行转移”和“整体城市的回归结果不显著可能是因为原位城市和新进城市之间的产业转移”的直接证据。 在经过了多次沟通之后,匿审专家同意了我们的大多数观点,我们也按照匿审专家的提示和要求对文章的论证思路和数据检验进行了充分的修改,最终得到了他们的一致认可。 02

朱灵

Q:本研究在庞大的数据处理量与复杂的理论切口下,仍为读者呈现了一个清晰的论证体系。在整个过程中您遇到过哪些困难,又是如何解决的?

朱灵:这是个挺有意思的问题。你们提到这篇文章的数据量比较大。确实, 在这篇文章的分析中,我们收集了江苏省 1990 年至 2018 年间江苏省省、市、县几十万条官员流动的记录,不止包括地方党政一把手,还包括四套班子的成员和部门主要领导人 (这是我在斯坦福大学读博士的时候与周雪光老师带领的团队一起收集和清理)。鉴于当前大部分研究中国官员流动的数据都只有省市级以上地区的地方党政一把手的履历,这个资料非常的宝贵,也因此让我得以研究县级地区较为稳定的政治精英对地方经济的影响。另外,我们还从不同的年鉴汇总了县区级的经济发展指标(如 GDP 和财政收入)。为了解决一些评审人担心政府公布的数据不一定准确,我们还从 NASA 拿了数据,用一个县级地区一年的卫星观测到平均夜晚亮度作为更为客观的经济发展指标。所以结论应该还是比较严谨可信的。 其实在一开始做这个项目的时候,我只是想利用我们有的数据,为地方党政一把手对地方经济的影响力提供更严谨的测量,而没有去过多强调地方稳定的政治精英的影响力。 也因此,在这篇文章的前几个版本里,我论述的重点都是地方党政一把手的影响力,而且做了非常多研究设计(包括用 “difference-in-difference model combined with propensity score matching 倾向值匹配的双重差分模型 ” 这种类实验的设计)来专门检验地方领导人的影响力。主流的文献主要都在强调地方领导人是有很强的影响力的。我当时的想法是,如果影响力很强,很直接,那么领导人一换,地方经济在短期肯定会有比较大的震荡(就像乔布斯去世,苹果公司股份第二天立刻下降 2% )。鉴于比较少研究做过这个测量,我当时就想用类实验的方法来检测一下地方党政一把手对经济发展的影响力。 但结果是不管我怎么测量,用哪种模型,哪些经济测量指标,就是没有发现显著的效应。 其实我当时已经觉得这是一个很好的发现了, 因为它说明当人们都认为地方党政一把手的作用是最大的情况下,我没有发现显著的影响。 我在斯坦福的一些 workshop 上 present 了这个研究,反响也不错。 但是,后来当我把这个结论和导师们聊(我在斯坦福的导师是周雪光老师和 Andrew Walder )以及在一些国际会议上 present 的时候, 他们却提出了一些更尖锐的问题——没有显著影响不一定代表没有影响。因为统计显著性其实是一个小概率事件,而我现在是把大概率事件当成了结论。 另外, 如果说学术研究需要有破有立,即使可以把发现党政一把手的更换没有显著影响当成 “ 破 ” ,那么关于中国经济发展的政治体制因素我 “ 立 ” 了什么呢? 这些评论对我来说是很醍醐灌顶的。 因此我才开始去找地方党政一把手的频繁更换没有对地方经济产生显著负面影响的 “ 机制 ” ,也才开始转向关注地方上更稳定的政治精英这一群体。 这一转变,就带来了整个论述框架和理论体系的转变 —— 就是我必须推翻我原来的叙事逻辑,原本的研究设计,以及原本的研究结论。所以现在发表的这篇文章,和我一开始的第一个版本,已经天差地别了。 所以碰到问题应该“如何解决”呢?其实也没有什么特殊的方法,就是耐下性子好好面对它,尽量不放弃,尽量尽力而为。 03

任皓

Q:在构建“一把手”异地交流数据库时,资料来源和时间跨度均比较庞大,您是如何处理同质化信息并形成结构化数据的?

任皓:正如我在之前提到的,我是在2019年9月完成博士论文预答辩之后开始进行的数据搜集。现在看来难点主要有三个方面: 第一、数据来源。 可信完整的数据来源并不好找,相对而言党委机关报是较为准确的信息来源,但是不同数据库中关于各省报纸的完整度并不一致。我还是采取了一个相对保守的方案,就是从多个数据来源同时搜集数据然后进行数据比对与汇总。 第二、研究对象。 本文使用省委书记考察交流,这里涉及到研究对象的两个选择,省级数据还是地市级数据?省委书记还是包括其他省级领导? 当前关于我国区域间市场分割的文献主要使用省级层面的数据,基于学术对话的考虑本文也使用了省级层面数据。当然我也搜集了市级层面政府考察的数据,和我的合作者已经完成了一篇针对市委书记异地考察交流的工作论文,并在一些学术会议上进行了汇报。我也希望这一工作可以早日和大家见面。 其次,并不是所有的党政代表团都是省委书记或省长带队,部分党政代表团也由省委副书记等其他省级领导带队。在中国地方政府行为的研究中,领导人级别是最为值得考虑的因素,例如Jiang and Mei(2020)的经典论文中就解释了为何省委书记的异地升迁更可能影响区域间货物贸易。由此,为了统一性,本文以职位划分而没有以党政代表团划分。事实上,在数据搜集阶段我并未区分不同级别省级领导,搜集了包括省长、副省长等省级官员的数据。但是,在数据搜集的过程中, 我也发现省委书记异地考察更具有综合性,且数据准确度相比于其他省级官员更高。 相对而言省长的异地考察很多时候是针对具体政策问题,比例环境保护、洪水防治等。综合以上考虑,本文使用省委书记异地考察构建了府际交流网络。 第三、数据取舍。 省委书记异地考察有不同的政策目标,哪些考察交流活动可以作为府际联系的标志就涉及到数据取舍。在本文中我将2010年各省省委书记赴上海参加本省世博会开幕活动作为礼仪性活动,没有包括在数据分析之中。当然这一划分比较粗糙。 最后,在研究助理的帮助下,我也一直在完善和维护府际交流数据库。 如果各位老师和同学有数据使用需求可以随时与我联系,只要符合学术伦理即可。 04

江汉臣、唐啸

Q:本研究在复杂的研究设计与数据分析下,仍为读者呈现了一个清晰的论证体系。在整个过程中您遇到过哪些困难,又是如何解决的?

江汉臣:如上所述,我们的研究问题其实很明确,但想要定量回答这一问题确并不容易。数据分析方面的困难来自两方面。 首先是数据的收集,本研究涉及的数据来源较多。 因变量是一个城市在某一天的市内出行指数,来自百度迁徙平台;自变量是该城市官方微博账号在前一天发布的和新冠相关的帖子数量,来自于微博平台;控制变量包括天气、城市每日疫情统计数据、封闭政策等,又都来自不同的数据源。因此首要的工作就是采集、匹配这些多源数据,并进一步加工生成更多额外的变量。 其次,就是因果机制的识别。 我们初期的回归模型是一个中观研究最常见的双向固定效应模型,虽然能够消除个体层面不随时间变化和时间层面不随个体变化的不可观测因素的影响,但仍存在内生性。审稿人第一轮意见就提出,除了社交媒体外,地方政府还可以通过不同的媒体渠道发布信息影响公众遵从行为,而这些渠道发布的信息的强度很可能和社交媒体发布信息的强度相关,但回归方程中却遗漏了这些变量,所以双向固定效应模型也存在内生性问题。 我们非常感谢审稿人的意见,因为审稿人没有抽象的提出内生性问题,而是指出了内生性的具体来源,即政府在其他信息发布渠道的行为可能被遗漏了。 为了应对这个问题,我们聚焦在政府社交媒体本身的运营逻辑去寻找工具变量。 这个工具变量只可能和政府微博发帖有关,而和其他渠道发布信息无关,并且还需要符合面板数据的结构。 通过对政府发微博过程的思考,我们提出了论文中使用的工具变量:即政府微博账号在研究初期的关注数(而不是粉丝数)和武汉封城后(哑变量)的交乘,作为政府发布微博数量的工具变量。 其逻辑如下:政府微博账号的关注数并不是政务新媒体的考核指标,很可能只和实际操作人员的偏好有关,因此可能是外生的;而在武汉封城后,关注了更多其他账号的微博很可能会看到更多的关于新冠的帖子,因此也会发布更多和新冠相关的帖子。我们对这个工具变量的外生性进行了一些检验,发现政府微博账号的粉丝数和地级市的人均 GDP ,互联网覆盖率以及受教育水平都无关。因此,可以认为这个变量只可能通过影响政府发帖来影响公众的遵从。当然,这个工具变量也并不完美,但在一定程度上缓解了内生性问题。

Q:根据微博发布的《2020年用户发展报告》,我国微博活跃用户群具有显著的城乡、区域、年龄分化。相较国内其他社交媒体(如微信),请问您基于何种考量选择微博作为研究数据来源?

江汉臣:根据我们观察和调研,微博在政务媒体的相关工作中是最重要的部分之一。其次,根据数据,微博2019年12月的月活跃用户数为5.16亿,是我国最重要的社交媒体。最后,微博比微信更灵活,微信一天只能发一次推送,但微博却可以在不同时间多次发布。 因此城市微博带来的影响可能会存在较大的时空差异,这也是我们定量分析的基础。当然,我们承认, 微博用户样本和我国整体人口样本的特征存在差异,但这并不会影响我们的研究结论。 在我们的研究中,政府微博是一个自变量,而不是一个因变量。研究通过回归分析确实发现了政府发布微博对公众遵从行为存在影响。至于其他媒体渠道的效应,我们也通过工具变量进行了排除。因此,研究结论的内部有效性是较高的。 至于微博的城乡、区域和年龄分化所带来的影响,其实已经包含在我们识别出来的平均因果效应里面。 此外,我们还进行了异质性检验,发现政府发布微博对遵从行为的正向影响,在更富裕、互联网覆盖率更高以及受教育程度更高的城市中更强,这种异质性恰恰和微博的用户特征有对应关系。 06

陈馨

Q:您在数据收集和变量测量的过程中有遇到什么困难或问题吗?您是如何测量自变量(如:过往合作绩效、资源平衡性、协同稳定性、问题严重性、社区相似性)的?是借鉴已有研究还是您创新使用?在投稿过程中对于变量是否有收到相关意见?

陈馨:本文大多数的自变量都参考了既有研究的变量测量。 例如,自变量中的社区相似性,我们就参考了Lee and Lee (2021)以及相关的研究,选用了政府属性和社区居民结构等具有代表性意义的指标。 在衡量资源平衡性时,我们使用了HHI指数(Herfindahl–Hirschman index),HHI指数是衡量集中度的经典方法,已在众多学术研究领域中大量使用。我们将它运用于测量协同参与者之间资源的平衡性,算是一个微创新。所谓的资源平衡性,实质上就是参与者各自拥有资源量的对比。如果一个参与者拥有的资源,远多于其他参与者,协同的总资源就集中在该参与者手中,因此我们就使用HHI指数来衡量资源平衡性。在文章投稿过程中,有评审人对资源平衡性的测量很感兴趣,觉得我们使用HHI指数是一个有意思的选择。 此外,我们在文章的初稿时对既往合作绩效和问题严重性等指标主要采用短期数据进行衡量,因为我们认为决策者在进行决策时可能是短视的,只关注协同近期的绩效。然而,有评审人认为决策者也有可能关注协同的长期绩效,以此作为决策的依据。最终,我们参照评审人的建议,寻找到过去十年的数据,建立既往绩效和问题严重性的长期绩效,并将他们作为稳健性检验加入到本文的实证分析。 ▼ 往期精彩回顾

编辑:苏芮

审校:对话佳作版块团队

x