- · 《国外社会科学》编辑部[10/30]
- · 《国外社会科学》杂志社[10/30]
- · 《国外社会科学》期刊栏[10/30]
- · 《国外社会科学》数据库[10/30]
- · 《国外社会科学》投稿方[10/30]
社会科学科研人员数据复用行为研究以经济学为(2)
作者:网站采编关键词:
摘要:5)数据评估判据:数据评估判据指的是数据复用者对数据评估时有哪些判断依据,在编码过程中将数据质量的评估判据往上归纳为:适用性、数据量、完备
5)数据评估判据:数据评估判据指的是数据复用者对数据评估时有哪些判断依据,在编码过程中将数据质量的评估判据往上归纳为:适用性、数据量、完备性、可得性及其他。
6)数据获取障碍和数据处理方式:数据获取障碍反映各类数据存在的缺陷,数据处理方式体现数据复用者对缺陷数据处理方式的差异。
1.2.2 编码信度检验 本研究的编码由作者中的两位研究生进行编码,首先随机选取100篇,两人对这100篇同时编码,不一致的地方协商解决,形成了初步的编码方案,在初步编码方案的基础上又编码了相同的50篇左右,直到编码表中没有出现新的概念为止,确定为最终的编码方案如表2所示。编码完成后进行编码员之间的信度检验,采用编码一致性的霍尔斯提公式[21]:
式中,C.R.为两位编码者之间的信度;M为一致的编码数;N1、N2分别为两位编码者各自的编码数。经计算得到两位编码者的编码一致性系数为0.91,可以认为达到了较好的一致性水平(0.9以上)。
1.3分析方法
文章使用卡方检验和二元Logistic回归分析对编码内容进行了分析。利用卡方检验,分别探究了年龄、性别对数据源选择、数据复用规范程度是否有显著性差异。二元Logistic回归普遍运用在医学领域和社会科学领域,对因变量的发生概率具有较好的预测作用。在本研究中,由于自变量(性别、年龄)既有分类变量也有连续变量,二元Logistic回归具有较好的适用性,可以对年龄、性别因素是否影响数据复用给出预测。
2结果
2.1描述性统计
近三年经济学领域四本期刊的数据复用的论文数为1132篇,占总论文数的83.6%,其中2017、2018、2019这3年数据复用分别为382篇、367篇、383篇,说明经济学科研人员数据复用比较普遍,已经成为实证研究的主流现象,并呈现出相对稳定的状态。
其他详细类目统计如表3所示,有38篇(3.4%)文献没有交代数据源类型,占比很低,说明大部分数据复用文章都会交代所使用的数据源类型;有711篇(62.8%)的文章没有交代如何评估数据,占比很高,还有480篇(42.4%)和370篇(32.7%)的文章没有交代数据获取的障碍和数据处理方式。说明在复用数据时,数据来源是经济学研究者最关注的要素,对为什么要选此数据,如何处理和评估数据、获取数据的障碍等问题关注较少。
1)数据来源类型的偏好分析。经济学科研人员偏好的数据主要来源于数据库、统计年鉴、网络数据,其中数据库的选择占比高达45%,数据库作为数据来源主要源于其存储的数据比较系统、可靠、数据量较大、等特点,特别是微观数据库代表性高、针对性强,对数据的收集和存储更加细化,受到研究者的青睐。统计年鉴类数据更能反映特定研究对象在某个时段或者某个区域内变化信息,规范性较强,也是重要的数据来源。网络数据和规范性文件数据较为分散,单独使用不多,一般作为补充数据来使用。值得注意的是,来源于个人或研究团体的数据仅仅占比6%,这部分数据主要通过他人论文、著作中提及的数据找到线索,通过个人联系获取,或者通过发布在个人网页中的调查报告等渠道获取。详细数据来源类型分布如图1 所示。
表2 编码表序号一级类目二级类目示例1性别XB1男XB2女2年龄NL1(25~35),NL2(36~45),NL3(46~55),NL4(56~65)3数据复用Y1复用Y2未复用4数据标题X1有 X2没有5数据来源类型A1数据库 期刊数据库、综合数据库、微观数据库、政府公开数据库A2统计年鉴 国家统计年鉴、地方统计年鉴、其他统计年鉴A3规范性文件 调查报告、指标文件、审核目录A4网络数据 政府网站、商业网站、手机APP A5档案资料 历史档案、地方志、报纸、历史性书籍A6他人数据 个人数据、团队数据A7模拟数值数据A8其他6数据评估判据B1完备性 数据完整、信息覆盖全面、信息精准B2适用性 数据匹配、稳定性、可比性、针对性、及时性B3数据量 数量多、时间跨度大、地域跨度大B4可得性B5其他7数据获取障碍C1可得性受到限制C2缺失C3偏误、异常或准确性受影响C4匹配混乱C5数据平衡性差C6其他8数据处理方式D1校正或调整D2合并或整合D3剔除或删除D4补充或增加D5替代或更换D6匹配D7筛选D8识别
表3 各类目描述性统计空值编码1编码2编码3编码4编码5编码6编码7编码8数据来源类型517数据评估判据数据获取障碍4853数据处理方式注:数据来源类型编码1~8分别指的是:A1~A8,数据评估判据编码1~5分别指的是:B1~B5,其他详见编码表,空值表示在数据复用的样本文献中没有提及该项指标。
文章来源:《国外社会科学》 网址: http://www.gwshkx.cn/qikandaodu/2021/0314/455.html