最新目录

社会科学科研人员数据复用行为研究以经济学为(3)

来源:国外社会科学 【在线投稿】 栏目:期刊导读 时间:2021-03-14
作者:网站采编
关键词:
摘要:图1 数据来源类型 2)数据评估判据。尽管这部分的数据缺失比较严重,但从现有的数据看,经济学研究者评估数据主要依赖于数据的完备性(完整性、数据覆

图1 数据来源类型

2)数据评估判据。尽管这部分的数据缺失比较严重,但从现有的数据看,经济学研究者评估数据主要依赖于数据的完备性(完整性、数据覆盖是否全面、数据信息是否准确,占39%);适用性(30%)是数据复用的前提条件,数据首先得适合本研究问题,所以适用性得到了较高的关注;另外,科研人员还会对数据量(22%)进行评估,主要倾向于使用数量多、时间跨度大、地域跨度大的数据;数据可得性也在评估时有提及,尽管占比(6%)比较低,但这也是数据复用的前提。如图2所示。

图2 数据评估判据

3)数据获取障碍。数据获取最大的障碍因素是数据缺失和数据缺陷(44%)。数据缺失指的是某一时间段数据或者某一区域数据,囿于某些地域特点、行政特点或者自然灾害等产生了空缺,对研究者获取数据产生了一定程度的限制;数据在统计期间由于条件、人员不足或误差因素干扰产生的数据偏误、异常或不准确性也成为研究者获取数据的另一大限制(39%)。数据的可获得性既作为数据评估的一个标准,也是数据获取的障碍,占比尽管小,但也是不容忽视的重要障碍。另外,我们发现经济学研究来源数据非平衡性和匹配混乱经常存在,但在获取障碍中不是研究者的关注点。如图3所示。

图3 数据获取障碍

4)数据处理方式。通过分析得到,剔除或删除成为研究者对数据处理的首要解决方法,因为在数据处理中,对于缺失或者不可获得的数据来说,剔除最为简便,并且在较大的数据量中,剔除少数变量对研究结果影响不大。对于偏误数据来说,剔除相对容易但是为了整个研究的精准性,也有部分研究者更偏向其他方法,例如:用其他数据源进行补充、调整或者更换。筛选、合并或整合、识别工作做得较少,原因可能是如果选择的大部分数据在整体数据中表现良好的话,不一定需要这些耗费大量的时间和精力的数据处理操作。如图4所示。

图4 数据处理方式

5)数据复用的规范程度。数据复用的规范程度体现研究者在文章中是否对数据使用进行了必要的说明。通过综合一级类目4~8的表现看数据复用规范程度,其值由一级类目4~8计算得出,即按照有无数据标题、数据来源类型、数据评估的判据、数据获取的障碍、数据处理方式是否提及确定分值,只要有相应类目提及,则记为1分,最高5分,因此取值范围为(0,1,2,3,4,5)。由打分结果看出,4分是论文频数最多的分值,1分是论文频数最少的分值,平均分为3.4分,即一级类目4~8在文章中平均被提及3.4次,一定程度上说明经济学研究者的数据复用的规范性有待进一步提升。具体打分情况如表4所示。

表4 数据复用规范程度打分分布分值0分1分2分3分4分5分频数2226

2.2卡方检验与回归分析

采用SPSS 25.0进行卡方检验和Logistic回归分析。

2.2.1 卡方检验 用卡方检验性别和年龄在数据源选择以及数据复用规范程度的差异,其中自变量:性别(男1,女0)、年龄(25~34,35~44,45~54,55~64),因变量:数据复用(复用1,未复用0)、数据复用规范程度(0,1,2,3,4,5),其中作者的年龄分布如图5所示。

图5 第一作者年龄分布

卡方检验分析得出:①年龄和性别对数据源选择的影响无统计学意义(P=0.799>0.05;P=0.710>0.05);②不同年龄组的数据复用规范程度有显著差异(P=0.000<0.05),而性别对数据复用规范程度的影响不具有统计学意义(P=0.364>0.05)

2.2.2 二元Logistic回归分析 对于编码时年龄和性别不可获得的部分数据,我们在进行回归分析时进行剔除,最终得到有效样本1125,达到总样本的83.3%。Logistic回归分析通常样本数应该达到自变量个数的5~10倍[22],本研究有两个自变量,认为适合做Logistic回归。其中,性别是分类变量,年龄为连续型变量。SPSS分析结果显示回归的正确预测率达到83.6%,说明预测能力良好,其他结果如表5所示。性别对数据复用的影响不具有统计学意义(P=0.814>0.05),年龄对是否复用具有显著影响(P=0.000<0.05),并且随着年龄的增加,数据复用会减少(B=-0.077)。

表5 分析结果表变量BdfP值OR值年龄-性别

3讨论与启示

3.1讨论

本研究样本来源于国内大陆经济学期刊,4本期刊近三年的数据复用占比83.6%,跟林奇秀和賴璟毅(2018)对中国台湾学者的研究结论基本一致,说明国内经济学领域数据复用比较普遍,成为实证研究的主流现象。数据复用的科研人员集中在35~44岁年龄段,这部分学者是数据复用的主体,并且随着年龄的增加数据复用有所减少,相关研究发现,社会科学年轻学者对数据复用的感知更为敏感,但比年长学者对数据复用持有更谨慎和保守的态度[18]。

文章来源:《国外社会科学》 网址: http://www.gwshkx.cn/qikandaodu/2021/0314/455.html



上一篇:地方应用型本科高校社会科学研究现状问题及对
下一篇:社会科学大数据与社会治理主要应用与实践反思

国外社会科学投稿 | 国外社会科学编辑部| 国外社会科学版面费 | 国外社会科学论文发表 | 国外社会科学最新目录
Copyright © 2019 《国外社会科学》杂志社 版权所有
投稿电话: 投稿邮箱: