- · 《国外社会科学》编辑部[10/30]
- · 《国外社会科学》杂志社[10/30]
- · 《国外社会科学》期刊栏[10/30]
- · 《国外社会科学》数据库[10/30]
- · 《国外社会科学》投稿方[10/30]
管理学科研人员数据复用行为特征探析(3)
作者:网站采编关键词:
摘要:表4 复用论文年度分布时间复用论文实证论文占比2017年.77%2018年.81%2019年.73%合计.16% 在所有复用论文数据来源中,来自政府及组织的数据占比最高,为38%;
表4 复用论文年度分布时间复用论文实证论文占比2017年.77%2018年.81%2019年.73%合计.16%
在所有复用论文数据来源中,来自政府及组织的数据占比最高,为38%;其次是商业数据库,占比为34%。两者占比之和达到72%。来自高等学校及科研机构的数据,占比为6%;占比最低的是个别研究者的数据,仅占3%。具体如图1所示。
图1 复用论文数据来源分布
(3)数据评估判据
复用论文中的数据评估判据排名最高的是准确性,占比达到38%;分居二、三位的是可得性和有效性,占比分别为30%、21%;排名最后的是数据量,占比为11%。具体如图2所示。
图2 数据评估判据
(4)数据处理行为
对复用论文中的数据处理行为分析发现,位居首位的是筛选,占比达到76%,其余依次是匹配、校正、补充、合并,如图3所示。说明目前在管理学科研人员数据处理行为中,筛选这一行为最为频繁,它包括选择并保留符合条件的数据、剔除缺失值与异常值等。
图3 数据处理方式
(5)数据引用方式
在所有复用论文中,绝大多数作者采用在正文中说明数据来源或加注释的方式引用(96.5%),比如“数据来源于国泰安数据库和中国资金管理智库数据平台(http:///data)③……”,注释③是关于中国资金管理智库数据平台的介绍;以图书、期刊论文、报告、词典等正式参考文献方式引用的占3.5%,如“人口假设来自联合国《世界人口展望2015》[*]”,上标[*]以报告的形式作为参考文献标引在文末;按照《科学数据引用》国家标准引用的为0。
2.2 回归分析与卡方检验
在描述性统计分析之后,分别对所有实证论文和复用论文采用SPSSStatistics21进行二元Logistic回归分析和卡方检验。
2.2.1基于实证论文作者的分析
(1)在采集第一作者年龄、性别、资历(职称)信息完成后,获得有效样本803个。以年龄、性别为自变量,是否数据复用为因变量(复用取值为1,未复用取值为0),利用二元Logistic回归分析,检验年龄、性别对是否数据复用有无显著影响,预测准确率为76.1%,模型预测效果较好。结果如表5所示,年龄、性别对是否数据复用的影响无统计学意义(p>0.05)。
表5 “年龄、性别与数据复用”逻辑回归分析结果βdfp值OR值年龄-性别-0..3050.821
(2)资历(职称)这一项中,考虑到在读本科生、硕士研究生样本数量太少,学生群体只剩下博士研究生,所以把这三类样本排除在外,但可以看出,在读博士研究生是学生群体中数据复用的主力。样本中初级职称数量为0,所以包含的指标为中级职称、副高级职称、高级职称。筛选后的样本数量为704个。卡方检验结论显示,尚不能认为职称与是否数据复用有关(2=1.914,df=2,p=0.384)。
2.2.2基于复用论文作者的分析
(1)利用二元Logistic回归分析,检验年龄对复用数据类型的选择有无显著影响。分析样本仅包含使用单一数据类型的样本,剔除二者皆有使用的样本。因变量为复用数据类型(量化数据取值为0,质性数据取值为1),自变量年龄为连续型变量,预测准确率为87.2%,模型预测效果良好。结果如表6所示,年龄对复用数据类型的选择有显著影响(p=0.02<0.05)。
表6 “年龄与复用数据类型”逻辑回归分析结果βdfp值OR值年龄
为进一步分析年龄与不同数据类型使用的变化趋势,将年龄等距划分为五个组别,分别是20—29岁、30—39岁、40—49岁、50—59岁、60岁及以上。统计不同年龄段两种数据类型的使用情况,如图4所示,60岁以下的科研人员中,随着年龄段的增加,科研人员对量化数据的使用呈现下降趋势,而对于质性数据的使用则明显上升;30岁以下的科研人员,对于量化数据的使用占比高达96.36%,说明30岁以下的科研人员更偏向于量化数据的复用。
图4 量化数据与质性数据使用分布
(2)利用卡方检验,检验性别、资历(职称)对复用数据类型的选择有无显著影响。样本仅包含使用单一数据类型的样本,剔除二者皆有使用的样本。因样本中初级职称数量为0,职称仅包括中级职称、副高级职称、高级职称。结果表明,性别对科研人员复用数据类型的影响没有统计学意义(2=0.062,df=1,p=0.804);资历(职称)对科研人员复用数据类型的影响也没有统计学意义(2=4.273,df=2,p=0.118)。
3 讨论与启示
3.1 讨论
(1)数据复用高度普及且呈上升趋势
文章来源:《国外社会科学》 网址: http://www.gwshkx.cn/qikandaodu/2021/0120/380.html