投稿指南
来稿应自觉遵守国家有关著作权法律法规,不得侵犯他人版权或其他权利,如果出现问题作者文责自负,而且本刊将依法追究侵权行为给本刊造成的损失责任。本刊对录用稿有修改、删节权。经本刊通知进行修改的稿件或被采用的稿件,作者必须保证本刊的独立发表权。 一、投稿方式: 1、 请从 我刊官网 直接投稿 。 2、 请 从我编辑部编辑的推广链接进入我刊投审稿系统进行投稿。 二、稿件著作权: 1、 投稿人保证其向我刊所投之作品是其本人或与他人合作创作之成果,或对所投作品拥有合法的著作权,无第三人对其作品提出可成立之权利主张。 2、 投稿人保证向我刊所投之稿件,尚未在任何媒体上发表。 3、 投稿人保证其作品不含有违反宪法、法律及损害社会公共利益之内容。 4、 投稿人向我刊所投之作品不得同时向第三方投送,即不允许一稿多投。 5、 投稿人授予我刊享有作品专有使用权的方式包括但不限于:通过网络向公众传播、复制、摘编、表演、播放、展览、发行、摄制电影、电视、录像制品、录制录音制品、制作数字化制品、改编、翻译、注释、编辑,以及出版、许可其他媒体、网站及单位转载、摘编、播放、录制、翻译、注释、编辑、改编、摄制。 6、 第5条所述之网络是指通过我刊官网。 7、 投稿人委托我刊声明,未经我方许可,任何网站、媒体、组织不得转载、摘编其作品。

基于自然指数刊文数据对全球医学研究领域热点(2)

来源:临床医学研究与实践 【在线投稿】 栏目:期刊导读 时间:2021-07-22
作者:网站采编
关键词:
摘要:其中,I1是词频为1的词的个数;T为高频词中的最低频次值,即高频、低频词词频临界值。本文数据得出I1=,T=191,取大于阈值为191的64个高频词,并生成词

其中,I1是词频为1的词的个数;T为高频词中的最低频次值,即高频、低频词词频临界值。本文数据得出I1=,T=191,取大于阈值为191的64个高频词,并生成词篇矩阵和共词矩阵,使用Uci‐net进行数据转换,并利用Netdraw绘制网络图谱。

3 结 果

3.1 原始共词矩阵的社会网络图

利用NetDraw对自然指数医学类期刊研究的高频主题词的共词矩阵展现原始共现关系,如图1所示。其中,每个节点代表高频主题词,节点的大小与其在共词网络中出现的次数成正比;节点间的连线表示两个主题词之间有共现关系,连线的粗细表示联系的紧密程度。由图1可见,网络内部到外周的节点逐渐变小,说明其出现的频次依次降低。网络内部节点之间的连线较粗,表明它们之间共现频次大,连接紧密。

3.2 简化矩阵(二值矩阵)的k核分析

图1 原始共词矩阵的社会网络图

图2 二值矩阵的k核分析(彩图请见

设定共现频率的平均值58为阈值,即共现次数大于等于58时取值为1,小于58时为0。在这个新的二值化的矩阵中,体现出来的共现本身就是具有较强连接的主题词。对这个有较强连接关系的共词网络进行k核分析,发现复杂网络中的核心边缘主题(图2)为k核分析结果。在图2中,红色节点的K=9,是整个图中最为核心的部分,包括动物(animals)、人类 (humans)、女性 (female)、男性(male)、小鼠 (mice)、肿瘤细胞系(cell line,tu‐mor)、 Hek293 细 胞 (Hek293 cells)、 信 号 转 导(signal transduction)、基因敲除鼠 (mice,knock‐out)、杂交鼠 (mice,inbred c57BL)、神经元/代谢(neurons/metabolism),可以看出医学研究范畴是以人类、动物及细胞模型为主要研究对象,是主体结构,此外还有肿瘤细胞系、神经元的代谢、信号转导;其次,K=8为灰色的节点基因表达调控(gene expression regulation)和动物疾病模型(disease mod‐els,animal)为次核心主题,从7至3分别为蓝色、黑色、翠绿色、黄色、草绿色、粉色和湖蓝色,是介于核心主题与边缘主题中间的主题(K=7,细胞增殖(cell proliferation)、近交BALB C小鼠(mice,inbred BALB C)、裸鼠 (mice,nude)、突变 (mu‐tation)、成人 (adult)、中年 (middle aged)、老年(aged)、年轻人 (young adult)、青少年 (adoles‐cent);K=6,细胞系(cell line)、蛋白结构域 (pro‐tein domains)、结晶学 (crystallography)、X 射线(X-Ray)、分子模型(models,molecular)、蛋白结合(protein binding)、蛋白构造(protein conforma‐tion)、结合位点(binding sites);K=5,基因表达序列(gene expression profiling)、基因型(phenotype)、神经网络/生理学(nerve net/physiology)、脑/生理学(brain/physiology)、转录组(transcriptome)、脑/代谢(brain/metabolism)、遗传表位(epigenesis,genetic)、氨基酸序列(amino acid sequence);K=4,时间因素(time factors)、转录因子/代谢(transcription fac‐tors/metabolism)、转录因子/遗传 (transcription fac‐tors/genetics)、磷酸化作用(phosphorylation)、Hela细胞(Hela cells);K=3,有以下几个主题词,生物进化(biological evolution)、分子进化(evolution,molecular)、种系发生(phylogeny)、膜蛋白(mem‐brane proteins)、钙/代谢 (calcium/metabolism);K=2的粉色节点有动力学(kinetics)、算法(algorithms)、肿瘤/遗传学(neoplasms/genetics)、计算机模拟(computer simulation)、生物学模型 (models,bio‐logical),属于次边缘主题;K=1的主题有美国(United States)、细菌蛋白/代谢 (bacterial proteins/metabolism)、生态系统(ecosystem),与其他节点联系疏散,属于边缘主题。

3.3 双聚类分析

双聚类,即能够实现行与列同时聚类,可实现利用类内描述度高的文献来标注聚类,提高标注客观性[16]。本文作者曾将双聚类方法引入同被引分析[17],本文又将此方法引入共词分析。词篇矩阵是每个高频词在文章中出现与否的原始矩阵,最能反映所有词之间的关系。本文将选中的64个高频主题词及所有文章组成的词篇矩阵导入gCLUTO,行为高频词列为所下载的所有文献,进行双聚类分析及可视化展示。选择默认选项,聚类方法为重复二分法,判别函数为I2,相似系数为余弦函数,通过调整聚类数目进行多次聚类,以保证聚类效果最佳。

3.3.1 词篇矩阵的双聚类指标及聚类特征

选择类内相似度ISim相对较大,且类间相似度ESim相对较小的聚类结果,最终确定聚类数目为10。gCLUTO结果给出每个聚类的相似性指标ISim(类内对象间平均相似度)与ESim(代表类间平均相似度)。ISim越大,ESim越小说明聚类结果将相似的类聚到一起,不同类间相似度较小,因此效果较好。如表2所示,第一列表示聚类分为10个类别,Size代表每个类别所含高频词的数量。本次聚类中ISim的值远大于ESim的值,说明聚类结果较好。此软件还给出了聚类特征:Descriptive Features(代表性特征)和Discriminating Features(区分性特征),来衡量聚类效果及作为类别标注的参考。表3中列出了类别中Descriptive与Discriminating指标值最大的前几篇文献,Descriptive的值表示该文献可以解释类内相似性的百分比,Discriminating的值解释该类与其他类间的相异性[18]。我们将代表性文章视为能够代表这一类特征的文献编号,区分性文章视为能区分于其他类的文献编号(编号可以在PubMed查找相对应的文献)。


文章来源:《临床医学研究与实践》 网址: http://www.lcyxyjysj.cn/qikandaodu/2021/0722/1114.html



上一篇:软件在医学科研领域中的应用研究现况
下一篇:医学档案管理中存在的问题与对策

临床医学研究与实践投稿 | 临床医学研究与实践编辑部| 临床医学研究与实践版面费 | 临床医学研究与实践论文发表 | 临床医学研究与实践最新目录
Copyright © 2018 《临床医学研究与实践》杂志社 版权所有
投稿电话: 投稿邮箱: