构建全球华人科学博客圈(blog)http://www.sciencenet.cn/blog
博主
崔雷的博客
我在专业领域里的感受
加为好友 | 发短消息
加为好友 | 发短消息
用户入口
公告栏
开博了,欢迎同道们批评指正。
栏目分类
所有文章RSS40
休闲24
生物医学文献计量学4
生物医学文本挖掘7
生物信息学4
临床信息学1
未分类0
最新日志
文献共现分析入门02-03
试一试,把citeSp...01-22
上帝扔给我们的玩具01-22
陈超美的Citespa...12-02
癌症症状的嵌套结构:共...12-01
bibexcel分析过...11-24
bibexcel使用的...11-24
为什么被引用?11-17
一个文献分析的软件:B...11-16
基于本体的转化医学信息...11-13
最新评论
雷老师:您好!我想知道...02-06
谢谢崔老师的热情答复,...02-05
崔老师有整理出了一篇很...02-04
这里已经变成我的课堂了...02-03
Bibexcel是一款...01-28
博主评论
看不懂,看不懂。太深奥...02-02
呵呵,分出段落就好读了...12-13
几点体会:
1...
11-24
隐隐约约有“本体论的信...11-19
和印象,尤其是查找网络...07-30
博主留言
我在这里发现了你,真是...10-14
在这给我留言吧>>
崔老师,哈哈,找到你了...11-24
博主收藏
研究生如何选导师02-02
导师的作用仅此而已!02-02
导师能干什么02-02
为什么被引用?11-25
如何学习审稿(临床医学)08-13
音频
>我的相册
插图1
我的相册1
友情链接
 
统计数据
访问:46903次
日志:40篇
评论:58个
留言:1个
建站时间:2008-9-26 1:24:39  
最近访客
姜春林
陆慧娟
周小洁
董良广
盛立
赵星
武夷山
马峥
陈国文
博文
标题:文献共现分析入门
浏览:144  评论:4
1. 分类号、主题词与关键词
在信息管理领域中,对文献内容的标识主要采用分类语言和主题语言。
分类语言,也称分类法,是用分类号来表达主题概念,这些分类号来自于事先编制好的分类表,而分类表则是依据知识原有的体系结构将主题概念组织排列成为类目体系(如图书馆里采用的《中国图书馆图书分类法》),比如将医学知识分为医学总论、预防医学、中医学、基础医学和临床医学等几个大类别,临床医学有进一步分为内科、外科、妇科、儿科等更细的类目,如同一棵大树,将医学知识逐级分支、细化。信息管理人员在处理文献时,首先分析文献的主要内容,然后在分类表中找到对应的类目后赋予其相应的分类号。图书馆的读者在查询相应类别的图书或者文章的时候就可以沿着知识分类的体系找到对应的类目,由此找到相关主题的文献。
主题语言是一种用比较规范了的文字直接表达主题概念的标引语言。主题语言可以进一步分为标题词、单元词、主题词、关键词等,其中最常见的是主题词和关键词。主题词就是一些以概念为基础的、经过规范化的词和词组,而关键词则是从文献的题目、正文或摘要中抽出的能表征文献主题内容的具有实质意义的词语。二者最大的区别就是主题词是规范化的,一个概念只能对应与一个主题词,一个主题词只能对应一个概念;而关键词则是来自于作者的自然语言,在不同的文献中,一个概念可以有不同的表达方式(如一种药物在不同作者的论文中可以用其商品名、化学名和常用名),有时一个关键词可能表达多个概念(如P53可以是基因或者蛋白)。
本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=292267

标题:试一试,把citeSpace 再说明白些
浏览:843  评论:2
【博主按】这是我编写的一部教材中对CiteSpace的介绍,估计这一次我是把这个东西想明白了,就是不知道能不能说明白。请各位赐教。
CiteSpace:由美国德雷赛尔大学信息科学与技术学院的陈超美开发。该程序可以登录到cluster.cis.drexel.edu/~cchen/citespace后免费使用。
如何表现一个研究领域?CiteSpace的开发者陈超美认为:可以用“研究前沿”和“知识基础”随着时间相对应地变化情况来表示一个研究领域的状况。
研究前沿(Research Fronts):在CiteSpace中,采用一种“突发词检测”算法来确定研究前沿中的概念,基本原理就是统计相关领域论文的标题和摘要中词汇频率,根据这些词汇的增长率来确定哪些是研究前沿的热点词汇。根据这些术语在同一篇文章中共同出现的情况进行聚类分析后,可以得到“研究前沿术语的共现网络”。因此,研究前沿系指临时形成的某个研究课题及其基础研究问题的概念组合,也是正在兴起或突然涌现的理论趋势和新主题,代表一个研究领域的思想现状。
本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=289520

标题:上帝扔给我们的玩具
浏览:1115  评论:6
朋友送来一只小猫,活泼可爱,然而由于她降临我家太突然,我们发现缺少小猫的生活必需品。翌日,我和女儿一起去商场置办这些东西,比如猫沙和猫粮、猫的食盆、猫的小窝,总之,衣食住行基本都考虑到了。正和女儿探讨是否有遗漏的时候,售货员大嫂向我们推荐了一样猫的玩具:一个由丝绸布料扎制的供猫钻来钻去的,类似三通(或者是医学上的三腔二囊管)的管道。看着这个奇怪的东西,我有些担心:“如果买回去,猫儿不喜欢怎么办?”。大嫂说:“你放心,你把它放到地上,猫儿肯定会去钻的”。看着她自信满满的样子,我在半信半疑中买了这个猫玩具。
回到家里,把这个东西放在地上,诚如大嫂所言,猫儿对着3个通道穿来穿去,不亦乐乎,最后可以达到一刻不停地从一口进另一口出来,仿佛这个东西根本不存在一般;而且不断变幻出新的动作,让这个玩具发挥出最大的效用,比如她可以从三个腔交汇的中间处钻出来,可以把这个东西翻个个儿,再钻……凡此种种,不一而足。
本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=289497

标题:陈超美的CitespaceII论文的翻译
浏览:491  评论:4

总有人问起对Citespace怎么看,说实在的,我下载过,但是没有弄明白。究其原因,是因为这个系统后面的算法涉及到科学计量学或者文本挖掘中的一些重要概念和理论,所以外文读起来生涩难懂。幸好最近在《情报学报》看到了这篇论文的中文翻译,这也是我印象中《情报学报》破天荒的在显要位置上发表译文,我试着把中英文对照着看了看,体会了一些专业术语翻译上的艰难,现在把自己对文摘部分内容的理解摘录下来,自己以为,如果把这一段理解了,对这个软件就能入手了。郑重声明,仅仅是个人理解,跟大家交流用的,错了不负责任啊。

信息科学中有两个基本概念:研究前沿和基础知识,而一个研究领域就可以通过“研究前沿”和“基础知识”随着时间相对应地变化加以概括和可视表现。
研究前沿(Research Fronts)可以定义为概念及其基础研究问题的临时突现的组合。
本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=275518

标题:癌症症状的嵌套结构:共现分析在症状管理的应用
浏览:283  评论:0
目标:尽管很多癌症患者经历了多种症状的同时出现,但是大多数研究都侧重于对单一症状的分析。进一步讲,少量的分析症状在病人身上共现的研究也是使用诸如因子分析之类的方法,这类的方法要有个关于数据如何构建在一起的先验假设。为了突破这个限制,我们使用了网络可视化的方法来探究症状在病人身上共现的情况,然后利用专业知识选择并构造出测量指标来分析结果并使其具有实际意义。
方法:我们对报告具有18种症状的11种癌症的665例患者的数据进行了二次分析。分析其总的(各类型癌症)和三种最常见类型的癌症,使用下面三个步骤:
(1)尝试可视化分析:使用对分网络的单模态映射(bipartite and one-mode network projections)来探索症状如何在病人身上共现的。(2)定量分析:对通过可视化技术观察到的模式利用下列方法进行分析:(a)病人间症状重复程度,(b)使用网络模块分析症状聚集的程度,(c)根据凝聚聚类方法对症状进行聚类,(d)根据共现次数最多的症状来分析症状的嵌套程度,以分析症状集的不同规模。(3)对结果的有效性分析:通过与同规模和分布的随机网络相比较,评估上述计量指标统计显著性。
本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=275288

标题:bibexcel分析过程中几种文献格式的汇总
浏览:434  评论:0

文件类型

表现形式

意义

.doc

FN- Social Sciences Citation Index (Jan 81 - Dec 85)

GA- AHQ96|

TI- MEMORY ACCESSIBILITY AND TASK INVOLVEMENT AS FACTORS IN

CHOICE|

LA- ENGLISH|

AU- GARDIAL SF; BIEHAL GJ|

CS- UNIV HOUSTON/HOUSTON//TX/77004|

JN- ADVANCES IN CONSUMER RESEARCH, 1985, V12, P414-419|

PY- 1985|

DT- ARTICLE|

NR- 17|

本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=273523

标题:bibexcel使用的总结
浏览:495  评论:1

1.格式转换

下载记录后,如果是unix格式,用editpad lite转换为Windows格式。

生成后缀为.txt的文件。

用Misc/Converttodialog/ convertfromWebofScience命令,转换文件格式供程序分析用。

生成dialog格式文件,后缀.doc,

2.抽取字段

1.选择刚生成的.doc文件

生成.out文件。

2.在“old tag”内输入要分析的字段标识。如“TI”

3.在“PREP”按钮旁下拉菜单,选择字段抽取方式。“blank, separated words, e.g. title”

4.按下“PREP”按钮。

本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=273518

标题:为什么被引用?
浏览:344  评论:2

问题的提出,是来自由科研的实践。

对于某个领域的高被引论文的同被引聚类分析,已经成为我们这里比较常用的情报分析手段了;但是,这里还有很多问题,妨碍着这个方法成为情报咨询服务中的常规项目。其中,用于对聚类结果的分析,一直在困扰这我们:对于属于同一个类别的高被引论文,如何提炼出这个类别的主要内容呢?换句话说,如何给聚类分配一个“类标签”?

我们现在的做法是人工阅读,靠分析者的专业知识和思维能力(分析综合),来归纳和分析同一个类文章的共同特点,不同类文章的差异之处,其结果自然是因分析者的专业水平和分析能力而有很大的差异了。

能不能自动分类?答案是现成的:能。

可以提取出来这些文献的特征词(如主题词),进行频次的统计;或者进行向量空间模型甚至可能是潜在语义索引 (LSI),应该会表现出聚类文献的特征的:同类文献的相似之处与不同类之间的相异之处。【也许可以把这些类作为节点通过类间的特征分析,形成网络结构呢】

本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=271695

标题:一个文献分析的软件:Bibexcel
浏览:919  评论:7

把自己开发的文献共现矩阵生成软件叫做BICOMS,在给研究生上选修课《文本挖掘在科研选题中应用》的时候试用,同学们总是问我,我们没有软件,课程结束后怎么办?其实我也没有想好这个软件将来怎么使用:是收费?还是全免费?还是开发网络版?还是注册后可以免费下载?

忽然有一位同事告诉我网上也有一个免费使用的文献计量分析的软件,免费下载。拿来用一用,功能和我的差不多,总归不是自己开发的,用起来还是不顺手。但是,英文说明书看过了,顺手就翻译过来了。把它上传到了CSDN的下载频道上了,竟然如石沉大海。所以就在这里再发一个吧:)

利用Bibexcel进行文献计量分析和引文分析快速指南

Alan Pilkington 【a.pilkington@rhul.ac.uk】

概述与安装

本人使用Bibexcel业已多年,一直向大家推荐这个工具。但是,总是被人们问及如何上手使用,每次拿它进行分析的时候,总是要回头再次读一读自己手写的笔记。所以,我感到有必要就如何利用Bibexcel进行文献计量分析写出一个介绍性的东西,希望能给大家提供有用的信息。如果有任何建议或者发现任何错误,请通知我。

本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=271364

标题:基于本体的转化医学信息组织表达方法的探索
浏览:419  评论:2

【下面是我在中华医学会医学信息学学术年会上宣读的一篇论文的前言部分】

转化医学是指将基础研究人员和临床医生的研究成果整合起来,将其直接应用于病人身上,转化医学研究的目标就是探索如何跨越从实验室到病床的屏障。由于医疗实践的初衷就是尽可能多地利用知识和数据来治愈病人,所以转化医学不是什么新的概念,只是随着最近20年信息科学技术的发展,开展转化医学研究的条件愈发成熟起来。

特别是高通量分子技术的发展,产生了大量的、复杂的、而且是动态的数据,利用这些来自于基础科学实验室的数据的研究论文也越来越多,这些文献所提出的理论改变了我们对人类疾病的理解,并且对病人的治疗发挥了直接作用。因此说,高通量分子技术的进步给生物医学的发展带来了机遇,尤其是给转化医学(Translational Medicine)研究带来了新的契机。

如何开展转化医学研究?关键的步骤之一就是将来自实验室的基因表达数据与患者的临床特征衔接起来。

本文引用地址:http://www.sciencenet.cn/m/user_content.aspx?id=270665

总数:40 总页数:4 当前页:193[1][2][3][4]4: