中医的科学探索分享 http://blog.sciencenet.cn/u/人为峰 向大家报告自己对中医的看法和心得。

博文

基于PCA-BP肝炎患者舌诊的光谱识别

已有 7099 次阅读 2010-3-13 09:20 |个人分类:生活点滴|系统分类:论文交流| BP神经网络, 主成分分析, 舌诊, 病毒性肝炎, 光谱分析

 
1引言
祖国医学认为,肝脏与舌有着密切的联系,《灵枢。经脉》中曰“厥阴者肝脉也,而脉络于舌本也”,舌的两侧隶属于肝,肝脏及肝经的异常可出现相应的改变,肝炎就是肝脏出现异常的表现,而我国又是一个“肝炎大国”[1],本病可能被误诊为流感,或者由于一些病人没有任何症状,致使许多肝炎病例在早期没能被诊断出来,而耽误了治疗,并进一步发展成为肝硬化、肝衰竭和原发性肝癌,因此进行早期预防、诊断和治疗显得极其重要。
目前国内外对肝炎患者的诊断主要是通过流行病学、临床症状、体征及实验室检查,如病原学、病理活检、CT、超声波[2-3]等方法,结合患者具体情况及动态变化进行综合分析。并且还有很多学者将模糊理论、人工神经网络、支持向量机等各种算法用于肝病诊断建立了相应的模型[4-6]。但是这些方法及建模所用的数据都要靠我们的专业技术人员丰富的实践经验作出判断,对病症的准确判断与医师的经验化有很大的关系,而且仅靠一些单一的指标进行分析,不能系统辩证的、全面的描述病症。
近红外光谱分析技术具有速度快、效率高、分析重现性好、非接触性、无辐射、无创无损等特点, 可充分利用全谱段或多波长下的光谱数据进行定性或定量分析。目前已有很多学者将近红外光谱技术广泛应用于农业、石油化工、食品、医药等领域的品种鉴别和成分的预测[7-10],都取得良好的效果。本课题组已通过对舌体的光谱进行分析,得出了光谱能客观地反映舌表面的成分与结构信息。因此本文将利用人体的生理病理能表现于舌体,而光谱又能更全面、更客观的反映舌体所携带的生理病理信息,突出舌体的细微差别的特点。采用光谱法采集舌边的数据,并对其光谱数据进行预处理,应用主成分分析(PCA)和神经网络相结合的方法提取光谱信息中的差异,对肝炎患者舌边与健康人舌边的光谱数据进行分类建模,取得了较为满意的效果。这对加强中医舌诊的客观化起到了很好的促进作用。
2 实验与方法
 2.1 仪器设备
实验使用美国海洋光学公司的NIR-512近红外光谱仪,测定波长范围853.59 -1737.26nm,分辨率<5.0nm,光源和光纤采用定制的GY-30光纤耦合溴钨灯及其配套光纤。光源输出直接经过光纤耦合作为照明垂直入射到被测体表面,而反射光又通过光纤输入到光谱仪,并利用配套软件spectralsuit进行采样,采集到的数据直接转化为光强值通过USB口进入计算机。
2.2 光谱数据的获取
受试对象分别来自河北医科大学第一医院29例病毒性肝炎患者,天津市塘沽区永久医院体查科的7例病毒性肝炎患者和36例健康人,共72例受试者。其中入选的36例病毒性肝炎患者的肝功能进行实验室检测,经专家进行综合分析符合2000年《病毒性肝炎防治方案》诊断标准[11],如血清转氨酶增高、病原学检测阳性等。测试条件是:受试者取坐位,将舌自然伸出口外,充分暴露,呈扁平形,使舌体放松,让光线充足直射入口;要求受试者在不进饮食和漱口后立即进行舌诊打开光源5分钟,待光源光谱稳定后,光纤探头垂直入射到舌体表面,对舌体的舌两侧进行测试。经多次实验后确定距离约1cm,设定积分时间为35ms,在测量范围之间采集512个波长数据,同一部位采集50次。
2.3 数据预处理
 教育由于外界的光源干扰、采集方法等因素使得采集到的数据存在着噪声,因此在进行分析之前必须进行预处理。由于某一物体的光谱反射率是反映自身的物理性质,不随外界照明条件的改变而改变。因此本文对光谱数据进行归一化反射率处理以消除照明光源的影响,能更客观地反映舌表面成分与结构的信息。首先对采集到的每个波长的50个原始数据进行叠加平均,再进行反射率计算并归一化处理,再对归一化预处理后的数据进行主成分析分析,将主成分得分矩阵作为BP的输入层节点数,由于舌左和舌右的分析方法一样,因此本文只取了舌左边(简称舌边)进行分析建模,整个处理过程都是由MATLAB软件完成。
3 实验结果与分析
3.1 舌诊近红外光谱图分析
健康人与肝炎患者舌边的光谱如图1所示,(为图形显现清晰,健康者与肝炎患者只任意选取1条光谱曲线),曲线1为健康人舌边光谱曲线,曲线2为肝炎患者舌边光谱曲线,横坐标为波长范围853.591737.26nm, 纵坐标为光谱归一化反射率。在13281544nm和1642~1737nm波段中两类受试者的光谱曲线相互重叠比较严重,而在其它波段却有较细微的差别这为识别健康人与患者奠定了一定的理论依据。
图1 近红外光谱归一化反射率
Fig.1 The normalized reflectance rate of near-infrared spectroscopy
3.2 主成分聚类分析
主成分分析旨在利用降维的思想,把多变量转化为少数几个综合变量,将许多相关性很高的变量转化成彼此相互独立或不相关的变量。通过对大量的归一化反射率原始光谱变量进行转换,得到数目较少的新变量成为原变量的线性组合,而且新变量能最大限度地表征原变量的数据信息[12-13]。对舌边近红外归一化反射率的共72个样本光谱数据进行主成分分析,样本前10个主成分累计贡献率见表1。由表1可知,前8个主成分累计贡献率达98.33%而且这之后,随着主成分数的增加,累计贡献率增加相当缓慢,所以每个样本的光谱数据可以用前8个主成分代替。
 
1 前10个主成分及其累积贡献率
Table1 The first 10 principal components and accumulative reliabilities
主成分
贡献率
累计贡献率
PC1
83.57%
83.57%
PC2
6.65%
90.22%
PC3
4.2%
94.42%
PC4
1.89%
96.31%
PC5
0.76%
97.07%
PC6
0.61%
97.68%
PC7
0.4%
98.08%
PC8
0.25%
98.33%
PC9
0.21%
98.54%
PC10
0.17%
98.61%
 
图2所示为受试者前两个主成分得分图,图中横轴表示样本的第一主成分得分(PC1),纵轴表示样本第二主成分得分(PC2)。从图2可知健康人的聚类效果较好,主要分部于纵轴的负半轴,肝炎患者主要分部于纵轴的正半轴,但比较分散,而且也有少部分样本在有些区域是相互交叉的,不具有完全可分性,因此为了达到更高的预测精度,需要在主成分分析的基础上采用BP神经网络所具有的非线性进行分析。
2 舌边样本主成分1和主成分2得分图
Fig.2 PCA scores plots( PC1×PC2) for tongue sample
3.3 BP 神经网络模型
本研究建立了一个三层BP神经网络,在853.591737.26nm 波段内共集采了512个波长的数据,如果将全部的光谱波段作为神经网络的输入,大大加大了神经网络的计算量,因此选取能代表原始变量所能提供的绝大部分信息的前8个主成分为神经网络的输入,即输入节点数为8,输出值为不同人群的编码,设定01为健康人,10为肝炎患者,此代码在训练集中为目标值,在预测集中为相应的编码,因此输出层节点数为2通过多次试验分析对比,确定隐层神经元数为6,即网络输入层、隐含层、输出层节点数分别为862。输入层激励函数为tansig,输出层激励函数为purelin,训练函数为traincgb,训练次数为1000次,目标误差为0.05。将72个样本中随机选取健康人和肝炎患者各26个作为训练集本样,其余20例为预测集数据。对20个未知样本的预测结果见表11110例为健康人,其真实值是0111至20例为肝炎患者,其真实值为10,从预测结果可见设定预测结果偏差在士0.2内为预测正确情况下,该模型对预测集样本识别准确率达到100%,平均相对偏差为1.5%
 
1 利用BP网络对未知样本的预测结果
Table 1 the prediction results of unknown samples using BP network样本号
预测值
真值
样本号
预测值
真值
1
0.1304
0.8584
0
1
11
0.992
0.0154
1
0
2
-0.0137
1.0104
0
1
12
1.0009
0.0065
1
0
3
0.0123
1.0054
0
1
13
1.0293
-0.0028
1
0
4
0.0132
1.007
0
1
14
1.0138
0.0399
1
0
5
0.0658
0.9211
0
1
15
0.9999
0.0092
1
0
6
0.0133
1.0089
0
1
16
1.0125
-0.0269
1
0
7
0.0169
1.0166
0
1
17
1.0047
0.0003
1
0
8
0.0088
0.9992
0
1
18
0.9899
0.0174
1
0
9
0.0152
1.0111
0
1
19
1.0079
0.0169
1
0
10
0.0072
1.0124
0
1
20
0.9457
-0.0647
1
0
4 结 论
通过对生理、生化指标进行综合分析,用主成分分析方法和BP神经网络相结合,对采集的舌边近红外光谱数据进行归一化反射率预处理后,进行主成分分析,选取能代表原始变量所能提供的绝大部分信息的前8个主成分为神经元的输入,建立了肝炎患者与健康人的识别模型,在以设定预测结果偏差在士0.2内为预测正确情况下,用该模型对预测集样本的识别准确率达到100%,预测值与实测值相对偏差小于1.5%。不仅为识别不同人群舌体的类别进行快速无损检测提供了一种新的方法,更重要的是从系统辩证、整体观出发,根据生理生化指标及舌诊的光谱信息中对中医症候的客观化进行了探索。
 
 
参考文献:
 
 
[1] 岳小强.舌质颜色的模式识别及原发性肝癌患者舌色的临床研究[D].上海第二军医大学,2005.
Yue Xiaoqiang. Study on paHern recognition of tongue color and its clinical characteristics in patients with primary hepatic carcinoma[D]. Shanghai:Second Military Medical University,2005.
[3]宋闽宁,黄文琪,闵峰,吴贵华,郑玉清.CT诊断早期肝炎后肝硬化与临床病理对照分析[J].中国误诊学杂志,2009,9(10):2272-2275.
Song Minning, Huang Wenqi, Min Feng, et al. Comparative analysis on CT diagnosis of early posthepatitic cirrhosis and clinical pathology results[J]. Chin J Misdiagn, 2009, 9(10):2272-2275(in Chinese).
[4]章浩伟,朱训生,胡兆燕,张琴.基于灰色和模糊理论的中医肝炎肝硬化诊断方法及其比较[J].生物医学工程杂志,2007,24(4):906-909.
Zhang Haowei, Zhu Xunshen, Hu Zhaoyan1 Zhangqin. Comparative study of hepatocirrhosis case diagnosed by traditional chinese medicine based on grey system and fuzzy cluster[J]. Journal of Biomedical Engineering, 2007, 24(4):906-909(in Chinese).
[5] Mevlut Ture, Imran Kurt. Comparison of four different time series methods to forecast hepatitis A virus infection[J]. Expert Systems with Applications, 2006,31(1):41-46.
[6] Rouhani, M., Haghighi, M.M.. The Diagnosis of Hepatitis diseases by Support Vector Machines and Artificial Neural Networks//International Association of Computer Science and Information Technology - Spring Conference, 2009(4):456-458.
[7] 高 俊,姚 成,章 俊.人工神经网络用于近红外光谱预测汽油辛烷值[J].分析科学学报, 2006,22(1):71-73.
Gao Jun, Yao Cheng, Zhang Jun. Application of artificial neural network for the prediction of gasoline octane number by near-infrared spectroscopy[J]. Journal of Analytical Science, 2006, 22(1):71-73(in Chinese).
[8] Sun Jun, Mao Hanping, Yang Yiqing, et al. Model of moisture content of paddy rice leaf based on canopy spectral reflectance[J]. Nongye Gongcheng Xuebao/Transactions of the Chinese Society of Agricultural Engineering, 2009, 25(9):133-136.
[9] Kim, J.G.,  Mengna Xia, Hanli Liu. Extinction coefficients of hemoglobin for near-infrared spectroscopy of tissue[J]. IEEE Engineering in Medicine and Biology Magazine, 2005, 24(2):118-121
[10] Niwayama, Masatsugu, Murata, et al. Noncontact tissue oxygenation measurement using near-infrared spectroscopy[J]. Review of Scientific Instruments.., 2006, 77(7): 073102-073102-4
[11] 中华医学会传染病与寄生虫学分会,肝病学分会.病毒性肝炎防治方案[J].中华传染病杂志,2001,19(1)56-62.
Chinese Medical Association and infectious and parasitic credits.liver credits.Viral hepatitis prevention and treatment programs.Chin J Infect Dis,2001,19(1)56-62.
[12]R. Xu, H. Nguyen, P. Sobol, et al. Application of Principal Component Analysis to the FTIR Spectra of Disk Lubricant to Study Lube–Carbon Interactions[J]. IEEE transactions on magnetics, 2004, 40(4):3186-3188.
[13] 张淑娟,王凤花,张海红,等.鲜枣品种和可溶性固形物含量近红外光谱检测[J].农业机械学报,2009,40(4):139-142.
Zhang Shujuan,Wang Fenghua,Zhang Haihong,et al.Detection of the fresh jujube varieties and SSC by NIR spectroscopy[J].Transactions of the Chinese Society for Agricultural Machinery,2009,40(4):139-142 (in Chinese) .
 
 


https://blog.sciencenet.cn/blog-38994-302487.html

上一篇:中医舌诊研究方法的现状及发展趋势
下一篇:砒霜治癌--震撼!后续效应“发酵”将绵绵无期......
收藏 IP: .*| 热度|

1 zhj71626

发表评论 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-24 17:54

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部