攻读博士学位期间已经发表(包括已接受待发表)的论文、或已通过鉴定的项目、或已申请到的专利填入下表 序 作者(全体作发表论文题目/ 获奖成果名称 号 者,按顺序排 列) Application of Kernel 1 唐凯临,李通化 Method to Classify SELDI-TOF Proteomics Data 计算机与应用化学 2007 3 √ 刊物名称/ 发表/ 对应学位 论文章节 与学位论文关联度(此栏由论文评阅人填写,请打“√”) 较 授奖部门、级别 获奖时间 大 大 中 小 无 2 唐凯临,李通化 卵巢癌SELDI-TOF数据分类方法初探 2006年全国博士生学术论坛 2006 3 √ Abstracts of 3 Tang kailin,Li Classification of proteomics tonghua data by kernel methods Papers, 233rd ACS National Meeting Abstracts of Papers, 234rd ACS National Meeting 已接收 5 √ 2006 4 √ 4 Tang kailin,Li tonghua Pattern vectors for feature extraction in large scale datasets 5 姚微佳,李通化,唐凯临 用于癌症诊断的基因芯片数据降维和分类方法 中国计算机大会 2005 6 √ 5
6 唐凯临,李通化,陈开 多肽保留时间预测的研究 计算机与应用化学 已排版 7 √ Quantitative structure 7 Tang kailin,Li retention relationship studies tonghua of PCDD/Fs on diverse stationary Gas Proceedings of Computational Methods in Toxicology & Pharmacology Integrating Internet 2005 8 √ Tang kailin,Li 8 tonghua,Chen kai QSAR Study on PCDD/Fs by Using Kernel PLS Chemical Research in Chinese Universities 已修回 8 √ Tang kailin,Yu 9 hongxia,Li tonghua Molecular Docking and QSAR Studies on Cyclin-Dependent Kinase 2 Inhibitors Proceedings of International Conference on Chemometrics and Bioinformatics in Asia 2004 9 √ (可加页)
注:关联度栏必须由论文评阅人填写 评阅人签名:
6
博士学位论文定量评价表
评审项目 权重 10% 评分标准 得分 (百分制) 一、论文 选题(A) 90分以上 75~89分 60~74分 60分以下 选题有重要的理论意义或实用价值 选题有较大的理论意义或实用价值 选题有一定的理论意义或实用价值 选题缺乏理论意义或实用价值 阅读广泛、综述全面、掌握国内外动态 阅读较广泛、综述较全面、基本掌握国内外动态 阅读广泛、综述一般、了解国内外动态 阅读量不够、综述一般、基本了解国内外动态 掌握坚实宽广的理论基础和系统知识 较好地掌握理论基础和系统知识 基本掌握理论基础和系统知识 掌握理论基础和系统知识较差 有很强的科研工作能力和业务水平 有较强的科研工作能力和业务水平 有一定的科研工作能力和业务水平 科研工作能力差,缺乏业务水平 研究成果具有很强的创新性 研究成果具有较强的创新性 研究成果创新性不明显 研究成果不具有创新性 条理清晰,分析严谨,文笔流畅 条理较好,层次分明,文笔顺通 写作能力尚可 写作能力较差 二、文献 综述(B) 10% 90分以上 75~89分 60~74分 60分以下 三、理论基础和专门知识(C) 20% 90分以上 75~89分 60~74分 60分以下 四、科研能力与业务水平(D) 20% 90分以上 75~89分 60~74分 60分以下 五、研究成果的创新性(E) 30% 90分以上 75~89分 60~74分 60分以下 六、写作 能力(F) 10% 90分以上 75~89分 60~74分 60分以下 总分 总分=0.1A+0.1B+0.2C+0.2D+0.3E+0.1F
备注:每位专家对六项指标按百分制评分。
7
评阅人对学位论文的学术评语: (包括选题意义;文献资料的掌握;所用资料、实验结果和计算数学可靠性;论文创新成果内容及写作规范化和逻辑性。注意对论文中可能存在的剽窃、论据作假等把好关,如果发现请详细说明) 随着生命科学研究热潮的到来和现代仪器分析的飞速发展,积累了大量的生物数据。这类数据最大的特点是变量往往比样本多出2-3个数量级,因此称为海量数据或者超大规模数据。如何从这类数据中挖掘更多有价值的信息是对生物信息学和化学信息学的巨大挑战。而对于这类数据的处理,有许多困难要解决,比如如何从大量数据中剔除无用和冗余的数据信息、适当的选择变量、解决“维数灾难”等问题等。这一系列问题的解决,就有必要尝试新的数据处理的思路和方法。 唐凯临论文《变量选择和变换的新方法研究》,针对变量选择和变换,做了一系列有意义的尝试性、探索性工作。论文的创新体现在以下几个方面: 1. 对于多变量少样本的超大规模数据,提出先将其利用函数映射至特征空间,经转换之后的变量以样本之间的关系代替了原先的变量之间的关系。通过这种变换,在原样本空间用线性方法难以解决的问题,在特征空间中就可以解决了。文中涉及的KPLS方法,为多变量少样本问题的解决提供了一个新途径。 2. 对大量的生物样品测得的质谱数据,提出多阶统计量变换的方法。就是将质谱数据分为若干区间,计算每个区间的多阶统计量(即均值、方差等统计量),以这些反映了波形特点的多阶统计量作为新的变量进行分类计算。完成了降维,同时研究也表明该方法可以使分类效果也得到进一步提高。 3. 为了反映出特征变量的具体贡献,论文提出了一种对连续变量进行转换从而寻找特异模式的方法。这样进一步减少了了变量数,并由模式组合构成模式变量。 论文中提出的方法,已经用于解决复杂疾病的诊断(卵巢癌等)、计算蛋白质组学、dioxins等环境污染物性质预测和药物辅助设计等研究。这表明该工作不仅具有理论意义,也有较好的应用前景。 8