考研大纲包含了硕士研究生考试相应科目的考试形式、要求、范围、试卷结构等指导性考研用书。今天,为了方便2025考研的学子们,小编为大家整理了“2025考研大纲:贵州医科大学2025考研自命题考试大纲:629 智能医学综合”的相关内容,祝您考研成功!
2025 年贵州医科大学硕士研究生招生考试 智能医学综合( 自命题)考试大纲
Ⅰ.考试性质
本考研大纲适用于贵州医科大学智能 医学及相关专 业的研究生入学考试初试科目, 旨在科学、公平、有效地测 试考生是否具备继续攻读智能 医学专业硕士学位所需要 的数据挖掘、 生物信息分析、人工智能基础等工科知识。 评价的标准是高等院校优秀本科毕业生能达到的及格或 及格以上水平, 以利于学校择优选拔,确保智能医学专业 硕士研究生的招生质量。
Ⅱ.考查目标
智能医学综合考试范围包括《数据挖掘导论》 《生物 信息学算法导论》(参考书目: 生物信息学( 一))和《P ython人工智能:原理、实践及应用》 ( 详见V. 参考书目) 。 《数据挖掘导论》 要求考生对数据和数据挖掘的基本概 念、基本原理、基本分析工具和分析方法的掌握程度, 了 解考生是否具备运用所学知识分析和解决有关问题的能力 ; 《生物信息学算法导论》考查生物信息学的基础理论知 识、 常用数据分析算法和软件工具, 以及生物学数据库等 ; 《Python人工智能:原理、实践及应用》要求考生掌握常 见的人工智能方法和应用场景,并对 Python编程语言有一 定了解,能够用Python实现人工智能算法。
Ⅲ.考试形式和试卷结构
一、试卷满分及考试时间
本试卷满分为300分,考试时间为180分钟。 二、答题方式
答题方式为闭卷、笔试。
三、试卷内容及题型结构
试卷内容结构为:
1. 生物信息学算法导论约 40% 2.数据挖掘约40%
3.人工智能导论约20%
试卷题型结构
选择题:第 1-100小题,每小题2分,共200分
简答题:第 101-107小题,每小题10分,共70分
综合题:第108小题,共30分
Ⅳ.考查内容
一、生物信息学算法导论
( 一)生物信息学的概念及发展历史
1. 生物信息学的概念
2. 生物信息学的主要应用方面
( 二)生物学数据库及其检索
1.数据库的概念
2.数据库的结构类型:定义,特点。
3. 生物学数据库: 一级数据库与二级数据库。
4.NCBI 生 物 信 息 资 源 中 心 : PubMed 、 GEO 、 Gene 、 GenBank 、FASTA序列存储格式、SRA 、PMC和OMIM。
5.EBI 生物信息资源中心:EMBL 、Ensembl 、ArrayExpress、 UniProt 、Reactome和BioMart。
( 三)序列比对原理
1.序列比对的概念
2.序列的相似、 同一与同源: 三者概念与异同,直系同源与 旁系同源。
3. 常用双序列比对工具:BLAST。
4. 常用多序列比对算法: 动态规划算法,渐进式算法、迭代 算法和统计概率算法。
5. 常用多序列 比对工具 : ClustalX/W , Clustal Omega,T- Coffee,MultAlin和MAFFT。
( 四)蛋白质结构预测与分析
1. 蛋白质结构特征: 一级结构,二级结构,三级结构与四级 结构。
2.蛋白质结构分类数据库:SCOP2 和CATH。
3. 蛋白质结构比对: 比对结果的内容,应用方面与常用比对 方法。
4. 蛋白质结构预测:理论基础,二级结构预测方法及相关数 据库,二级结构预测方法。
5.蛋白质对接:分类和常用分析软件。
( 五)基因组学
1.基因组的概念 2.基因组学分类
3.蛋白编码基因的注释:注释策略、功能注释。
( 六)转录组学
1. 转录组学的含义和研究对象;
2.RNA-seq 与基因芯片技术的差异;
3.RNA-seq 测序策略:单末端,双末端;
4.RNA-seq 文库制备:制备步骤,链特异性文库,非链特异 性文库;
5. 测序数据存储格式:FASTQ格式特点;
6.RNA-seq数据处理:质量控制,reads 比对,转录本定量;
7. 功能分析:差异表达分析,聚类分析, 富集分析,共表达 分析。
( 七 )非编码RNA
1. 非编码RNA 的定义与分类;
2. 非编码RNA 的功能预测:预测平台;
3.microRNA:定义,功能,靶基因预测软件;
4.lncRNA:定义,分类,功能,常用数据库与分析软件。
( 八)蛋白质组学
1.蛋白质组学概述:概念,蛋白质组学技术应用领域。
2. 蛋白质的大规模分离鉴定技术:蛋白质二维电泳-质谱技 术, 一维( 二维 )色谱 - 质谱技术, 同位素编码亲和标签 技术,表面增强激光解吸离子化飞行时间质谱技术,蛋白 质芯片技术。
3.蛋白质翻译后修饰:定义,常见类型。
4.蛋白质相互作用:蛋白质互作预测的生物信息学方法。
(九)系统生物学
1. 系统生物学基本概念:系统生物学的定义,系统生物学与 分子生物学的差异,系统生物学的基本框架。
2. 复杂网络及特征: 网络的概念和分类,复杂网络的统计特 征, 网络的拓扑分析,生物中的复杂网络。
3. 系统生物学基本技术与方法:蛋白质-蛋白质互作信息数 据库, 常用蛋白质-DNA相互作用数据库, 常用代谢途径数 据库。
4.蛋白质-蛋白质相互作用网络:蛋白相互作用网络的性质, 网络模体。
( 十)分子进化与系统发育
1.分子水平的进化:分子进化的概念,分子进化的特点, 中 性学说。
2.分子系统发育分析的基本概念:系统发育树和分子系统树 的概念, 系统发育树的分类,分子进化研究最根本的目的
。
3.分子系统发育树的构建方法:基于距离的方法,最大简约 法,最大似然法,贝叶斯推断法。
4. 系统发育树构建及应用:构建系统发育树的步骤,构建系 统发育树的常用软件。
( 十一 )统计学习与推理
1. 统计模型与参数推断: 给定统计模型的参数估计方法,参 数估计量的评选标准。
2. 聚类分析:距离尺度函数,聚类算法。
3. 深度学习:深度学习的核心,深度学习框架,深度学习模 型。
( 十二)生物信息学编程基础
1.Linux 操作系统:Linux 常用命令操作。
2.R 编程语言:R包的安装,基本运算,数据类型,R语言常 用数学函数,R 语言工作空间函数,R 语言外部数据读取与 读出,R语言基本绘图函数。
( 十三)新一代测序技术及其应用
1.Sanger测序法的特点; 2. 二代测序的特点;
3. 二代测序技术平台及其特点; 4. 三代测序技术的特点;
5. 生物信息学在二代测序中的应用。
二、数据挖掘
( 一 )数据挖掘概述
1. 数据挖掘的概念和任务: 了解数据库系统技术的演变过 程;理解数据挖掘的概念;掌握知识发现过程的7个步骤。2. 数据挖掘应用:掌握数据挖掘的数据类型;掌握数据挖掘功 能和模式;理解数据挖掘与统计学、机器学习的联系和区别 ; 了解数据挖掘的应用领域; 了解数据挖掘的主要问题。
( 二 )数据
1. 了解数据对象与属性类型。
2. 理解数据的基本统计描述,掌握均值、 中位数、众数、极 差、 四分位数、方差、标准差和四分位数极差的概念和计算 方法; 了解数据基本统计描述的图形显示; 了解度量数据的 相似性和相异性。
3. 了解进行数据预处理的原因及其重要性; 了解数据质量涉
及的因素;掌握数据预处理的主要步骤。
4. 了解数据清理的概念; 了解处理数据缺失值的方法; 了解处 理噪音数据的方法。
5.理解数据集成的概念; 掌握冗余和相关性分析的方法(检 验,Pearson积矩系数)。
6. 了解数据变换的策略; 掌握数据规范化的计算方法( 最小
-最大规范化、z 分数规范化、按小数定标规范化)。
7.理解数据归约的概念; 了解数据归约的策略; 了解线性回 归、对数线性模型、直方图、聚类、抽样等数据归约方法。 8.理解数据离散化和概念分层的概念; 了解数据离散化的方 法(分箱、直方图分析、聚类分析、相关分析)。
( 三)分类和预测
1.理解数据分类的概念; 了解分类的两个过程;理解监督学 习和非监督学习的 区别; 了解分类和预测的数据预处理方 法;掌握评估分类和预测方法的标准。
2. 了解决策树的概念和优缺点; 了解决策树归分类的主要步 骤; 了解常用的属性选择度量,掌握信息增益度量的求法; 理解两种常用的树剪枝方法。
3. 了解评估分类器性能的度量; 了解评估分类和预测准确率 的方法( 混淆矩阵、灵敏度和特小型、F 度量)。
4. 了解K-折交叉验证和自助法的基本思想; 了解ROC 曲线的
概念和特点。
5. 了解组合分类器的概念和常用的组合分类方法; 了解装袋 和提升的基本思想以及两者的区别; 了解随机森林的基本思 想。
6. 了解类不平衡问题的概念; 了解提高类不平衡数据分类准
确率的一般方法。
( 四)挖掘频繁模式、关联和相关性
1. 理解项集、 闭项集、频繁项集和关联规则的概念; 了解规
则兴趣度的两种度量(支持度和置信度)。 2. 了解关联规则挖掘的步骤。
3. 了解Apriori 算法的步骤; 了解FP-growth 算法的步骤和优缺 点;掌握相关性度量提升度( lift )的计算方法。
( 五 )聚类分析
1.理解聚类分析的概念; 了解聚类分析的应用领域; 了解比 较聚类方法的标准; 了解数据挖掘对聚类的典型要求; 了解 比较聚类方法的各个方面。
2. 理解划分方法的概念和一般特点, 以及典型算法;理解层 次方法的概念和一般特点, 以及典型算法;理解基于密度的 聚类方法的概念和一般特点, 以及典型算法;理解基于网格 的聚类方法的概念和一般特点, 以及典型算法;
3.理解K-均值算法的步骤和优缺点; 4. 了解算法方法的距离度量。
5. 了解聚类评估概念和主要任务; 了解测定聚类质量的方
法。
三、人工智能导论
( 一)人工智能基础
1.人工智能定义: 了解掌握人工智能的基本概念与定义; 2.人工智能学派: 了解人工智能的主要学派及主旨思想;
3.人工智能历史: 了解掌握人工智能的起源与发展历程; 了 解掌握驱动新一代人工智能快速发展的数据、算法、算力等 重要驱动因素;
4. 机器学习与深度学习: 了解掌握机器学习与深度学习 、 计算机视觉、 自然语言处理、知识图谱、人机交互、机器人 技术 、SLAM 技术等主要人工智能技术的基本概念和应用 场景;
( 二)Python编程基础
1.Python基本语法: 了解掌握Python语言的特点与发展;
2.Python数据类型:掌握Python语言基本语法与数据类型;
3.Python 函数与参数: 掌握常用函数的功能与用法; 熟练 使用基本数据类型与组合数据类型;掌握Python程序分支、 循环等结构控制, 掌握异常处理方法; 掌握常用Python函 数定义、调用及参数传递方法; 掌握程序中变量作用域、 返回值 类 型 ; 掌 握代 码 复 用及模 块 化编 程 方 法 ; 掌 握 Python 面向对象编程方法, 熟悉类的定义与使用、属性和 方法的定义与使用、 类的继承等; 掌握Python 文件系统读 、 写等基本方法和操作; 掌握 Python 常用工具包,例如线 性代数、可视化等;
( 三)概率数理统计基础
1.概率基础知识,例如概率分布、联合概率、边缘概率、条 件概率等基本概念;
2.概率分布:掌握离散随机变量、连续随机变量的主要性质, 了解掌握伯努利分布、泊松分布、均匀分布、正态分布等常 用概率分布的公式与参数;
3.样本和参数估计:掌握样本的概念和性质,统计量的定义 与性质, 三大抽样分布函数的定义; 掌握大数定理和中心 极限定理; 掌握参数估计的定义, 掌握点估计、极大似然 估计方法的原理; 掌握评价估计量的标准、 区间估计的概 念和方法。
V.参考书目
1. 陈铭 主编,生物信息学( 一)(第四版),科学出版社, 2022年。
2.( 美 )陈封能,( 美 )斯坦巴赫,( 美 )库玛尔,数据 挖掘导论,人民邮电出版社,2010 年。
3. 杨博雄等,Python 人工智能: 原理 、 实践及应用, 清华 大学出版社,2021年。
以上就是小编整理的“2025考研大纲:贵州医科大学2025考研自命题考试大纲:629 智能医学综合”的全部内容,更多关于贵州医科大学研究生考试大纲,629 智能医学综合考研大纲的信息,尽在“考研大纲”栏目,下面我们一起来看看吧!