当前位置:首页 > 生物信息学名词解释 重点
名词解释
算法:是对解决问题的方法的一种精确描述。
聚类分析:就是将数据分成若干簇(cluster),簇内最大程度相似,簇间最大程度相异。 某一状态的出现概率仅取决于其前驱的k个状态,k阶马尔可夫模型
数据结构:被计算机加工的数据彼此间存在着某些逻辑上的联系,这些联系需要在对数据进行存储和加工时反映出来。
程序:是对所要解决问题的各个对象和处理规则的描述,或者说是数据结构和算法的描述。
序列的比对:是一种关于序列相似性的定性描述:在什么区域相似,在什么区域存在差别。最优比对:揭示两条序列的最大相似程度。(又叫序列联配,其意义在于从核酸、氨基酸的层次分析序列的相似性,推测其结构功能及进化上的联系,是基因识别、分子进化、生命起源研究的基础。)
相似性 (similarity):是可以量化的参数,是一种直接的数量关系,是量的判断,可多可少,如百分之几。 同源性 (homology) :是指从一些数据库中推断出序列在进化上曾具有共同的祖先的结论,属于质的判断。 直系同源(orthology):
(1)在进化上起源于一个始祖基因 并垂直传递(vertical descent)的同源基因; (2)分布于两种或两种以上物种的基因组;
(3)功能高度保守 乃至于近乎相同,甚至于其在近缘物种可以相互替换; (4)结构相似;
(5)组织特异性与亚细胞分布相似。 旁系同源(paralogy)
同一基因组(或同系物种的基因组)中,由于始祖基因的加倍而横向(horizontal)产生的几个同源基因。 马尔可夫特性(无后效性):若已知现在的状态,将来与过去无关。即根据当前的状态即可完全确定将来的
状态。 马尔可夫链:
具有马尔可夫特性的离散状态随机过程。
顺式调控元件 :位于起始点上游(基因5‘端)控制转录的DNA序列, 靠近它所调控的编码序列 ; 其结构是模块化的,即DNA序列能被分成各个单元。
反式调控元件:远离所调控的编码序列,通常位于不同的染色体上。 单基因回路:蛋白质与DNA启动子和增强子的相互作用。
启动子:识别DNA分子上的起始信号. 启动子能调控基因转录,分为: 转录因子,抑制因子。
蛋白质活性位点(active site)/结合位点(binding site):指蛋白质在具有生理活性时,与其他物质相结合并起重要作用的区域。
基因表达(gene expression):基因通过转录和翻译,产生蛋白质产物和直接转录RNA参与生物功能的过程。 基因调控:涉及基因的启动关闭、活性的增加或减弱,发生在转录阶段、转录后加工阶段和翻译阶段。 负调控( Negative control ):阻遏蛋白(repressor protein)结合在受控基因上时不表达,不结合时就表达的形式。
正调控( Positive control ):基因表达的活化物( activators )结合在受控基因上时,激活基因表达,不结合时就不表达的形式。
一次数据库:记录实验的结果和一些初步的解释。
二次数据库:对一次数据库的数据进行分析和提炼加工后形成的、便于使用的数据库。
空位罚分 (gap penalty ):序列比对分析时为了反映核酸或氨基酸的插入或缺失等而插入空位并进行罚分,以控制空位插入的合理性。
共分享92篇相关文档