密码子优化、mRNA结构优化及基因表达优化

下载文章

摘要:密码子优化是基因表达优化的关键步骤之一。其中涉及mRNA二级结构、稀有密码子、核糖体结合位点等关键因素。简单说,基因能否顺利表达蛋白与稀有密码子含量、mRNA结构是否阻碍翻译有很大关系。德泰开发的生物信息学软件MaxCodonTM经过近千个项目实践的优化,可以几乎完美地优化这些关键因素,为蛋白表达提供坚实基础。基因表达优化还包括载体,表达系统特异性,表达条件优化。

稀有密码子在线分析工具

密码子优化

密码子优化涉及的优化点可以从基因合成、载体构建、基因转录、mRNA翻译、翻译后修饰等过程中提取,目的只有一个,就是便于相关过程的高效达成。以下是部分优化内容:

南京德泰生物基因合成 基因合成

平衡GC含量
正反向重复序列
二级结构

南京德泰生物载体构建 表达载体构建

目标基因上下文
酶切位点

基因转录过程 基因转录

平衡GC含量 平衡CpG岛
SD序列 Kozak序列
TATA框 Chi位点
终止信号 隐蔽剪切位点

mRNA翻译过程 mRNA翻译及折叠

密码子偏好性
GC含量 polyA位点信号
mRNA二级结构
mRNA自由能
核糖体绑定位点

特定功能的Motif

许多motif在基因表达过程中承担着重要的角色,随着研究的不断开展,功能性motif也在不断被发现,我们会将其不断地添加到南京德泰生物的密码子优化工具中。举例如下:

  • TATA框:是构成真核生物的启动子元件之一,位于转录起始点上游-30bp处,它可以保证转录的正确定位。
  • SD序列: 作为原核表达的核糖体绑定位点,是翻译必不可少的信号。
  • Kozak 序列:真核生物中符合 Kozak 规则的基因,其转录及翻译效率较好。
  • Chi 序列:在原核生物中能够增加自然重组的几率,可能会影响人工重组蛋白的表达。
  • 隐蔽剪切位点:真核生物中存在大量的隐蔽剪切位点(cryptic splice sites),一旦被激活,会造成 mRNA 的剪接偏离我们的预期。

仔细研究转录、翻译的过程,并不断阅读基础资料及最新研究进展,不断搜集相关的 motif 模式,我们南京德泰生物在不断完善密码子优化算法。在载体设计上,我们要通盘考虑。当然,部分 motif 已经固化到了商业载体上了。

重复序列

重复序列过多,会增加基因合成的难度。反向互补序列也对 mRNA 二级结构有重要影响。德泰生物生物信息工具板块的基因重复序列计算器工具可以对序列进行分析,找出序列中重复序列的位置并计算得到重复序列的退火温度。

GC 含量

相对于 AT 配对需要 2 个氢键,GC 配对是 3 个氢键,GC 含量直接影响着 PCR 退火温度。在启动子等保守区域 GC 含量相对较高。GC 含量也影响着 mRNA 热力学稳定性及 mRNA 二级结构。

gc-content
该GC含量计算结果图由德泰生物GC含量计算工具计算并提供。

mRNA 二级结构

mRNA 二级结构是影响翻译过程的重要因素,复杂稳定的二级结构会阻碍翻译过程的顺利进行,特别是核糖体绑定位点(RBS)附近的二级结构。mRNA 的二级结构预测是一个复杂的过程,需要考虑碱基配对、自由能等多种因素,南京德泰生物的密码子优化系统可以快速有效识别发卡(Hairpin)结构区并进行有效规避。

mrna-secondary-structure

密码子偏好性

不同物种的种属之间,对同义密码子的使用频率是不同的。在外源基因的同义密码子使用频率与表达宿主相匹配的情况下,外源基因的表达水平会显著提高。常用密码子适应指数(Codon Adaption Index)来表示。

codon_bias
德泰生物生物信息工具板块提供密码子适应指数计算工具,输入序列并选择宿主细胞及遗传密码子表,即可计算得到该序列在宿主细胞的密码子适应指数CAI。

限制性酶切位点

限制性酶切位点需要根据实际情况进行排除,以免与需要用到的酶切位点产生冲突,影响重组基因的操作。

仅供科研

联系我们

电话:(025)5889-4959

咨询:Sales@DetaiBio.com

地址:南京市高新开发区星火路10号