JOURNAL OF LIGHT INDUSTRY

CN 41-1437/TS  ISSN 2096-1553

基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计

方刚

方刚. 基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计[J]. 轻工学报, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013
引用本文: 方刚. 基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计[J]. 轻工学报, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013
FANG Gang. Protein expression vector optimization based on statistical language model and dynamic programming[J]. Journal of Light Industry, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013
Citation: FANG Gang. Protein expression vector optimization based on statistical language model and dynamic programming[J]. Journal of Light Industry, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013

基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计

  • 基金项目: 国家自然科学基金项目(61173113)

  • 中图分类号: TP319.9

Protein expression vector optimization based on statistical language model and dynamic programming

  • Received Date: 2016-04-13
    Available Online: 2016-07-15

    CLC number: TP319.9

  • 摘要: 针对合成生物学基因片段组装中选择最优“零件”组装功能性蛋白质表达载体费时且易出错的问题,提出一种基于引入统计语言模型(SLM)与动态规划算法的蛋白质表达载体设计方法.该方法通过统计合成生物学标准“零件”(BioBrick)的参数,将基础“零件”组装过程转化为SLM,用动态规划算法找到最优路径,以实现蛋白质表达载体的设计.实验结果证明该方法准确率高,可以减少真实装配过程的冗余操作,节省时间和费用,可用来优化其他合成生物学软件设计结果,也可独立使用来模拟装配合成生物学基因片段产生蛋白质表达载体,还可被迭代从而给出不同的优化结果供选择.
    1. [1]

      GOLER J A,BRAMLETT B W,PECCOUD J.Genetic design:rising above the sequence[J].Trends Biotechnol,2008,26:538.

    2. [2]

      GRASLUND S,NORDLUND P,WEIGELT J,et al.Protein production and purification[J].Nat Methods,2008(5):135.

    3. [3]

      CZAR M J,CAI Y,PECCOUD J.Writing DNA with GenoCAD[J].Nucleic Acids Res,2009,37:W40.

    4. [4]

      CAI Y,WILSON M L,PECCOUD J.GenoCAD for iGEM:a grammatical approach to the design of standard-compliant constructs[J].Nucleic Acids Res,2010,38:2637.

    5. [5]

      ISAACS F J,DWYER D J,DING C,et al.Engineered riboregulators enable posttranscriptional control of gene expression[J].Nat Biotechnol,2004,22:841.

    6. [6]

      GARDNER T S,CANTOR C R,COLLINS J J.Construction of a genetic toggle switch in Escherichia coli[J].Nature,2000,403:339.

    7. [7]

      ADAMES N R,WILSON M L,FANG G,et al.GenoLIB:a database of biological parts derived from a library of common plasmid features[J].Nucleic Acids Res,2015,43:4823.

    8. [8]

      ARKIN A.Setting the standard in synthetic biology[J].Nat Biotechnol,2008,26:771.

    9. [9]

      CANTON B,LABNO A,ENDY D.Refinementand standardization of synthetic biological parts and devices[J].Nat Biotechnol,2008,26:787.

    10. [10]

      DENSMORE D,HSIAU T H C,BATTEN C,et al.Algorithms for automated DNA assembly[J].Nucleic Acids Res,2010,38:2607.

    11. [11]

      COLL A,WILSON M L,GRUDEN K,et al.Rule-based design of plant expression vectors using GenoCAD[J].PLoS ONE,2015,10(7):e0132502.

    12. [12]

      JELINEK F.Statistical Methods for Speech Recognition (Language,Speech,and Communication)[M].Cambridge:MIT Press,1998.

    13. [13]

      CAI Y,HARTNETT B,GUSTAFSSON C,et al.A syntactic model to design and verify synthetic genetic constructs derived from standard biological parts[J].Bioinformatics,2007,23:2760.

    14. [14]

      CHEN S F,GOODMAN G.An empirical study of smoothing techniques for language modeling[J].Computer Speech and Language,1999(13):359.

    15. [15]

      VITERBI A J.A personal history of the viterbi algorithm[J].IEEE Signal Processing Magazine,2006,23:120.

    16. [16]

      HUANG F L,YU M S,HWANG C Y.An empirical study of good-turing smoothing for language models on different size corpora of Chinese[J].Journal of Computer and Communications,2013(1):14.

    17. [17]

      KATZ S M.Estimation of probabilities from sparse data for the language model component of a speech recogniser[J].IEEE Transactions on Acoustics (Speech and Signal Processing),1987,35:400.

    1. [1]

      丁心成孙瑞杰贾士儒侯颖 . 异源表达透明颤菌血红蛋白结合调控策略提高全细胞催化合成苯乳酸产量的研究. 轻工学报, 2026, 41(1): 69-80. doi: 10.12187/2026.01.007

    2. [2]

      杨鹏飞吴薇孙海峰刘龑章尚紫博薛晶晶许志杰宋梦坤 . 基于GC-MS结合多元统计的2种工艺提取脐橙挥发性成分差异分析. 轻工学报, 2025, 40(4): 1-9. doi: 10.12187/2025.04.001

    3. [3]

      杨鹏飞吴薇孙海峰刘龑章尚紫博薛晶晶许志杰宋梦坤 . GC-MS结合多元统计分析研究两种工艺提取的脐橙挥发性成分差异. 轻工学报, 2025, 0(0): -.

    4. [4]

      张伟伟姬远鹏元春波王君婷齐晓任张卫正李萌饶智 . 基于改进Mask R-CNN模型的粘连烟丝识别方法. 轻工学报, 2024, 39(5): 78-85. doi: 10.12187/2024.05.009

    5. [5]

      费致根鲁豪宋晓晓赵鑫昌郭兴肖艳秋 . 基于改进ResNet网络的烟丝输送带洁净度分类模型. 轻工学报, 2024, 39(5): 71-77. doi: 10.12187/2024.05.008

    6. [6]

      张建栋杨忠泮吴恋恋徐大勇朱萍张雯晶堵劲松 . 基于高光谱成像及机器学习的烟叶糖料液施加量判别模型. 轻工学报, 2024, 39(5): 86-94. doi: 10.12187/2024.05.010

    7. [7]

      杨伟平徐秀娟席辉张文娟刘珊崔凯郭亚龙杨春强 . 美拉德模型反应在模拟烟叶烘烤过程中的应用研究. 轻工学报, 2025, 0(0): -.

    8. [8]

      杨伟平徐秀娟席辉张文娟刘珊崔凯郭亚龙杨春强 . 美拉德模型反应在模拟烟叶烘烤过程中的应用研究. 轻工学报, 2025, 40(5): 91-100,109. doi: 10.12187/2025.05.011

    9. [9]

      张雷马永帅洪斌斌熊开胜徐大勇堵劲松李银华邹泉 . 一种改进OSELM算法在片烟复烤过程水分在线检测中的应用. 轻工学报, 2025, 40(3): 95-103. doi: 10.12187/2025.03.011

    10. [10]

      韩丽董滋强王丽娇李文钦王晨辉肖成志毛多斌 . 普通烟草NtASAT2的结构预测、克隆表达及功能验证. 轻工学报, 2025, 40(4): 69-76. doi: 10.12187/2025.04.008

    11. [11]

      黄朵朵王乐雷萍孙志伟李林洪张智轩黄锋李斌 . 基于烟芯段和滤嘴段耦合的加热卷烟烟气关键成分释放模型构建. 轻工学报, 2024, 0(0): -.

    12. [12]

      黄朵朵王乐雷萍孙志伟李林洪张智轩黄锋李斌 . 基于烟芯段和滤嘴段耦合的加热卷烟烟气关键成分释放模型构建. 轻工学报, 2024, 39(6): 116-126. doi: 10.12187/2024.06.014

    13. [13]

      郑艺宋芳张一帆云哲苏裕家申秀清 . 基于常规理化分析和电子传感技术的低度海红果酒发酵过程中品质动态变化研究. 轻工学报, 2025, 0(0): -.

    14. [14]

      郑艺宋芳张一帆云哲苏裕家申秀清 . 基于常规理化分析和电子传感技术的低度海红果酒发酵过程中品质动态变化研究. 轻工学报, 2025, 40(5): 20-28. doi: 10.12187/2025.05.003

    15. [15]

      王祯许怡娟刘晨宋凯魏进彬臧志鹏胡威毛多斌 . 基于宏基因组学技术的发酵陕西烟叶混合菌开发. 轻工学报, 2025, 40(6): 87-97. doi: 10.12187/2025.06.009

    16. [16]

      郭丽娟张兴月范多青叶灵陈芳锐李响丽刘欣李超 . 非标准大气压下卷烟纸阴燃速率的修正研究. 轻工学报, 2024, 39(6): 70-76. doi: 10.12187/2024.06.008

    17. [17]

      廖付田雨农李庆祥李石头许利平白冰赵振杰何文苗 . 巨豆三烯酮前体物的合成及其热解作用. 轻工学报, 2025, 0(0): -.

    18. [18]

      廖付田雨农李庆祥李石头许利平白冰赵振杰何文苗 . 巨豆三烯酮前体物的合成及其热解性能. 轻工学报, 2025, 40(5): 82-90. doi: 10.12187/2025.05.010

    19. [19]

      李梦晓刘成洋张玲董吉林申瑞玲李云龙 . 豌豆-燕麦复合蛋白凝胶制备及配方优化研究. 轻工学报, 2025, 40(3): 38-45,55. doi: 10.12187/2025.03.005

    20. [20]

      尹思睿冯娇杨晓宇李良 . 植物蛋白复配对植物肉品质的影响. 轻工学报, 2024, 39(5): 18-28. doi: 10.12187/2024.05.003

  • 加载中
计量
  • PDF下载量:  62
  • 文章访问数:  2672
  • 引证文献数: 0
文章相关
  • 收稿日期:  2016-04-13
  • 刊出日期:  2016-07-15
通讯作者: 陈斌, bchen63@163.com
  • 1. 

    沈阳化工大学材料科学与工程学院 沈阳 110142

  1. 本站搜索
  2. 百度学术搜索
  3. 万方数据库搜索
  4. CNKI搜索
方刚. 基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计[J]. 轻工学报, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013
引用本文: 方刚. 基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计[J]. 轻工学报, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013
FANG Gang. Protein expression vector optimization based on statistical language model and dynamic programming[J]. Journal of Light Industry, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013
Citation: FANG Gang. Protein expression vector optimization based on statistical language model and dynamic programming[J]. Journal of Light Industry, 2016, 31(4): 88-94. doi: 10.3969/j.issn.2096-1553.2016.4.013

基于统计语言模型及动态规划算法的蛋白质表达载体的优化设计

  • 西安文理学院 生物与环境工程学院, 陕西 西安 710065
基金项目:  国家自然科学基金项目(61173113)

摘要: 针对合成生物学基因片段组装中选择最优“零件”组装功能性蛋白质表达载体费时且易出错的问题,提出一种基于引入统计语言模型(SLM)与动态规划算法的蛋白质表达载体设计方法.该方法通过统计合成生物学标准“零件”(BioBrick)的参数,将基础“零件”组装过程转化为SLM,用动态规划算法找到最优路径,以实现蛋白质表达载体的设计.实验结果证明该方法准确率高,可以减少真实装配过程的冗余操作,节省时间和费用,可用来优化其他合成生物学软件设计结果,也可独立使用来模拟装配合成生物学基因片段产生蛋白质表达载体,还可被迭代从而给出不同的优化结果供选择.

English Abstract

参考文献 (17) 相关文章 (20)

目录

/

返回文章