Model_learning
基于iGEM获奖团队的Model学习与总结
Judging
| 1 | How impressive is the modeling? 建模有多令人印象深刻? |
|---|---|
| 2 | Did the model help the team understand a part, device, or system? 该模型是否帮助团队了解部件、设备或系统? |
| 3 | Did the team use measurements of a part, device, or system to develop the model? 团队是否使用零件、设备或系统的测量值来开发模型? |
| 4 | Does the modeling approach provide a good example for others? 建模方法是否为其他人提供了很好的示例? |
根据iGEM官方给出的评分标准,一个好的model应该具备创新性(使人印象深刻)、实用性(加深对项目的理解)、科学性(符合实验数据)、启发性(可为他人所用),分别对应上述四条标准,因此后文中提到的“四性”即分别指代四条评价标准。
图例
🥇金牌
🥈银牌
🔟Top 10
⭐值得学习
❗需要警示
2024年
(精读)BNUZH-China 2024 🥇🔟 Nominees
小问题:页面右侧没有滚动条,导致无法快速浏览整个页面
❗大问题:本项目所有的模型似乎都没有提供代码或交互端口、文章内部没有标注参考文献
简介:共涉及5个主要模型
- 潮汐动力模型(包括潮汐谐波分析和潮汐微生物扰动模型)
- 代谢途径模型(包括胞外吸附模型、胞内降解模型和自杀系统模型)
- 蛋白质建模(包括PEase酶蛋白建模分析和分子对接)
- PE结合肽预测器(PEBP)
- 智能聊天机器人(iGEMBot V.2)
详细介绍:
潮汐动力模型(Tidal Dynamic Model)
该模型旨在研究潮汐对红树林生态系统中微生物分布的影响。
- 潮汐谐波分析(Tidal Harmonic Analysis):通过分析红树林区域的潮汐数据,研究潮汐对微生物分布的影响。模型基于潮汐的周期性变化,考虑了珠江口的径流影响,并通过最小二乘法求解潮汐参数。
- 潮汐微生物扰动模型(Tidal Microbial Perturbation Model):假设潮汐和水流为不可压缩流体,微生物为等长杆状物,通过连续性方程和纳维-斯托克斯方程模拟潮汐对微生物的扰动。
我的评价:该模型差强人意,并未达成团队设定的目的!
仅看模型的文字介绍部分会认为有一定创新点——“将海洋学和环境科学中较为常见的潮汐动力模型,应用于微生物分布相对较少”,但仔细阅读后发现该模型仅对潮汐本身的水动力学特征进行了描述,而没有深入到微生物在实际环境中的具体行为和效果。甚至假设的两个前提之一“微生物被认为是等长的杆”在实际求解中完全没有被用到,由此看出该模型仅是一个普通的流体模型,其实际贡献并不大。
代谢途径模型(Metabolic Pathway Model)
该模型通过常微分方程(ODE)建模,研究了微生物降解PE的三个重要途径。
- 胞外吸附模型(Extracellular Absorption Model):通过PE结合肽(PEBP)和PE降解酶(PEase)形成的融合蛋白,模拟了PE的吸附和降解过程。结果显示,PEase可以有效结合PE微塑料并将其降解为小分子。
- 胞内降解模型(Intracellular Degradation Model):引入了ALKB2-RD45-ADH融合蛋白,模拟了PE小分子在细胞内的进一步降解过程。结果显示,R-H逐渐被氧化为脂肪酸,最终通过脂肪酸代谢转化为CO₂。
- 自杀系统模型(Suicide System Model):通过hok/sok系统防止质粒丢失,模拟了细胞在质粒丢失时的自杀机制。
我的评价:相对常见的ODE建模,建模过程完整、思路清晰。
对model的定位有这样一段话:“so as to provide data and result support for the wet lab and verify the experimental results” ,我个人持怀疑态度,不应是wetlab的结果去迎合model,恰恰相反,应该是model先预测结果,如果在wetlab确认无误情况下,与实际wetlab结果不符,则应该去修改model。
而在实际建模中,曾两次将model结果与wetlab结果对照,均得出两者相符的结论,这一点我认为是必要且正确的。蛋白质建模(Protein Modeling)
该模型利用AlphaFold3和Chai Discovery预测PEase酶的结构,并进行分子对接研究。
- PEase酶蛋白建模分析(PEase Enzyme Protein Modeling Analysis):通过分子对接研究PEase与烷烃分子的相互作用,分析其结合亲和力。结果显示,PEase与大、小烷烃分子的结合主要依赖于疏水相互作用。
- 分子对接(Molecular Docking):通过AutoDock Vina进行分子对接实验,分析PEase与大、小烷烃分子的结合亲和力。
⭐我的评价:非常详细的蛋白质建模,其中用到了很多软件,例如:AlphaFold3、DynaMut tool、AutoDock Vina,包括其他学校提供的软件Chai Discovery,这些都是值得学习借鉴的。
美中不足的是:1、在PEase酶蛋白建模分析PEase与大、小烷烃分子的结合中,直接选择了一个48碳的大烷烃和2-甲基十二烷,但并未指明为什么仅选择了这两个烷烃,是随机选择的并以两者作为例子?还是实验证明现实环境中就是这两种塑料分子占多数?抑或是实验室容易获得这两种烷烃?我猜测可能是因为这两种烷烃仿真的数据较好。但无论如何应该说明选择的依据。2、图10和图19为同一张图片。3、wetlab的结果多为绝对数值,我认为可以增加一些相对变化百分率来更直观地体现模型的进步。
PE结合肽预测器(PEBP Predictor)
该模型基于支持向量机(SVM)和图神经网络(GNN)技术开发,用于快速筛选能够结合PE的肽序列。通过特征选择、数据增强和注意力机制,提高了模型的预测性能。
⭐我的评价:这是整个项目规模最大的一个模型,也是最具有实用意义的。如果后续准备做神经网络预测模型,可以借鉴该model的建立过程。
智能聊天机器人(Chatbot)
该模型基于大型语言模型(LLM)和检索增强生成(RAG)技术开发的聊天机器人iGEMBot V.2,用于支持iGEM团队的协作和资源获取。通过LangSmith框架评估了系统的性能,并通过系统可用性量表(SUS)调查了用户满意度。
我的评价:感觉像是凑数的一个部分。本应该是Software板块的内容强行加入Model,而且即使作为Software也并未包含足够的功能,仅支持对官方文档内容的快速检索功能。对于队伍项目的搜索需要先将项目文档作为input,因此难以推广至其他团队的项目。
我的打分:创新性 - 4/6分 实用性 - 5/6分 科学性 - 3/6分 启发性 - 4/6分
实际得分:创新性 - 4.8/6分 实用性 - 5/6分 科学性 - 5.8/6分 启发性 - 5.4/6分
(泛读)CJUH-JLU-China 2024 🥇 Nominees
❗本项目的板块划分相当混乱:Model板块有四个主要部分——第一部分为文献调研和目标筛选;第二部分为part的设计;第三部分为通过一些定量指标筛选并优化part的设计;第四部分才是传统的ODE建模,LIRA 介导的细胞内和外反应的模拟和分析。总体来说参考价值不大。
(精读)Tsinghua 2024 🥇🔟 Nominees
页面开头对model用途的总结比较到位,值得学习——Computational Methods for Project Engineering: If the project can be carried out, the model can help determine the parameters in the implementation process of the project, reduce the calculation amount in the experimental process, connect the wet experimental independent system , and make the design mathematically encapsulated as new components.
❗大问题:页面中的数学公式都没有成功渲染,虽然用火狐浏览器显示正常,但不能保证评委不会用edge浏览器,这种问题需要避免!(这方面北师珠海2024做得比较好,值得学习)

简介:共涉及4个主要模型
- Muscone吸入的隔室模型
- Muscone与其受体的分子动力学模拟
- 酵母MAPK信号传导的常微分方程模型
- 乳酸吸收模型
详细介绍:
Muscone吸入的隔室模型
描述了Muscone从吸入到在肠道中浓度增加的整个过程,包括吸入、肺部过程、粘附过程、肺泡微血管过程、全身循环过程和肠道过程。
- 吸入过程:描述Muscone以气溶胶形式吸入肺部的过程。
- 肺部过程:Muscone在肺泡中的分布,可能被呼出、粘附或渗透到微血管中。
- 粘附过程:部分Muscone粘附在呼吸道粘膜上,然后扩散到全身循环。
- 肺泡微血管过程:Muscone渗透到肺泡微血管中,逐渐进入全身循环。
- 全身循环过程:Muscone在全身循环中分布,并通过血液运输到身体各个部位。
- 肠道过程:Muscone通过肠系膜微血管网络进入目标肠道,其浓度开始增加。
我的评价:中规中矩的ODE建模,结合matlab仿真。优点是通过折叠形式给出代码,在不显得累赘的前提下增强可信度。
Muscone与其受体的分子动力学模拟
通过分子动力学模拟,研究Muscone与受体Or5an6(MOR215-1)的结合过程,包括分子模型构建、系统准备、力场参数化、预处理、分子动力学模拟和后处理与分析。
⭐我的评价:该部分写得非常详细,从数据的下载、到软件的下载和使用、再到环境配置等等,不过不确定是否会被认为是流水账,重点无法突出(?)但不论如何在实操过程中将会是很好的指导。
工具 用途 PubChem 获取分子结构信息 Avogadro 将上述结构转换为PDB格式文件 Uniprot 获得蛋白质的氨基酸序列 AlphaFold 获得蛋白质的三维结构模型 AutoDock & Vina 确定潜在的结合构象并获得对接数据 Pymol 分析生成的对接结构,识别潜在的结合构象,并确定稳定的低自由能构象 GROMACS 系统构建(创建模拟盒子、添加溶剂、添加离子);能量最小化;平衡模拟(NVT平衡、NPT平衡);生产模拟;轨迹分析与可视化;数据分析(能量分析、均方根偏差(RMSD)分析、半径gyration计算、蛋白-配体相互作用能计算) 酵母MAPK信号传导的常微分方程模型
模拟了Muscone激活受体后,通过G蛋白、Ste20、Ste5等蛋白的级联反应,最终激活转录因子pFUS1,导致下游基因LahA表达乳酸脱氢酶LDH,催化丙酮酸转化为乳酸的过程。
- Muscone受体激活:描述Muscone与受体Ste2结合后激活G蛋白的过程。
- 支架形成:描述Ste4Ste18与Ste5结合形成支架的过程。
- 级联反应:描述Ste5支架招募Ste11、Ste7和Fus3,并通过级联磷酸化传递信号的过程。
- pFUS1激活:描述Fus3激活转录因子pFUS1,导致下游基因LahA表达乳酸脱氢酶LDH,催化丙酮酸转化为乳酸的过程。
我的评价:中规中矩的ODE建模。
乳酸吸收模型
描述了乳酸在肠道中的吸收过程,比较了直接摄入乳酸和诱导分泌乳酸两种情况下的乳酸浓度变化。
- 直接给药:描述直接摄入乳酸后,乳酸在肠道中的浓度变化。
- 诱导分泌:描述通过诱导分泌乳酸后,乳酸在肠道中的浓度变化。
❗我的评价:整个页面的败笔!像是时间不够了最后匆匆了事,完全没有回应自己所提出的问题:为什么不能直接服用乳酸或乳酸菌益生菌?大量的乳酸分泌会导致人体内酸中毒吗?
我的打分:创新性 - 3/6分 实用性 - 5/6分 科学性 - 3/6分 启发性 - 5/6分
实际得分:未知
(精读)Waseda-Tokyo 2024 🥇🔟 Nominees
❗小问题:首页上的图片字有点小,建议增加点击图片放大功能;Model页面被强行分割成几个部分,最好放在同一大页面,可参考Heidelberg 2024的排版。
⭐(题外话)下图所示为基因回路示意图,有两点好处:1、动图形式非常易于理解;2、采取电击作为基因开关有创造性。

采用图示方式介绍建模整体思路,方便读者理解。

简介:共涉及4个主要部分
- 电响应模块与PET降解
- BIND-PETase的灭菌方法
- 反应系统的规模化应用
- 蛋白质仿真
详细介绍:
电响应模块与PET降解
通过建模电响应基因电路,优化了影响PET降解行为的关键参数;成功模拟了电响应启动子的行为,并验证了其功能;同时,团队模拟了BIND-PETase的外部转运和Curli纤维的形成。
⭐Gene Circuits:虽然是传统的ODE建模,但用于检验Cre Recombination和Downstream Gene Expression的可行性显得比较新颖,将part和model的工作交叉,更加贴合judging中的实用性。
⭐**Surface Display:**由于湿实验中无法直接测量Curli纤维的数量,团队通过干实验模型定量分析了CsgA蛋白的展示和Curli纤维的形成,估算了最佳条件并优化了实验参数。尽管湿实验未能验证所有假设,干实验模型成功模拟了整个过程,并为实验提供了有价值的见解,帮助优化湿实验条件并改进实验设计。干湿实验的交互体现得比较成功。
**Curli Fiber Formation:**结果表明,Curli纤维的形成在CsgA和CsgB被转运到细胞外后逐渐开始,但由于CsgA的聚合反应速率常数较大,Curli纤维的浓度相对较小。为了增强Curli纤维的形成,团队认为增加CsgEFG的表达是必要的。整体而言,团队的模型为Curli纤维的形成提供了理论支持,并为湿实验应用提供了见解。
**PET Degradation:**团队建立了一个新模型,解释了BIND-PETase在Curli纤维上降解PET的过程。由于PETase与Curli纤维的结合复杂,传统的酶反应模型(如Hill方程)无法应用,因此开发了一个专门的模型。
模型包括:
- PET与PETase的结合与裂解概率:通过热力学和Maxwell-Boltzmann分布估算结合和裂解概率。
- PET链长变化:考虑了PETase在Curli纤维宽度内降解PET的两种情况,并计算PET链长的变化。
- PET降解过程:通过PET链长变化来描述降解过程。
- PET浓度变化:计算降解过程中PET浓度的变化。
尽管计算机性能限制未能完成所有模拟,模型成功证明了BIND-PETase在Curli纤维上有效降解PET,并与实验结果一致。该模型也可应用于其他全细胞催化剂,特别是不能自由扩散的酶反应。但我在看该模型时觉得公式有点不太对,可能是没有完全理解团队的意思。
BIND-PETase的灭菌方法
研究了BIND-PETase作为全细胞催化剂的灭菌方法,证明了电灭菌比热灭菌更有效。此外,团队还通过添加MazF的二次电响应,评估了其对大肠杆菌的影响,并指出此启动子需要谨慎使用。
((其他没啥,但这一模一样的文字写两遍是怎么回事……

- **MazF灭菌:**模拟了在不同电压条件下,大肠杆菌的存活率和基因电路的行为,包括第二阶段电刺激激活MazF。结果表明,在适当的MazF表达下,大约50%的大肠杆菌被灭菌,且几乎没有消耗外部能量。我认为至此drylab仿真得有点太多了,显得wetlab与之脱节,drylab的可信度有所下降。
- **电灭菌与热灭菌的比较:**在这一部分,团队计算了在二阶段电响应后进行灭菌所需的能量,并对电灭菌和热灭菌的能量消耗进行了定量比较。通过与多方利益相关者的访谈,团队认为在一定规模的反应容器中使用BIND-PETase是可行的,并且电灭菌相比热灭菌能显著减少对自然环境的负面影响,特别是在工业应用中,从可持续能源使用的角度来看,这种方法更为有效。比较简单的建模,但与HP相联系。
反应系统的规模化应用
团队研究了电响应启动子中的Pyocyanin扩散条件,成功模拟了在更大规模下的反应系统扩展,并证明该模型可以应用于其他物质,为工业应用提供了可能。
- **扩散模型:**简单的模型,团队宣称参照之前某队伍的二维建模而创新出三维建模,不过效果似乎一般,自己假设的值也比较多,未必合理。
蛋白质仿真
团队开发了一个计算机模拟的蛋白质进化管道,用于PETase(一种能够降解PET塑料的酶)的进化。
- 计算机模拟进化管道(In Silico Evolution Pipeline):
- 通过机器学习进行突变设计:在氨基酸序列的巨大组合中,使用机器学习模型设计最优的突变序列。团队使用了两种机器学习模型,ESM3和EvoProtGrad,用于蛋白质突变设计。ESM3是一种蛋白质语言模型,可以通过提示将突变引入特定蛋白质。EvoProtGrad是一种整合多个机器学习模型输出的方法,用于探索高分区域。
- 计算机模拟筛选(In Silico Screening):使用pyRosetta和DockString作为计算机模拟筛选的方法。pyRosetta用于计算蛋白质的稳定性,DockString用于计算PET和PETase之间的对接分数,评估结合亲和力。
- 人工验证(Human Validation):通过考虑能量水平和结合姿势的自然性等多因素,选择更可靠的候选序列。通过分子对接实验进行,使用PETase和小PET分子进行对接,提高了筛选过程的可靠性。
以下是iGEM Waseda Tokyo 2024团队在PETase进化模型中用到的工具及其用途的整理:
蛋白质进化与设计
工具 用途 ESM3 用于通过机器学习设计PETase的突变序列。 EvoProtGrad 结合ESM2和EvCouplings,用于探索高分突变区域。 GFlowNet 用于模拟定向进化的计算机模拟过程,通过多轮突变和筛选优化蛋白质。 计算机模拟筛选
工具 用途 pyRosetta 用于计算蛋白质的稳定性。 DockString 用于计算PET和PETase之间的对接分数,评估结合亲和力。 Auto Dock Vina 用于分子对接实验,预测PET分子与PETase的结合模式。 蛋白质特性分析
工具 用途 Alphafold2 用于预测蛋白质的三维结构。 FoldX 用于分析蛋白质的稳定性。 分子对接与验证
工具 用途 MGLTools 用于将PDB文件转换为PDBQT格式,准备分子对接所需的文件。 UCSF Chimera 用于对PETase变体结构进行能量最小化处理,确保对接时使用最稳定状态。 Draw Molecule Online 用于创建PET分子的数据文件。 PyMOL 用于可视化分子对接结果,检查PET分子是否正确结合到PETase的结合位点。 其他工具
工具 用途 Open Babel 用于文件格式转换,例如将PDBQT文件转换为PDB文件以便可视化。 RDKit 用于分子嵌入和优化。 - 计算机模拟进化管道(In Silico Evolution Pipeline):
我的打分:创新性 - 5/6分 实用性 - 5/6分 科学性 - 5/6分 启发性 - 5/6分
实际得分:创新性 - 5.5/6分 实用性 - 5.3/6分 科学性 - 5/6分 启发性 - 5.3/6分
(精读)Heidelberg 2024 🥇🔟 Winner
⭐非常清晰简洁的Model流程图,也很美观,值得学习:

团队开发了名为DaVinci的计算模型,用于快速设计和原型化其PICasSO系统。该模型通过模拟PICasSO“连接蛋白”与DNA的相互作用,帮助优化实验参数和空间连接。
DaVinci的工作流程包括:
- 结构建模:利用现代机器学习工具预测连接蛋白的结构。
- 分子动力学模拟:研究连接蛋白与DNA片段的相互作用。
- 长程DNA相互作用评估:分析多个连接蛋白对DNA空间组织的影响。
通过与实验数据的校准,DaVinci能够模拟复杂的DNA空间重排,为实验设计提供直接指导。该模型的应用使科学家能够基于准确的模型预测,有效且安全地在三维空间中进行基因组工程。 此外,团队还开发了PICasSO工具箱,利用不同CRISPR/Cas蛋白的可编程DNA结合能力,实现任意DNA序列的匹配。该工具箱结合了DaVinci模型,进一步推动了三维基因组工程的发展。
软件使用流程图如下:
用户输入
│
├─ 静态结构预测(AlphaFold3 + PyMOL)
│ ├─ 用户:输入序列,运行脚本
│ └─ 计算机:生成.pdb,过滤原子
│
├─ 原子模拟(GROMACS)
│ ├─ 用户:设置参数,提交作业
│ └─ 计算机:执行MD,输出力场数据
│
├─ 力场转换(Python)
│ ├─ 用户:运行转换脚本
│ └─ 计算机:计算刚度,生成.pk1文件
│
├─ 粗粒化模拟(oxDNA)
│ ├─ 用户:配置拓扑,提交任务
│ └─ 计算机:松弛、环化、钉合模拟
│
└─ 结果分析
├─ 用户:运行分析脚本
└─ 计算机:生成直方图,可视化结构
达芬奇(Davinci)通过整合AlphaFold3、GROMACS、oxDNA等工具,构建了首个多尺度3D基因组工程仿真平台,其核心创新在于:
- 跨尺度建模:将原子级精度(GROMACS)与粗粒化动态(oxDNA)通过数学力场转换无缝衔接,实现从蛋白质-DNA相互作用到长程DNA折叠的全链条模拟。
- 自动化流程:开发Python模块统一管理数据预处理、模拟参数优化及结果分析,减少人工干预,效率提升约47%。
- 资源智能分配:动态调度CPU/GPU集群资源,例如AlphaFold3运行于CPU节点,GROMACS优先使用GPU加速,显著缩短传统需数月的任务至数天。
我的评价:整个模型的体量非常大,需要的硬件配置(230GB RAM、1.5TB存储、64 GPU核心)对于普通PC来说难以承担,因此PC端较难复现。对照评分标准来看,确实给人耳目一新的感觉,但仔细看完其实也仅是将市面上几种仿真软件串联使用,因此我认为整个model是impressive的,但不够creative;而对于“帮助团队了解部件、设备或系统”、“使用零件、设备或系统的测量值来开发模型”和“建模方法是否为其他人提供了很好的示例”这三项评分点,本项目做得很好。
我的打分:创新性 - 5/6分 实用性 - 6/6分 科学性 - 6/6分 启发性 - 5/6分
实际得分:未知
有个疑问:为什么不申报Software单项奖,感觉项目更像是一个software?看了Software的6条评分标准,应该也都符合。
2023年
(泛读)AFCM-Egypt 2023 🥇 Nominees
题外话:页面做了个鼠标跟随效果,略显炫酷()
简介:模型主要是一个细胞治疗的常微分方程(ODE)模型,旨在通过工程化的间充质干细胞(MSCs)治疗类风湿性关节炎(RA)。
详细介绍:
- 细胞受体与B细胞受体结合动力学模型
该模型描述工程化MSCs与自体反应性B细胞的受体(BCR)之间的结合与反应。通过ODEs,模拟了受体表达的变化、B细胞的激活和降解等动态过程,帮助预测不同治疗方案的效果。 - 外泌体生成与CRISPR Cas12k系统的应用
该部分模型模拟了MSCs在靶向B细胞的过程中,如何通过工程化的Syn-notch受体激活后,生成外泌体并将其内部的CRISPR Cas12k系统导向自体反应性B细胞。 - 治疗策略优化
通过对上述模型的仿真分析,团队能优化治疗方案,包括受体的表达水平、外泌体的释放量以及CRISPR Cas12k系统的效能。
- 细胞受体与B细胞受体结合动力学模型
我的评价:总体是比较规范的ODE建模,⭐但有一个值得学习的点就是在每个小model结束后都会清晰列出“How did this model direct the project design?”“How is this model considered to be modular and useful for others?”等内容,紧扣评分标准,但不知这么做是否太显功利(?)
以下三个项目都是Foundational Advance赛道且最终获得top 10
(泛读)William-and-Mary 2023 🥇 🔟 Nominees
亮点:本项目成功开发了针对结核分枝杆菌的基因组规模代谢模型(GSMM),通过使用 CarveMe 软件基于基因组注释生成初始代谢反应网络,并利用 Memote v0.14.0 软件进行多次迭代优化,最终模型的 Memote 得分从初始的 69% 提高到 90%。项目团队通过 ModelPolisher 工具和自定义的半手动注释脚本显著提高了模型的注释质量,特别是基因注释的一致性得分从 0% 提高到 100%,并从 UniProt 数据库中获取额外的基因注释,进一步提升了模型的注释质量。此外,团队手动修改了模型中的反应,解决了化学计量不一致的问题,使模型在 Memote 中的化学计量一致性得分达到 100%。项目还将常用的 7H9 培养基(含甘油)的组成纳入模型,并使用 CarveMe 进行填补,确保模型能够准确反映实际培养条件下的代谢行为。所有版本的 GSMM、相应的 Memote 报告以及开发过程中使用的软件工具均已公开发布,为未来的研究提供了宝贵的资源。最终,该模型在 Memote 评估中得分为 89%,显著高于 BiGG 数据库中已发表的模型的平均水平,表明其在质量和准确性方面具有较高的标准。
提到Latvia-Riga’s 2022 iGEM team使用了已发表的宿主模型——红酵母(Rhodotorula toruloides),开发模型以整合藏红花素(crocin)生产回路。
(泛读)NUS-Singapore 2023 🥇 🔟 Nominees & Best Foundational Advance Project
该Model项目结合了传统生物学方法和前沿的深度学习技术,致力于优化和设计高效的 RNA开关。该团队开发了两种主要的模型:常微分方程(ODE)模型 和 深度学习模型。
常微分方程模型:用于模拟蔗糖和IPTG对细胞生长和裂解的影响,通过精确预测细胞行为,优化RNA开关在细胞内的表现。
深度学习模型:是项目的亮点,采用Transformer架构,能够基于大数据和已有的实验结果设计和优化RNA开关。该模型不仅可以预测RNA序列的二级结构,还能生成高效的RNA开关序列,并优化其功能性,如提高ON/OFF比、增强稳定性和响应速度。
优势:
高效优化:模型能够大规模搜索最佳RNA开关序列,减少实验验证时间,提升设计效率。
多重功能性:支持RNA开关的精确调控,能够满足特定实验和应用需求,如基因表达调控、生物传感器开发等。
创新结合:通过结合传统的物理建模与机器学习,推动RNA开关设计向更高效、更智能的方向发展。
(泛读)UCAS-China 2023 🥇 🔟 Nominees
⭐题外话:model的introduction部分写得很清晰,值得学习。
模型包含四个部分:一是核心的三个回路设计,包括确保可重复使用的自更新设计、仅在诱导剂强度超过阈值时启动的阈值守护以及依赖 IPTG 标签的自杀设计,通过建模和实验确定了阈值为 680umol/L;二是扩散过程的可视化,结合物理规则和计算机视觉技术,设计了扩散 APP 界面;三是校准曲线模型,确定诱导剂与报告基因的关系,使曲线与实验数据拟合;四是与硬件的交互,使用 COMSOL 模拟不同容器尺寸的流线,确定适合的硬件尺寸。
我的评价:整个model体量大但意义不大,各部分之间撕裂感比较严重。但第一部分中通过建模帮助wetlab找到准确阈值比较有趣,值得学习。
常用术语
In silico
含义:意为“在硅之中”,即通过计算机模拟或计算模型进行的实验。它与传统的“in vivo”(体内)和“in vitro”(体外)实验相对。
Pipeline
含义:在生物信息学中,“pipeline”是指一系列自动化的计算步骤,用于处理和分析生物数据。它通常用于处理复杂的多步骤数据分析任务,例如在高通量测序数据分析中,pipeline可以将多个工具和步骤组合在一起,实现从原始数据到最终结果的自动化处理。
Single-cell sequencing
含义:DNA研究中涉及测序单细胞微生物相对简单的基因组。
总结
1、Model常常与Software联动,为Software做好理论基础,但不应将两者混淆,有些队伍为了冲某一板块的单项奖,将二者混为一谈,虽然看上去该板块的体量确实大了,但我认为感观未必好。我认为还是应该Model部分展现理论;Software部分体现交互。(目前看下来2024年许多队伍只做model,不做software,因此software单项奖水平普遍不高)
2、Model要注意与实验数据相验证:与实验相符,则证明建模相对完善;与实验不符,则需修改model。总之要在model的页面中体现与实验数据相对照的过程,否则会显得model与wetlab割裂,并没有起到辅助wetlab的初衷。
3、在页面开头除了总述建立了哪几个模型,还应同时点明各自有哪些创新点,最好还能说明该model的普适性,总之紧扣评分标准,近年的队伍页面做得越来越长,评委很难快速抓取得分点。
