AutoML.org

弗莱堡-汉诺威-图宾根

计算机模拟 RNA 设计

RNA 设计指的是在给定结构表示的情况下,寻找 RNA 核苷酸序列的问题。
由于 RNA 是细胞中最重要的调节因子之一,人工设计的 RNA 例如可以用于开发按需 RNA 疗法。

我们开发了 LEARNA,一种用于 RNA 设计的自动化强化学习 (AutoRL) 方法。
给定目标 RNA 二级结构,LEARNA 生成一个 RNA 序列,然后评估其折叠成目标结构的能力。

从方法论上讲,LEARNA 使用联合架构和超参数搜索 (JAHS) 方法,并结合元学习,以找到最适合给定应用的强化学习 (RL) 系统。
特别是,LEARNA 采用了一种高效的贝叶斯优化方法,BOHB,来联合优化丰富的配置空间,包括循环神经网络 (RNN)、卷积神经网络 (CNN) 和全连接层的元素,MDP 的参数(如奖励函数形状和状态空间大小),以及训练超参数(如批大小)。
每个配置定义了一个特定的 RL 智能体和环境,用于在数千个 RNA 设计任务中元学习 RNA 设计策略。最终,根据验证损失,选择表现最佳的配置进行测试。

通过从学习到的策略中采样 RNA 序列,针对给定的 RNA 结构,LEARNA 实现了巨大的加速,并比该领域的其他方法表现更好。

有关 LEARNA 的更多信息,请访问我们的 ICLR 论文 或查看我们的 博客文章