计算机与生物等学科?

48 views
Skip to first unread message

ewd

unread,
Dec 25, 2008, 10:47:21 PM12/25/08
to TopLanguage
昨天晚上看了一个林家翘先生关于数学在新世纪的几个发展方向的讲座视频,里面提到了数学、计算机和生物之间的关系。生物是一门实验学科,以基因
为例,里面有大量的数据,怎样在这样多的数据中寻找出一个普遍的规律?一是要借于强大的计算机的数据处理能力,另外一个就是可能需要你在数学领域里引入
一些新的知识,就如同当时牛顿在解决万有引力的问题时,自己引入了微积分的思想,这是一个重大的进步,在数学上具有划时代的意义。
我并不是想在这儿强调数学有多么多么重要,这个已经有很多人强调过了。我想的是,计算机的应用。我个人感觉,我们国家的计算机专业,尤其是是软
件工程专业,更多的是为了国家的信息产业、软件产业服务,因此这个专业本身具有较强的方向性和实用性。但是是否有必要在大学阶段开些讲座或引入一些课程
(不用太多课时),来讲些关于计算机与其它学科之间应用的介绍性知,让更多的同学了解这些?以前听说,人在年轻时,知识的宽度比深度更重要,我一直坚信
这个观点。而且现在很多的突破都是在解决边缘科学、交叉科学问题时产生的。因此我觉得这个有必要。而且一些图书出版社也可以考虑出些关于介绍计算机学科
应用在生物学科等的科普系列,据我了解,这些书好像不是很多。不知道大家是什么看法?

Yang Ding

unread,
Dec 26, 2008, 12:16:21 AM12/26/08
to pon...@googlegroups.com
生物信息就是你说的生物和计算机交叉的学科 是用数学和计算机的方法解决生物中的问题的 既有处理数据的 也有建立模型然后求解微分方程的
你对此感兴趣的话可以看看生物信息的教材

生物信息的一个分支就是所谓的基因组学 著名的human genome project就是基因组学的一个经典的项目
现在这个领域正在经历爆炸式的发展 甚至有一篇论文发出来技术已经过时了的情况 更不用说写书了

在处理数据方面最主要的技术是机器学习 当然还有一些序列比对这些比较经典的东西 在建立数学模型解决问题方面很多时候需要考虑计算复杂度
模型稍一复杂很多问题就是NP-hard的了 如果是在可计算的情况下那么如何设计出高效的算法 也是一个经常需要考虑的问题

2008/12/25 ewd <j56...@163.com>:

fang xu

unread,
Dec 26, 2008, 2:19:21 AM12/26/08
to pon...@googlegroups.com

生物学作为实验科学,其理论以及与数学、计算机的交叉融合还很不完善。

计算机在生物信息学中主要还是作为一门技术出现的,只是一件工具,而不像是一门"科学",到生物学真正能反作用于计算机科学,带来计算机的发展的时候,这两门学科就算是真正的交叉了。


2008/12/26 Yang Ding <ydin...@gmail.com>

Weiyu Yi

unread,
Dec 26, 2008, 7:54:14 AM12/26/08
to pon...@googlegroups.com
恩,其实所谓的生物信息学,计算机就是个工具,对计算机专业的要求无非就是算法和数据处理(比如机器学习之类的),这类交叉学科早接触晚接触其实意义不大,基础好随时都可以转型搞这方面研究的,门槛很低,没什么新鲜的概念


2008/12/26 fang xu <ust...@gmail.com>

Dao

unread,
Dec 26, 2008, 5:41:28 AM12/26/08
to TopLanguage
恩,计算机在生物、医学中其实有挺大的应用。

从工程和应用的方面讲,应用最多的可能是医疗信息系统,比如现在很多大医院推行的电子病历等。
还有生物医学工程中涉及到的许多成像分析,如CT/MIR的成像分析等。前一阵子CCTV中提到的"数字中国人"等,也是计算机在生物医学中的应用。

另外有一门学科叫生物信息学,又叫计算生物学,主要是处理生命学科越来越多的核酸、质谱等数据。简单一点的生物信息学可能更偏向统计学,更加深入一点的
则涉及到综合数据和计算分析来揭示生物学的分子机理。

生物信息学于上个世纪末兴起,现在已经有很多关于这个的教材,如果你感兴趣,可以去amazon等图书网站上搜索"bioinformatics"。另
外,NATURE, SCIENCE, PNAS, NAR等传统的生物学杂志上也有不少生物信息相关文献。还有不少专门的生物信息学杂志,如
BIOINFORMATICS, BMC BIOINFORMATICS, MOLECULAR SYSTEMS BIOLOGY等。

也许你注意到,上面提到了"SYSTEMS BIOLOGY"这个词。目前而言,很多生物实验还是仅限于局部的研究,比如对某一个蛋白、某一个基因的认
识,对全局的认识不够。这主要是当前实验技术手段的限制,而生物体又是一个复杂的系统。因此,如何综合已有的数据,从系统层面理解生物现象,提出一些可
能的理论模型,是生物信息学的任务之一。

Yang Ding提到的机器学习,也是生物信息学中常用的技术。不过就生物学家的视角而言,如果一批数据,使用简单的分析就能很好的说明问题,这比使
用复杂的模型更好。因为机器学习中总是不可避免的会遇到黑盒子、过拟合等问题。而且生物学家往往很难理解这些复杂的算法模型。为了算法模型而分析,却忽
略生物学意义,我个人觉得有点舍本逐末。

至于fang xu提到的生物学反作用与计算机科学,貌似前几年有一个"DNA 计算"的说法,但是对这个关注的不多,不知道现在发展的怎么样了。

darkside of darkstar

unread,
Dec 26, 2008, 9:12:40 AM12/26/08
to TopLanguage

呵呵。其实现在从不同角度进行结合的已经有不少方面了。
关于生物信息学,计算生物学来说,专著已经有不少了,现在相关的学术杂志,文章也有不少。
将计算机作为工具进行生物学的研究,已经不是新鲜事了。
至于说将生物学的进展应用到计算机方面,路还很长。
学界有利用生物分子特性进行计算的研究,但是离真正能应用还早得很。以前跟上交大一个女博士聊过,她是贺林组的,主要就是研究利用DNA的生物化学特性
求解特殊的数学问题的可行性。

fang xu

unread,
Dec 26, 2008, 9:56:29 AM12/26/08
to pon...@googlegroups.com

其实我的意思主要还是lz说的,"就如同当时牛顿在解决万有引力的问题时,自己引入了微积分的思想",事实上,就目前来看,为了生物学的应用,对计算机这门科学作的新的发展还很少见。

关于DNA计算,前些天听了一个stanford的人的报告,说能用DNA分子模拟与非门,可以求解简化的七桥问题等等。这个目前还不成气候,它相对电子计算机没有突出的优越性,而且"计算"需要的时间很长,有机化学反应的速度是无法逾越的障碍。

不过,个人感觉,神经科学领域的相关研究可能会给计算机科学带来某些革命性的影响,比如,人脑进行思维是高度并行化的,而图灵机模型很处理的问题只是串行的或是少数能串行化的并行计算。真正让机器实现人工智能应该还得学习人类智能的实现方式。

2008/12/26 Dao <zhou...@gmail.com>

Yang Ding

unread,
Dec 26, 2008, 12:11:32 PM12/26/08
to pon...@googlegroups.com
生物反作用于计算机的方面,首先生物的需要刺激了很多现有的计算机学科的发展 提出了不少新的问题 这方面包括MIT数学系的Bonnie
Berger,CMU的Eric Xing包括他的老板Richard Karp, Stanford的Daphne
Koller甚至传说中的Michael Jordan都有涉足生物信息的工作 有些是计算机技术在生物中的简单应用
有些则是生物问题反过来刺激计算机的研究 最近几年的ICML都有前面提到的这些组关于生物方面的工作
既然发表在计算机领域的会议上可见其主要贡献不止限于生物

至于前面提到的生物还没有新的思想贡献到计算机方面 我的理解是生物学其实现在没有什么"思想",也就是说现在没有严格意义上的理论生物学
原因很简单 生物目前还是一个靠观察和观测的学科 没有什么很好的理论能够代替生物学的观测 这种情况比较像哥白尼牛顿等人出现之前
要想知道行星的运转轨道 没有办法 只有靠观测 因为没有人能够很好的预测出行星的运作轨道 当然现在我们知道有牛顿三定律 一切都很好办
但是生物现象有没有这么简单精妙的理论在背后呢 目前没有人知道

对生物系统建立模型的复杂程度超出任何人想象
生物学家并不排斥数学家计算机科学家能够对生物学起到重大的作用,但问题是目前数学和计算机建模都达不到需要的程度
原因是实验生物学的发展远远早于计算机/数学在生物学中的应用 相关的很多实验技术已经很成熟了 生物学家并不只需要依赖于数学模型来研究问题
如果你的数学模型在精度上能够跟生物学观测象媲美 当然生物学家很感兴趣 如果你的数学模型只能对生物学家早就知道的东西进行些粗糙的模拟
那生物学家当然不会关心你在干什么 这就是计算生物学目前的尴尬:实验生物学家只关心数学/计算机能不能给他们带来新的进展
而对于他们来说最有用的部分可能只是一些统计分析数据挖掘等等的简单应用 另一方面 有很多生物数学家/计算机科学家
他们关心的是生物能不能给他们带来启发 所以他们建立模型 建立理论 但是他们的研究没有办法给真正的生物学家带来任何新的认识
所以基本上也就是他们在自娱自乐而已

就拿一个计算生物学里面的经典问题来举例 关于RNA/蛋白质折叠问题
包括物理系化学系计算机系数学系生物化学等等无数学科的专家已经在这个问题上研究了几十年 到目前还是没有非常理想的进展
目前效果最好的方法直观上来讲就是把已经知道的蛋白质结构拆成小片,然后遇到未知的结构就把这些小片凑上去成为一个完整的结构
从头基于能量模型的然后进行能量最小化的预测在精度上和前面的方法根本不是一个级别的
而且很难进行完善:对于很简单的能量模型已经证明要进行上述的预测都是NP-hard的 更不要说接近现实的能量模型了 而生物学家很现实
他们关心的不是哪个模型哪个理论看起来更精妙 他们也不会在乎计算机科学家的excuse说我的计算是NP-hard这不是我的错
他们关心的只是预测的结果

所以说要说生物要反作用于计算机 我觉得生物提出的最大挑战就是计算机科学有没有什么好的统一的方法来处理NP-hard,
NP-complete的问题 光靠针对每个不同问题提出一些heuristics我觉得很难让建模的方法在短时间内跟实验生物学竞争

Yang Ding

unread,
Dec 26, 2008, 12:41:10 PM12/26/08
to pon...@googlegroups.com
"其实我的意思主要还是lz说的,"就如同当时牛顿在解决万有引力的问题时,自己引入了微积分的思想",事实上,就目前来看,为了生物学的应用,对计算机这门科学作的新的发展还很少见。"

这个原因就像我刚刚说的 生物学有它自己的实验手段 他很多方面不需要依赖于计算机的发展 比如说我是一个生物学家 我现在要解决一个问题
那么我会看现在计算机领域有没有什么好的模型能够解释我的问题 如果it turns out that解决这个问题的计算复杂度是NP-hard的
那作为一个务实的生物学家我不会想办法去攻克P vs NP问题 我的解决方法应该是直接做实验去看问题的结果是怎样的
所以说为了生物学的应用给计算机科学提出问题 这样的情况是常见的 对计算机科学的现有技术做出改进 这也是可能的
但是要想让生物学家作出引进微积分那样的革命性改进 可能性是很小的 原因很简单 没必要
当然如果哪个天才没事顺手就解决了这种情况另当别论

至于你提到的DNA计算 这个领域算是synthetic biology, 其中Drew Endy/ Tom Knight等人是代表人物
这里有一个今年早些时候的讲座:
http://norfolk.cs.washington.edu/htbin-post/unrestricted/colloq/details.cgi?id=677
这个领域我的感觉是令人耳目一新 很有启发 但是真正能有多大的作用我觉得很难讲 或者说即使有作用可能更大的影响还是在生物的方面
像人工合成基因组,甚至将来自己设计基因组之类的 目前他们做些逻辑门之类的东西我的感觉也不是真正认真的想要取代现有的计算机
更多的是展示给别人看生物工程的技术:看 我还能用DNA/RNA/蛋白质干这个

神经科学我不了解就不多说什么了 我也同意这是一个真正可能对计算机科学家有启发的方向 但启发来自于研究对象的本身而不是研究方法


2008/12/26 fang xu <ust...@gmail.com>:

est

unread,
Dec 26, 2008, 10:00:35 PM12/26/08
to pon...@googlegroups.com
bioinformatics。现在很热的一个专业啊。前一整老是在reddit看到bioinfor的新闻。

2008/12/26 ewd <j56...@163.com>

realzhang

unread,
Dec 27, 2008, 4:14:38 AM12/27/08
to TopLanguage
如前者各位所言,计算机和生物学的学科特点的不同,是生物学很少反馈给计算机科学的一个原因。

另外,对于经常提到的“生物信息学是一个交叉学科”这个概念,我想应该这么理解更贴切:交叉指的是生物信息学利用了多种学科:物理、化学、数学、计算机
等学科的理论和工具,这多个学科交叉到生物信息学中,而不是指生物信息学与它们之间有交叉。

也就是说,两个学科之间的交叉是互相渗透的概念,而这里是多对一的另一种交叉。

Reply all
Reply to author
Forward
0 new messages