随着DNA微阵列技术的完善和在生命科学研究中的广泛应用,产生了大量的基因表达数据,这些数据中蕴含着大量的信息,如基因调控规律的信息,不同条件下表达差异的信息等等,利用这些信息可以进行基因启动子区域顺式调控元件的研究、基因表达调节途径或网络的研究、疾病或药物作用特异表达谱的研究等等。数据的增多直接带来的两个问题是数据的管理和知识发现。数据的管理主要通过建立数据库的方式,目前已由较大的数据库服务器,这些数据间的共享和再利用迫切需要建立某种标准,从而提高利用效率,MIAME和MAGE-ML在这方面作了有益的尝试,有望成为一种规范。知识发现是从海量的数据中获取有生物学意义的信息,并形成新的生物学知识。在这方面的研究还处于初始阶段,最常采用的是统计学方法,如聚类分析、SAM等,但发展速度很快,目前已有大量的研究论文和分析软件。 目前,DNA微阵列尚属一个正在蓬勃发展中的年轻领域,这一方面虽然有不少科研工作成果,但总体上还远远不够,有不少因素阻碍了数据的分析和管理的发展,需要相关的工作人员进一步的努力,本文若有不足之处,还望指正。 (责任编辑:laiquliu) |