阅读经典:微生物学中的开创性论文

听说最近新型冠状病毒(SARS-CoV-2)已经成功横渡英吉利海峡,从伦敦的希思罗机场入境,在英国蔓延开来。虽然现在欧洲的新冠肺炎(COVID-19)疫情并不在许多传染病模型的预测之外,但是当病毒终于从遥远的祖国来到自己身边的时候,还是能感受到全球化时代“地球村”的紧密。为了不给祖国人民添乱,我就准备坚守伦敦,拒病毒于家门之外——有种快要打仗的感觉呢!取消了周末出游的行程,尽量选择在人少的时候错峰出行,准备了一些解表的感冒药(如果自己被感染了,大概率会是像重感冒一样的表现吧)和能吃两周的食物(以防被要求在家隔离的情况),不参加非必须的聚会,多走路少乘公交,多吃水果,早睡早起,勤洗手——在保护自己的同时,也算是主动减轻社会防疫的压力吧。1 据说现在一个人的智商等于100减去家里卫生纸卷的数量,我自然是不敢屯卫生纸的。周末宅在家里,晒着难得的初春暖阳,正好可以读书写文。

SRST2-ARGannot抗药性基因数据库之深度解析

在细菌基因组流行病学(genomic epidemiology)领域,SRST2是一个通过细菌全基因组测序读片段(reads)和参考基因数据库来快速检测目标基因的软件1。SRST2-ARGannot是一个由Kathryn Holt实验室创建并维护、符合SRST2输入格式的ARG-ANNOT数据库。目前最新的版本是r3(revision 3,ARGannot_r3.fasta)。我作为SRST2-ARGannot r2版本的整理者[r3版本仅在r2基础上增加了抗粘菌素(colistin)的数个msr基因],在长期使用SRST2的过程中积累了丰富的经验。在此,我对SRST2-ARGannot数据库作一个深入解析,希望能够对从事相关分析的读者有所帮助。

Python避坑指南

在生物信息学领域,Python是最常用的编程语言之一,具有语法简洁、可读性好、模块丰富、以及编程社区活跃等优点。不过,因为它语句灵活和程序包庞大,即使是有一定经验的程序员,在应用中也可能会遇到一些问题。在本文中,我分享一些平时为了数据分析,在Xubuntu上作为系统管理员配置和使用Python的经验,希望能够对读者有所帮助。以后我会逐渐增加内容。

Linux避坑指南

在运行了一个多月后,我终于把VirtualBox上的Xubuntu之车开到沟里去了。事情的起因是原有的VDI硬盘被写满(12 GB),在使用vboxmanage modifymedium disk bioinformatics.vdi --resize 32768 命令扩容后,出现输入正确的密码后,无法登录(闪退)的问题。通过root用户名登录进系统后,发现sudo用户home文件夹下很多文件和子文件夹的所有者变成了root(从而无法在启动时被其他用户访问)。运行ldconfig命令并删除了其他用户的.Xauthority文件后,其他用户可以登录,却发现Xubuntu桌面环境出现了这样那样的异常,可能依然是那些变成了root所有的用户文件导致的。几经修理,却是解决了一个问题,又出现了新的问题,最后连Xubuntu和Gnome桌面环境都全部丢失(只剩下Xfce桌面),而且网络适配器也不再工作。如此这般,再修下去毫无益处,不如重装。幸好这个系统只是用来测试软件的,并没有存放任何重要文件。这次经历,让我体会到了那种”生小病住院,这治那治,病却越治越多,最后不治身亡“的无奈。以本篇博文,记录下这段时间使用Linux的四点心得。

我们为什么要重视中文科学交流

据十月十八日《浙江大学》微博报道,中国第一本关于传染性微生物和传染病的英文学术期刊《Infectious Microbes & Diseases》于上月正式创刊。在为中国新增一份具有国际影响力的学术期刊而欣喜的同时,我又感到一丝遗憾:虽然毫不意外,但为什么又是英语期刊呢?中文科技期刊,在今天还有多少影响力呢?

在VirtualBox虚拟机上调整Xubuntu系统的屏幕分辩率

Linux操作系统因为其免费、开源、以及强大的命令行界面,广泛应用于生物信息学和计算生物学领域。一直以来,我都是通过在VirtualBox虚拟机上运行Xubuntu的方式,为Linux环境下的应用程序搭建开发和测试平台。与ubuntu标准版相比,对配置要求很低的Xubuntu能够保证在个人电脑上流畅运行,是很适合个人学习、演示、与一般应用场景的操作系统。但是,在虚拟机上安装Xubuntu后,用户通常遇到的第一个运行困难就是初始屏幕分别率太低的问题——显然,800×600的分辨率在今天高清屏流行的时代,已经难以使用。要解决这个问题,只需要三个步骤。

常用细菌基因组生物信息分析软件

进入二十一世纪以来,全基因组测序(whole-genome sequencing,WGS)技术的发展为微生物学和流行病学研究带来了革命性变化。同时,全基因组数据与计算生物学的结合也开创了基因组流行病学(genomic epidemiology)这一全新研究领域。作为获取基因组信息的途径和解答生物学问题的基础,生物信息学软件得到了人们的高度重视。每年都会有大量的优秀软件被开发出来,同时,既有软件的升级维护也推动了行业发展。在本文中,我概述面向微生物基因组的一些前沿且应用广泛的生物信息软件,并且会长期保持更新。对已经在生物信息学领域耳熟能详的那些经典软件(比如BLAST,BWA,Bowtie和PLINK等),本文不再赘述。

系统演化树重建的贝叶斯方法:基本原理

在分子系统演化学(molecular phylogenetics)领域,贝叶斯系统演化学(Bayesian phylogenetics)是在20世纪90年代末,借助于计算机技术和算法的进步而发展起来,并且得到广泛应用的一种方法论1。在此,我对该方法的基本原理做一个简明扼要的总结。作为初学者,本文难免存在谬误,欢迎读者指正。对系统生成树重建感兴趣的读者,不妨阅读文末的参考文献。

初探川渝地区页岩及砂岩层间沉积物斑纹状分布的起源

在我的家乡,山城重庆,自然出露了大量沉积岩——页岩和砂岩。这些沉积岩又分为两大类。第一类是形成于中生代的紫色泥页岩和砂岩。当时的四川盆地,是一个大型内陆湖。第二类沉积岩则是形成于新生代的浅色砂岩和页岩,源自长江水系的沉积物。在重庆进行地质考察,很容易在裸露的山体侧面见到第二类沉积岩叠压在第一类之上。而在它们下方,则是由古生代海洋的生物碎屑形成的石灰岩。

从小时候起,我就很喜欢翻看那些来自新生代时期的浅色沉积岩。一页页地剥开,在层与层之间便会露出斑驳的纹理,颜色从红褐色到黑色不等。它们是有机物的痕迹。可惜在其中并没有发现肉眼可以分辨的动植物化石。至于为什么它们会呈现出圆形如菌落一般的样子,我并不清楚,只是猜想这或许是化学物质浓缩的结果。

科研合作中的一些感想

在这篇文章里,我分享一些由自己的经历以及耳闻目见的事情所引发的感想,主要侧重于科研合作中的一些问题。以后会慢慢添加新的感想。本文不针对任何人,请读者不要对号入座。