给从事生物信息学分析者的一些建议

十一月 18, 2014 个人感悟, 杂记, 生物信息 por DeanGao

前言

一个良好的工作习惯在任何情况下对提高工资效率来说都是很重要的,具体到生物信息学研究中,小到你的工具使用习惯,大到思维方式习惯都在某种程度上决定着你的工作效率。养成一个好的习惯加以时间的堆积,想不把工作做好不出成果都难。当然这一切都取决于你的态度——态度决定一切,取决于你有没有想把事情做好做完美的心。

一、工欲善其事,必先利其器

在做数据分析相关的工作时,在各个方面总是有些软件工具可以用来提高效率,更好的进行规划,更好的来进行团队合作。下面列举些常用的实用工具:

1.1 笔记应用

好记性不如个烂笔头,的确是这个道理。以前可能倡导的是大家要养成做手写笔记的习惯,现在有些工作不用去费时费力的写手写笔记了,可以用些优秀的笔记本应用(PKM:Personal Knowledge Manager)来构建个人知识库。主要的特点就是——格式化编辑、笔记标签、分门别类、协调合作及云端存储。
幻灯片1_副本
  • 印象笔记/Evernote (国外用的比较多)
  • OneNote(微软的)
  • 为知笔记 (国内的)
  • 有道云笔记(国内的)

1.2 文献管理应用

管理好文献很重要,尤其是在前期关于某一研究领域的知识积累和后期的文章写作。
幻灯片4_副本
  • Endnote(很优秀的文献管理工具,里面的好多功能你可能还没发现)

1.3 网盘应用

上面的笔记应用可以记录一些笔记类的东西(主要是文本,也可以插入一些图片、视频等多媒体),比较方便的是可以很好的进行分类,并对每个笔记赋予多个标签,方便笔记搜索等。相对于笔记应用,网盘应用就能在另一方面来提高我们的工作效率——文件存储,这可以弥补上述笔记应用的不足。
幻灯片2_副本
  • dropbox(国外用的比较多,国内现在访问受限)
  • box(企业级网盘)
  • Google Driver
  • OneDrive
  • 金山快盘
  • 360云盘
  • 百度云盘

1.4 文本编辑应用

总少不了和文本数据打交道,如果你还在用记事本、写字板来浏览和编辑Windows下的一些文本文件(脚本、数据),那么你就out了,这些应用都不能很好的格式化的显示你的脚本和数据,必须拥有自己使用起来比较顺手的文本编辑应用。
幻灯片3_副本
  • EditPlus
  • Notepad++
  • UltraEdit

1.5 用几款好的浏览器

这里不说浏览器的好坏,只要符合自己的习惯,的确能够提高自己的工作效率,那就行了,这里不得不提下浏览器的书签管理器,好多人都是没有创建浏览器的使用账号,所以浏览器的书签都是保存在本机上,一旦电脑坏了或者重装系统了,之前存的有用的书签可能都会丢失。所以养成分明别类的存储书签,注册浏览器账号,把书签存储在云端很重要。这里最好选择一款比较好用的浏览器,一直使用下去。
幻灯片5_副本
  • Chrome(使用率很好的浏览器,注册Google的账号就行,国内使用不方便问题是可以解决的)
  • Firefox(也是比较好的,同样可以申请帐号的)
  • 360浏览器(不推荐使用,很low)
  • 搜狗浏览器(说是速度很快,双核)

1.6 好用的邮件工具

做科研总少不了收发邮件,首先拥有一个正式点的邮箱是很重要的(学校的邮箱,gmail邮箱等),想想如果用QQ邮箱跟一个文章的大牛发邮件讨论问题,你觉得这样很合适吗?所以有一个正式的邮箱和使用合适的邮件工具很重要。
幻灯片6_副本
  • Outlook(微软的这款office应用还是很好的,可能是在安装office的时候我们都不怎么去安装它)
  • Foxmail(国内特别优秀的邮件工具,使用起来也很方便)
  • Mozilla Thunderbird(国外的一款优秀的邮件工具)

1.7 图片应用

平时也少不了处理一些图片,最基本的几个工具还是要掌握的。
幻灯片9_副本
  • PowerPoint(PPT,用途其实很强大,在拼图等操作中)
  • Adobe Photoshop/illustrator(专业的)
  • 美图秀秀(如果要求不是那么专业,基本的操作也是可以胜任的,不仅仅是美图自拍!!!)

1.8 强大的终端模拟软件

跟远程的服务器打交道少不了一些终端操作,Linux、Mac下自带终端软件(使用起来也不是很方便,书签管理也不是很好),推荐几款不错的终端模拟软件。
幻灯片7_副本
  • Xshell(强大的安全终端模拟软件,支持各种协议)
  • SecureCRT(同样功能强大的终端模拟软件)
  • Putty(小巧易用)

1.9 集成开发工具(IDE-Integrated Development Environment)

做一些IT开发,或者生物信息学中的一些编程工作,总少不了用到一些工具,这里举几个例子,像经常使用的Perl、Python、R等。
幻灯片8_副本
  • Eclipse(这是基于Java的一款IDE,可以安装一些常用插件:Perl、Python、PHP等)
  • RStudio(本地做R开发的利器,有很好的代码美化、项目管理功能,Rgui 弱爆了!)
  • Vim/Emacs(在Linux终端中使用的比较多的编辑工具,也有些对应的windows版,刚开始不习惯,用多了就会喜欢上的,同样也可以安装很多插件)

二、行为习惯

2.1 做好分类工作

曾经有人说“用一句话概括这个世界——这个世界就是由分类来组成的”。我们想想——男的-女的、老的-少的、高的-矮的、DNA-RNA-Protein、第一个样本-第二个样本等等。试想下杂乱无章的工作习惯怎么会有高效率呢。所以在分析数据的时候对原始数据进行好的分类,对结果进行好的分类,这样能够提高我们的工作效率,具体几点:
  • 在Linux服务器上,尽量将不能类别的数据放在不同的文件夹下,并逐级分类,这样清晰的组织目录能够很好地提高工作效率,节省无用的时间消耗。
  • Endnote文献组、浏览器书签、笔记目录、网盘内容等同样要做好分类。

2.2 好的命名习惯

一个好的文件命名是既能很好的表示文件的内容又能简洁明了。试想下你弄个1.fa 2.fa除了你当时还记得表示的是什么意思,别人看了怎么知道是什么意思呢,可能隔了几点你自己都不知道是什么意思。所以平时不要图简单图方便,而不考虑后续的分析和不站着别人的角度来思考。
  • 数据文件的命名要简明扼要(不冗长也不要太简单)
  • 脚本的命名要表示脚本的意图(符合一定的习惯,每个单词首字母都大写等习惯)

2.3 做好笔记记录

在做生物信息学分析过程中,有时不只是自己一个人的事,可能你做的东西会返工也有可能是会给别人看的。所以及时的做好分析流程的记录是很重要的。
  • 不要因为简单而不去记录(有时候可能就是这个简单的操作导致分析的错误,而你又恰好没记录,那就找不到错误的所在)
  • 记录时应该有个好的逻辑条理(不要简单的放句命令在那,应该记录下命令的目的)
  • 记录时应该按照一定的规范(使得笔记整洁明了,内容丰富)

2.4 好的学习习惯

在学习一个新的东西时,不要一开始什么东西都去请教别人,一定要是自己先思考,自己对知识有一个了解(哪怕不深入),再不懂的地方去请教别人,这样对别人是一种尊重也是自己加强记忆的方法。

三、思维方式

这里提到思维方式,是因为好多人可能也是在做些东西,别人怎么做,他也怎么做,可是不知道为什么该这么做,或者也不懂大体的思路,就是那样稀里糊涂的做着。这就需要在遇到问题时怎么去分析问题,解决问题。所以在这里就建议,在碰到一个新的领域或者新的任务时,首先要做的事情是对相关的背景知识有个大体的了解,知道一些常规的处理流程,再进而慢慢的细化,到最后对这个问题心里已经有了一个比较清晰的解决思路了,这时最好用笔记记录下来。
  • 做足前期准备(弄清楚问题是什么)
  • 清晰的思路(怎么一步步解决问题)

728915243186942831_副本

原创文章,转载请注明: 转载自rabbit gao's blog
本文链接地址: 给从事生物信息学分析者的一些建议