|
|

楼主 |
发表于 2023-8-9 05:40:19
|
显示全部楼层
本帖最后由 avigan 于 2023-8-9 05:46 编辑
这几天在看以前的实验数据,一晃三年多了,当初因为对方提供的分析结果与我自己分析出来的出入很大,于是就搁置了。 对方说alignment匹配率有95%,而我这边出来的超低匹配率让我很懵。匹配用的工具不一样,虽然通常匹配率是相差无几的,这几天翻出看,决定用对方提到的star匹配看一下。
star工作流开发极为顺利,工具太好用了,全部资源程序设置,加上运行,不到半天完成了。一看结果,居然跟对方提供给我的很接近,这还真是喜忧参半,让人迷惑。之前的工作流也是被证明稳定工作的,按照多项评测,star和hisat2出来的匹配率是差不多的,何以我这边结果差别巨大,难道我的实验数据是有某种奇特的性质?打开数据看,看不出什么端倪,这让我陷入了冥思苦想,我怀疑我之前的匹配出了问题,命令行和流程都没问题,最后怀疑到引用的索引文件。那些索引是下载的,之前也是多次使用没问题的。下载参考基因组自己做了个索引,然后重新运行工作流,神奇的事情发生了,这次出来的结果与star相当接近。这还真是喜忧参半,喜的是数据没问题,90+的匹配率相当可以,之前以为又白花了一堆大洋,结果并不是;忧的是从来不动的索引文件居然莫名其妙不行了,这也太烧脑了。不过总的说来,还是个大好消息,数据可靠,只要数据可靠,分析就不是问题。虽然别人有个结果给,分析还是要自己做好些,不然怕丢人都不知道咋丢的,加上我的龟毛性格,经常多种方法多种工具多方论证,不怕没结果,就怕丢人。
今天又看了这批数据。我嫌前几天制作的索引用的是老版本genome,于是打算做个新版本的索引。做索引只用一个命令行,按说很简单,前次做索引就只用了一小会儿。脚本很简单,但找了一下好像已经被我删除了,烦人,又写了一遍。神奇的事情又出现了,运行错误,说找不到输入文件,于是我陷入了对输入文件的迷茫中。文件路径查了n遍,用各种方法查了,绝对没问题;查询文件属性,可读可写可执行;用各种工具打开查看编辑,一切正常。折腾了一个多小时,怀疑程序或者系统出错了,这就要动大刀了…… 在动大刀之前,我又苦思冥想了一下,何以前天行云流水忽然就不行了呢?最后看了一遍命令行,我去,bash的脚本,为了省点空间,跟R的写在一个文档里,然后混合编程的恶果出来了,语法的细微差别被忽略了。R给变量赋值后直接用,bash要加一个引用符才能用,写R写顺溜了就把bash命令行里面输入文件路径的引用符给忘了。而且结合结合上下文的R命令行看,还特顺溜,愣没看出来,所幸在打算给系统动大刀前忽然顿悟了。日常用Matlab做模型,R做分析,python开发程序,bash写脚本,各种语法混起来用那个酸爽。。。
发现我现在经常倒灶,比如浴室漏水了,钥匙圈掉下水道了,肉骨头倒进马桶堵塞了……五花八门,各种花样,但是结果基本是有惊无险,浴室漏水外面管道修了一下好了,钥匙圈取出来啥都没坏,U盘照跑,肉骨头用通马桶的掏了几下就掉下去了……,这个日子真是有滋有味,嘎嘎嘎。
|
|