Pull request 與其自爽不如貢獻開源
前言
只要是軟體工程師這個領域內的職業都一定需要經營自己的side project
side project等於自己的職涯作品集,應徵時絕對會需要拿出來展示的項目
以前寫過一篇關於生物資訊工程師要經營side project可以往哪些方向
其中一個方向就是Pull request
只要是軟體工程師這個領域內的職業都一定需要經營自己的side project
side project等於自己的職涯作品集,應徵時絕對會需要拿出來展示的項目
以前寫過一篇關於生物資訊工程師要經營side project可以往哪些方向
其中一個方向就是Pull request
這篇文章是爲了自己要學習幾個Nextflow的重要功能而寫的
並寫一個程式實踐這些功能
Nextflow的基本概念會跳過不講
可以參考我之前寫的文章快速了解或是看官方文件
看這篇你能夠瞭解到以下的功能
情境說明,自己玩的專案中需要建立NT資料庫
並且需要經過資料清洗,像是將資料庫分成human和non human的fasta
並將無taxon分類的sequences排除
可怕的是目前的NT的序列數已達到9400萬條
策略是先遊歷一遍整個檔案
並記錄每個sequence的taxid及file offset (f.tell()
)儲存到dictionary
透過記錄的offset,使用f.seek()
快速到達指定的sequence位置,並依據taxid判斷是屬於human或non human的sequence分別寫入到兩個fasta
因此本篇測試有哪些key-value類型的資料結構可以快速索引fasta中seqid於檔案中位置
且符合時間成本、硬體資源等效益
這篇是成功案例,但每次更換電子零件都是場賭注
如果更換完按下開機鍵有不如預期的狀況真的很想死
先講結論,調整記憶體電壓就成功了,但要發現是電壓問題…
最近的一個新聞報導臺灣人常吃的蛤蜊原來是全新的物種
以前都一直以爲是1920年代引進到台灣的麗文蛤,經過水試所研究人員研究發現是不同於該物種的全新種
Makura的功能介紹可以看上一篇
{% post_link ‘2022/Makura安裝與使用 - 批量下載NCBI genomes’ %}
pip install makura==1.2.0
這篇介紹1.0.0到1.2.0之間增加的功能和修復的bug
更新docker之後容器都暫停並出現以下錯誤
docker-compose up -d
Starting hexo-app ... error
ERROR: for hexo-app Cannot start service app: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: unable to apply apparmor profile: apparmor failed to apply profile: write /proc/self/attr/apparmor/exec: no such file or directory: unknown
ERROR: for app Cannot start service app: failed to create shim task: OCI runtime create failed: runc create failed: unable to start container process: error during container init: unable to apply apparmor profile: apparmor failed to apply profile: write /proc/self/attr/apparmor/exec: no such file or directory: unknown
ERROR: Encountered errors while bringing up the project.
問題在於Docker version 23.0.1, build a5ee5b1
需要apparmor
所以只要作業系統沒有安裝就會報錯
研究雞的腸道菌相除了要做基礎研究外,大多是為了提升生長和生產表現以及減少對抗生素依賴
來看看近幾年的相關研究的菌相分析方法以及分析流程會使用到哪些工具
目的是要一次大量下載NCBI的assembly genome
Q:這種需求什麼時候會用上呢?
A: 生物資訊分析genomics或metageomics資料常會需要下載指定物種或是所有屬於微生物的genomes
最近從NCBI下載大量的genome fasta到硬碟的單一目錄下
到16000左右的時候就跳出類似下方的錯誤訊息
mv: cannot move ‘/soure/genome.fna.gz’ to ‘/dist/genome.fna.gz’: No space left on device