Nextflow平行與合併處理
前言
這篇文章是爲了自己要學習幾個Nextflow的重要功能而寫的
並寫一個程式實踐這些功能
Nextflow的基本概念會跳過不講
可以參考我之前寫的文章快速了解或是看官方文件
看這篇你能夠瞭解到以下的功能
- 平行與合併處理檔案
- 運算資源分配
- 輸出結果至指定目錄
共 12 篇文章
這篇文章是爲了自己要學習幾個Nextflow的重要功能而寫的
並寫一個程式實踐這些功能
Nextflow的基本概念會跳過不講
可以參考我之前寫的文章快速了解或是看官方文件
看這篇你能夠瞭解到以下的功能
如果要做對應徵生物資訊職缺有幫助的 side project
我認為有幾個方向可以考慮
台灣目前(2022)最多的工作機會是基因體定序與分析,在 104 上隨時都可以看到,
應用領域其實就是精準醫療跟微生物研究。
至於商業市場沒這麼大的醫療影像、生物統計、質譜分析、抗體設計等工作機會就是可遇不可求了
專案中的python package我是用poetry管理
好處是可以分開開發時才使用的套件跟程式執行時依賴的套件
移除不用的套件時還可以確認依賴套件的依賴套件也全部被移除了
這點是pip做不到的,他只會移除你指定的套件
這文章寫的很詳細如何使用poetry
雖然其他如virtualenv和pyvenv也可以建立python虛擬環境
但也是無法完全地管理依賴套件版本
以我這次寫的專案Juno
為例,這個專案目錄下的結構如下
.
├── Dockerfile
├── juno
│ ├── cli.py
│ ├── config.py
│ ├── data
│ ├── data.py
│ ├── __init__.py
│ ├── simulator.py
│ ├── tools
│ └── web.py
├── LICENSE
├── pyproject.toml
├── README.md
└── setup.py
農學院或生科相關應該都能參考這篇文章啦,畢竟都是生科領域
工作一年多後對於台灣的生物資訊職涯分享
前幾天聚會的時候聊到各自的工作內容時
居然大家都不太理解我在做什麼
讓我感到很難過
明明生物資訊就已經算是顯學了
但有一點可能是我介紹的太艱深了
或許就說的簡單一點就好
Complete, closed bacterial genomes from microbiomes using nanopore sequencing
Microbial genomes can be assembled from short-read sequencing data, but the assembly contiguity of these metagenome-assembled genomes is constrained by repeat elements. Correct assignment of genomic positions of repeats is crucial for understanding the effect of genome structure on genome function.
畢業後有位學弟傳了mail詢問一些生資的規劃,之後應該會愈來愈多人投入生資,所以就把他的問題跟我的經驗分享出來ㄅ
這是我在應徵生物資訊相關工作的記錄,所以寫得很隨興,想到甚麼就寫進去,分享給大家看看而已。