情境說明,自己玩的專案中需要建立NT資料庫並且需要經過資料清洗,像是將資料庫分成human和non human的fasta並將無taxon分類的sequences排除可怕的是目前的NT的序列數已達到9400萬條
策略是先遊歷一遍整個檔
2023-07-06