2021動物科學系的生物資訊職涯發展


農學院或生科相關應該都能參考這篇文章啦,畢竟都是生科領域
工作一年多後對於台灣的生物資訊職涯分享

目前的工作

公司資訊

  • 名稱: 益農有限公司
  • 簡介: 運用遺傳基因體資料分析、生物統計、生物大數據、深度學習等技術,致力為全球的農漁畜,食品與環工業者提供專案顧問服務,以改善糧食生產與環境汙染問題,並協助產業達到永續發展之目標。

工作內容

簡單說我們公司賣的是分析服務,所以會將資料分析包裝成產品

舉例,動物腸道菌相檢測這項產品,商業模式是客戶提供動物糞便樣本,我們送去定序公司定序,

送回來的數據進行分析後彙整成報告形式給客戶,告訴他的樣本中含有哪些微生物物種、各自的比例

進行分析這環節就是我負責的,資料分析可分成兩種性質

建立資料分析流程

產品部門會跟我說想要得到的分析項目,像是要可以知道微生物種還有他們比例

那我就會前處理資料、整合程式,建立分析流程

以這例子來說流程大概是 reads 品質篩選 -> 組裝成 contigs -> 分類物種 -> 計算比例

開發演算法

建立分析流程不難,難的是如何讓它更精準,每個環節都有改善空間

很多公司只做到建立分析流程,但要很少真正去研發更精準的方法 (吃力不討好)

以公司角度,要研發就得要花費龐大資源,可能還沒辦法回收成本

客戶則是不知道原來有很多演算法可以用來分析資料,如果他知道就可以自己做了

像是很多程式都可以幫你分類物種,都可以達到<樣本含有哪些物種>這目的

但每種方法得到的結果都會不相同,哪種才是最準確的卻很少探究

要改善有兩種方法,等待別人開發出更精準的演算法,另外一種就是自己開發

不用想也知道哪一種是我應該選擇的,但也是需要謹慎選題的

就跟做研究一樣,選一個天方夜譚的只是讓自己挫折和浪費公司資源

但怎樣算天方夜譚也不好說,可能只是自己能力不足或是沒站在巨人肩上

台灣有哪些生資工作

先說台灣有做生物資訊的公司大多服務對象都是生醫領域,畢竟市場需求最大
寫這篇文章時間是 2021/11,我就找一些 104 上的職缺介紹吧

基因體分析

目前生物資訊在台灣大多有九成(體感)在做基因體分析,包含 TGS, NGS, RNA-seq, single cell 等…

威健股份有限公司

  • 職稱: 生物資訊分析專員
  • 工作內容: NGS application 實驗數據分析、相關應用平台建置、程式設計與操作自動化、分析報告撰寫、案件討論等等

行動基因生技股份有限公司

  • 職稱: 生物資訊工程師/助理工程師
  • 工作內容: 開發癌症基因檢測相關 NGS panel 的生物資訊分析方法,制定產品標準,建立 bioinformatics analysis pipeline、利用 NGS data,結合生物資訊及統計方法,開發 cancer biomarker 相關的演算法、跟產品開發部的實驗室同事合作,提供產品開發實驗設計及分析上的協助、協助撰寫技術文件

醫學影像分析

分析醫學相關影像,如 X 光片、心電圖、超音波影像、電腦斷層掃描,判斷生理狀況

昱星生物科技股份有限公司

  • 職稱: AI 影像分析工程師
  • 工作內容: 生醫影像處理與訊號處理程式開發、Python 與 OpenCV、深度學習 Framework

中國醫藥大學附設醫院 人工智慧醫學診斷中心

  • 職稱: 演算法開發工程師(生物資訊)
  • 工作內容: 電腦視覺技術原理與開發及醫學影像應用、生物醫學訊號處理之演算法開發及驗證 、NLP 自然語言處理、生物資訊等基因序列比對、辨識等精準醫學模型開發

生物統計

算是生物資訊的其中一個領域,主要也是在生醫相關的公司或醫院裡的統計部門
不過跟藥廠掛鉤或是老公司大概還是迷戀 SAS 吧

富禾生醫股份有限公司

  • 職稱: 生物統計資料分析師
  • 工作內容: 進行大型資料建立,清理,串聯、參與研究討論與協助研究設計,並協助論文之統計結果確認、數據分析、資料視覺化、說明分析結果、提出建議及後續成效評估

有沒有跟動科系比較相關的生資工作

有,但台灣少到可以說是沒有

我們公司服務對象包含畜牧業,目前多是分析動物腸道菌相或是畜牧廢水中的微生物

也是因為這樣,我才很開心能在這家公司工作,因為他是在台灣我看到唯一跟我的本科系還有點關聯的又跟我興趣符合的工作了…

上述屬於基因體分析的範疇,另一個我看到的是物聯網 (IoT )

應用在環境監控、動物生理監控、各種自動化,但這不太需要動科背景,只需要理工背景就可以達成

宇瞻科技 - 養雞場智慧系統化環境監控
國立臺灣大學 - 乳牛熱緊迫健康監測智慧化管理系統研發

嚴格來說是現階段沒有看到需要畜牧背景人才的商業發展,如果有公司以這些監控數據進一步分析,建立預測模型才有

不過至少看我們系上已經有在研究了

應用商業頸部感測器分析荷蘭牛行為與健康狀態及泌乳表現之關聯性

舉例說,蒐集乳牛生理數值、環境數值,判斷健康狀況、產乳量等,很多應用其實都是可以想像的到

The role of sensors, big data and machine learning in modern animal farming

這篇 review 敘述的智慧化牧場經營管理在技術層面是可以達成的,但我想台灣的畜牧業人士應該比我更了解困難之處

相較於畜牧業,農藝領域智慧化的發展看起來比較成熟,但可能也是植物不會動,要監控數據或是智慧化相較容易,動物不只環境要監控還要動物本身

農業科技決策資訊平台 - 農業智慧化之後的挑戰-數據分析

如果有興趣,起手式呢?

程式語言選擇

無可避免就是要學會程式語言,至於要學哪種這問題太老生常談了
沒特別迷戀就從Python開始吧,進可攻退可守
學一陣之後有其他需求在學其它語言也不遲,而且學會程式語言的心法後
學其它語言的門檻也會大幅降低

Linux

這也是無可避免,即使你會用 Mac 也是
我的方式就是常用的電腦直接裝 Ubuntu,讓他成為我生活的一部份
而不是要學的時候才開來使用

其他

生物統計、網路技術、docker、MySQL、machine learning、deep learning、Git 等等等等技術就看何時你需要再學吧
如果還是學生,學校又有開相關課程那就修吧
出社會的話就不用去想要去買啥線上課程還是系統化學習
直接目的導向學習會是最快速的
我自己在下班之餘都會想一些自己覺得有趣的任務給自己
有在以 side project 的形式寫程式的話自然就會學 git 然後就會熟練了
之後想要快速佈署環境就會去學 docker
寫的程式有需要使用到資料庫管理就會去學 MySQL
一切都是自然而然的,不需要想說現在好像哪種比較熱門那我去學學
有興趣的話這些事情都會是順其自然的
除非有其他動力(賺錢?)強力推動你

給你一個任務

如果不知道現在要做啥計劃的話,就建議一個任務給你吧
既然現在基因體分析這麼夯,那就學會一些程式語言的皮毛後建立一套自己的分析流程吧
dataset 就從 NCBI 的 SRA 資料庫下載,自願者會上傳物種的定序數據到這資料庫,可以選擇是以 Illumina, Nanopore 還是 Pacbio 定序的數據
其實資料都是 reads (fastq 檔),只是適合的演算法不同罷了

可以偷參考圖爾思的分析服務流程

圖爾思 - 細菌基因體定序 Bacterial Genome Sequencing (Assembly)

相關文章:


Author: Hung-Lin, Chen
Reprint policy: All articles in this blog are used except for special statements CC BY 4.0 reprint policy. If reproduced, please indicate source Hung-Lin, Chen !
  TOC