|
家好,我是飛哥。 數(shù)據(jù)分析界育種知識最好、育種界編程最扎實、段子講得最好的數(shù)據(jù)分析師,所以:編程+數(shù)據(jù)分析+育種,就是我的日常工作了。 電腦是研究生時學習的編程,之前沒有接觸過,計算機登記證書是一個沒有,生物統(tǒng)計當年差點沒及格,高數(shù)和線代還可以但是基本忘完了。就這樣,經(jīng)過金山打字半個月的訓練,學會了盲打,研究生三年還是入門了生物信息的大門。 看一下我研究生的日常:(玉米地授粉往事序),數(shù)據(jù)分析+大田育種,實驗是不可能做的,去實驗室就是幫助大家裝槍頭。
上面這張照片是2015年元旦,海南玉米育種基地剛澆過水,那時上午已經(jīng)有花粉散粉,二話不說,赤腳下地授粉。中間小李師傅幫我照相,因為我要發(fā)朋友圈紀念一下,還賦詩如下:“15有啥了不起,空間更新多如蟻,看我玉米地授粉,風和日麗元旦里”。那時的我,還未畢業(yè),對未來充滿憧憬,活力四射。 工作幾年,邊工作邊學習,哪里不會學哪里,也積累了一些知識,接觸的物種中有:玉米小麥水稻、豬雞牛羊、林木水產(chǎn),用到的模型從方差分析到線性模型,從混線模型到廣義模型,從GWAS到GS,基本都是R語言+Python+Linux。 有些小伙伴,問我如何入門數(shù)據(jù)分析? 我的經(jīng)驗是,學習,從來不拘泥于形式,植物的不看動物的書籍?動物的不看林木的論文?林木的不理水產(chǎn)的成果,對我而言不存在的,因為物種是屬于應(yīng)用層,背后模型是類似的,學此可以懂彼。比如,學習GWAS我發(fā)現(xiàn)人類的知識更系統(tǒng),于是學起來諸如多基因得分、孟德爾隨機化也毫無違和感(統(tǒng)計遺傳學:第八章,基因型數(shù)據(jù)質(zhì)控)。 其實網(wǎng)絡(luò)上的數(shù)據(jù)分析師都是從Excel到Python,然后到機器學習。而農(nóng)業(yè)這一塊,混合線性模型是繞不過去的檻,所以這里總結(jié)一下我的技能。 算不上技能樹,只能算是花花草草: 1, 生物統(tǒng)計相關(guān)數(shù)據(jù)分析匯總統(tǒng)計分析
方差分析
回歸分析
相關(guān)性分析及通徑分析
主成分分析及聚類分析
混合線性模型
2, 作物數(shù)據(jù)分析
3, 動物、水產(chǎn)數(shù)據(jù)分析
4,群體遺傳分析
5,GWAS分析和QTL定位
6,基因組選擇分析
|
|
|
來自: 育種數(shù)據(jù)分析 > 《待分類》