目錄

20200718 想法源起 20200719 我們在做什麼(一) 20200722 我們在做什麼(二) 20200725 竟然成為數學家(一) 20200729 竟然成為數學家(二) 20200801 竟然成為數學家(三) 20200805 不同職級(一) 20200808 不同職級(二) 20200812 趕客系列(一)為什麼讀大學? 20200815 趕客系列(二)不同大學學位跟工作的關係 20200819 趕客系列(三)大學的目的 20200822 趕客系列(四)大學為什麼要有主修 20200826 趕客系列(五)要挑選一個什麼樣的主修 20200829 沒有無緣無故的恨(一) 20200831 科普系列 - 數學與電影動畫製作(一) 20200902 沒有無緣無故的恨(二) 20200905 沒有無緣無故的恨(三) 20200907 科普系列 - 數學與電影動畫製作(二) 20200909 終身職位的評核 20200912 學術界吸引人的地方 20200914 科普系列 - 數學與電影動畫製作 (三) 20200916 學術界辛苦的地方(一) 20200919 學術界辛苦的地方(二) 20200921 科普系列 - 數學與電影動畫製作 (四) 20200923 大學的讀書成績有多重要 20200926 本科生研究機會 20200928 科普系列 - 數學與圖像修復(一) 20200930 用創新的方法去教育科學 20201003 參加研討會的重要 20201005 科普系列 - 數學與圖像修復(二) 20201007 教授與教學 20201010 研究是什麼(一) 20201012 科普系列 - 數學與圖像修復(三) 20201014 研究是什麼(二) 20201017 研究是什麼(三) 20201019 科普系列 - 數學與圖像修復(四) 20201021 如何閱讀研究論文 20201024 研究生應該修什麼課 20201026 科普系列 - 數學與圖像修復(五) 20201029 本科生的多主修多副修 20201102 科普系列 - 數學與數獨(一) 20201105 幾位教授(一) 20201109 科普系列 - 數學與數獨(二) 20201112 幾位教授(二) 20201116 科普系列 - 數學與數獨(三) 20201119 幾位教授(三) 20...

科普系列 - 數學與基因排序(二)


這個傳統的程序,就好像我們在自己手提電腦上跑程式一樣,只有一部電腦幫你做所有運算。在數學領域裏面,有很多問題如果只用一部普通電腦,可能需要花以年計的時間去運算,才可以得到一個測試結果。如果要加速這個過程,就有可能需要運用超級電腦(Super Computer)幫忙計算。所謂超級電腦,並不是這個電腦可以運行得「超級」快,而是由於電腦有非常多的處理器可以同一時間進行計算運作。用家需要編寫特定的程式,將計算工作盡量平均分給不同的處理器。如果有100個處理器同事運作,理論上一個很好的程式可以只用原來1%的時間就可以得到答案。當然要撰寫這些給超級電腦使用的程式,有時比較麻煩,也可能在實質運用上未能達到期待的加速效果。比較麻煩,是由於程式編寫員有時候需要想像一下如何要不同的處理器分工合作,將整個數學問題解決。這裏已經有非常多的研究去將不同的數值方法進行平行化(Parallelize)去給超級電腦使用。另外一個問題,是由於不同處理器還是需要溝通將計算出來的答案互相使用,所以實質運用上很多時候不一定可以「事倍功半」(花多了一倍的處理器的數目,就可以用少一半的時間)。


返回剛剛DNA排序討論,如果我們想將這個過程加快,一個方式就是希望有一個「超級排序」的方式,可以將一整條DNA分成不同部份及不同儀器進行排序。這個想法,在國際人類基因組計劃裏面亦有出現。計劃裏面,將DNA分成很多不同部份,不同研究組織就會用自己的儀器將分到的DNA部份進行排序過程。當所有的實驗室將這個過程做完,人類基因圖譜亦都大功告成。那現今的DNA排序是如何執行的呢?在坊間經常聽到一些個人的DNA排序,好像不需要全球20多個實驗室幫我們做測試。那如何將15年的時間,縮短成現在所需要的數天呢?


想法其實也差不多。原理是我們將DNA分割成很多不同小段,然後將每一小段發送到不同的儀器同一時間進行排序。仔細執行時可能會有很多不一樣的方法,但這些不同的方法都歸納成稱為次世代定序Next Generation Sequencing (NGS)。這裏有一個問題,在生物課程裏面可能沒有指出過。而且,就算同學是生物科專業,也不一定知道如何把這個問題解決。對,每一小段我們都有方法將它準確地排序出來。可是,過程裏面,我們將一整組DNA隨機分割成很多不同長度的小段,然後又隨機地將這些不同小段依附到晶片(Flow Cell)上面進行複製,最後才將這些小段進行排序。這些基因小段長度不同,放置的位置有沒有特定的次序,我們是如何可以將它們組合回一條完整的DNA排序呢?


留言