真人一对一直播,chinese极品人妻videos,青草社区,亚洲影院丰满少妇中文字幕无码

0
首頁 精品范文 生物信息學

生物信息學

時間:2023-05-29 18:03:03

開篇:寫作不僅是一種記錄,更是一種創造,它讓我們能夠捕捉那些稍縱即逝的靈感,將它們永久地定格在紙上。下面是小編精心整理的12篇生物信息學,希望這些內容能成為您創作過程中的良師益友,陪伴您不斷探索和進步。

第1篇

關鍵詞:推薦系統;生物信息學

推薦系統(RecommenderSystem)[1]是個性化信息服務的主要技術之一,它實現的是“信息找人,按需服務”;通過對用戶信息需要、興趣愛好和訪問歷史等的收集分析,建立用戶模型,并將用戶模型應用于網上信息的過濾和排序,從而為用戶提供感興趣的資源和信息。生物信息學(Bioinformatics)[2,3]是由生物學、應用數學和計算機科學相互交叉所形成的一門新型學科;其實質是利用信息科學的方法和技術來解決生物學問題。20世紀末生物信息學迅速發展,在信息的數量和質量上都極大地豐富了生物科學的數據資源,而數據資源的急劇膨脹需要尋求一種科學而有力的工具來組織它們,基于生物信息學的二次數據庫[4]能比較好地規范生物數據的分類與組織,但是用戶無法從大量的生物數據中尋求自己感興趣的部分(著名的生物信息學網站NCBI(美國國立生物技術信息中心),僅僅是小孢子蟲(Microsporidia)的DNA序列就達3399種),因此在生物二次數據庫上建立個性化推薦系統,能使用戶快速找到自己感興趣的生物信息。特別是在當前生物信息數據量急劇增長的情況下,生物信息學推薦系統將發揮強大的優勢。

1推薦系統的工作流程

應用在不同領域的推薦系統,其體系結構也不完全相同。一般而言,推薦系統的工作流程[5]如圖1所示。

(1)信息獲取。推薦系統工作的基礎是用戶信息。用戶信息包括用戶輸入的關鍵詞、項目的有關屬性、用戶對項目的文本評價或等級評價及用戶的行為特征等,所有這些信息均可以作為形成推薦的依據。信息獲取有兩種類型[6],即顯式獲取(Explicit)和隱式獲取(Implicit),由于用戶的很多行為都能暗示用戶的喜好,因此隱式獲取信息的準確性比顯式高一些。

(2)信息處理。信息獲取階段所獲得的用戶信息,一般根據推薦技術的不同對信息進行相應的處理。用戶信息的存儲格式中用得最多的是基于數值的矩陣格式,最常用的是用m×n維的用戶—項目矩陣R來表示,矩陣中的每個元素Rij=第i個用戶對第j個項目的評價,可以當做數值處理,矩陣R被稱為用戶—項目矩陣。

(3)個性化推薦。根據形成推薦的方法的不同可以分為三種,即基于規則的系統、基于內容過濾的系統和協同過濾系統。基于規則的推薦系統和基于內容過濾的推薦系統均只能為用戶推薦過去喜歡的項目和相似的項目,并不能推薦用戶潛在感興趣的項目。而協同過濾系統能推薦出用戶近鄰所喜歡的項目,通過用戶與近鄰之間的“交流”,發現用戶潛在的興趣。因此本文所用的算法是基于協同過濾的推薦算法。

(4)推薦結果。顯示的任務是把推薦算法生成的推薦顯示給用戶,完成對用戶的推薦。目前最常用的推薦可視化方法是Top-N列表[7],按照從大到小順序把推薦分值最高的N個事物或者最權威的N條評價以列表的形式顯示給用戶。

2生物信息學推薦系統的設計

綜合各種推薦技術的性能與優缺點,本文構造的生物信息學推薦系統的總體結構如圖2所示。

生物信息學推薦系統實現的主要功能是在用戶登錄生物信息學網站時,所留下的登錄信息通過網站傳遞到推薦算法部分;推薦算法根據該用戶的用戶名從數據庫提取出推薦列表,并返回到網站的用戶界面;用戶訪問的記錄返回到數據庫,系統定時調用推薦算法,對數據庫中用戶訪問信息的數據進行分析計算,形成推薦列表。

本系統采用基于近鄰的協同過濾推薦算法,其結構可以進一步細化為如圖3所示。算法分為鄰居形成和推薦形成兩大部分,兩部分可以獨立進行。這是該推薦系統有別于其他系統的優勢之一。由于信息獲取后的用戶—項目矩陣維數較大,使得系統的可擴展性降低。本系統采用SVD矩陣降維方法,減少用戶—項目矩陣的維數,在計算用戶相似度時大大降低了運算的次數,提高了推薦算法的效率。

(1)信息獲取。用戶對項目的評價是基于用戶對某一個項目(為表示簡單,以下提及的項目均指網站上的生物物種)的點擊次數來衡量的。當一個用戶注冊并填寫好個人情況以后,系統會自動為該用戶創建一個“信息矩陣”,該矩陣保存了所有項目的ID號以及相應的用戶評價,保存的格式為:S+編號+用戶評價,S用于標記項目,每個項目編號及其評價都以“S”相隔開;編號是唯一的,占5位;用戶評價是用戶點擊該項目的次數,規定其范圍是0~100,系統設定當增加到100時不再變化。這樣做可防止形成矩陣時矩陣評價相差值過大而使推薦結果不準確。(2)信息處理。信息處理是將所有用戶的信息矩陣轉換為用戶—項目矩陣,使用戶信息矩陣數值化,假設系統中有M個用戶和N個項目,信息處理的目的就是創建一個M×N的矩陣R,R[I][J]代表用戶I對項目J的評價。

(3)矩陣處理。協同過濾技術的用戶—項目矩陣的數據表述方法所帶來的稀疏性嚴重制約了推薦效果,而且在系統較大的情況下,它既不能精確地產生推薦集,又忽視了數據之間潛在的關系,發現不了用戶潛在的興趣,而且龐大的矩陣增加了計算的復雜度,因此有必要對該矩陣的表述方式做優化,進行矩陣處理。維數簡化是一種較好的方法,本文提出的算法應用單值分解(SingularValueDecomposition,SVD)技術[8],對用戶—項目矩陣進行維數簡化。

(4)相似度計算。得到降維以后的用戶矩陣US,就可以尋找每個用戶的近鄰。近鄰的確定是通過兩個用戶的相似度來度量的。本文采用Pearson相關度因子[9]求相似度。(5)計算用戶鄰居。該方法有兩種[10],即基于中心的鄰居(Center-BasedNeighbor)和集合鄰居(AggregateNeighbor)。本系統采用了第一種方法,直接找出與用戶相似度最高的前N個用戶作為鄰居,鄰居個數N由系統設定,比如規定N=5。

(6)推薦形成。推薦形成的前提是把當前用戶的鄰居ID號及其與當前用戶的相似度保存到數據庫中,而在前面的工作中已找出各用戶的鄰居以及與用戶的相似度,推薦形成部分只需要對當前登錄用戶進行計算。推薦策略是:對當前用戶已經訪問過的項目不再進行推薦,推薦的范圍是用戶沒有訪問的項目,其目的是推薦用戶潛在感興趣的項目;考慮到系統的項目比較多,用戶交互項目的數量很大,所以只篩選出推薦度最大的N個項目,形成Top-N推薦集,設定N=5。

3生物信息學推薦系統的實現

生物信息學推薦系統的實現可以用圖4來表示。數據庫部分主要存儲用戶信息和項目信息,用SQLServer2000實現。

數據訪問層實現了與用戶交互必需的存儲過程以及觸發器,也使用SQLServer2000,主要完成以下功能:初始化新用戶信息矩陣;插入新項目時更新所有用戶的信息矩陣;用戶點擊項目時更新該用戶對項目的評價;刪除項目時更新所有用戶的信息矩陣。用戶訪問層主要涉及網頁與用戶的交互和調用數據訪問層的存儲過程,在這里不做詳細的介紹。

推薦算法完成整個個性化推薦的任務,用Java實現。(1)數據連接類DataCon。該類完成與SQLServer2000數據庫的連接,在連接之前必須要下載三個與SQLServer連接相關的包,即msutil.jar、msbase.jar和mssqlserver.jar。

(2)數據操作類DataControl。該類負責推薦算法與數據庫的數據交換,靜態成員Con調用DataCon.getcon()獲得數據庫連接,然后對數據庫進行各種操作。把所有方法編寫成靜態,便于推薦算法中不創建對象就可以直接調用。

(3)RecmmendSource與CurrentUserNeighbor。這兩個類作為FCRecommand類的內部類,RecmmendSource用于保存當前用戶的推薦列表,包括推薦項目號和推薦度;CurrentUserNeighbor用于保存鄰居信息,包括鄰居ID號、相似度及其訪問信息。

(4)協同過濾推薦算法FCRecommand。該類實現了整個推薦算法,主要分為鄰居形成方法FCArithmetic和推薦形成方法GenerateRecommend。

下面給出方法FCArithmetic的關鍵代碼:

Matrixuser_item=this.User_Item_Arry();//獲取用戶—項目矩陣

user_item=this.SVD_Calculate(user_item);//調用SVD降維方法

Vectorc_uservector=newVector();//當前用戶向量

Vectoro_uservector=newVector();//其他用戶向量

Vectorc_user_correlate_vector=newVector();

//當前用戶與其他用戶之間相似度向量

for(inti=0;ifor(intj=0;jc_uservector.addElement(user_item.get(i,j));

//1.獲得當前用戶向量

for(intk=0;ko_uservector.clear();

for(intl=0;lo_uservector.addElement(user_item.get(k,l));

//2.獲得其他用戶的向量

//3.計算當前用戶與其他用戶的相似度

usercorrelativity=this.Correlativity(c_uservector,o_uservector);

c_user_correlate_vector.addElement(usercorrelativity);

}

//4.根據當前用戶與其他用戶的相似度,計算其鄰居

this.FindUserNeighbor(i,c_user_correlate_vector);

}

根據鄰居形成方法FCArithmetic,可以得到每個用戶的鄰居。作為測試用例,圖6顯示用戶Jack與系統中一部分用戶的相似度,可以看出它與自己的相似度必定最高;并且它與用戶Sugx訪問了相同的項目,它們之間的相似度也為1,具有極高的相似度。

4結束語

在傳統推薦系統的基礎上,結合當前生物信息學網站的特點,提出一個基于生物信息平臺的推薦系統,解決了傳統生物信息網站平臺信息迷茫的缺點,為用戶推薦其感興趣物種的DNA或蛋白質序列。

優點在于協同過濾的推薦算法能發現用戶潛在的興趣,能促進生物學家之間的交流;推薦算法的鄰居形成與推薦形成兩部分可以單獨運行,減少了系統的開銷。進一步的工作是分析生物數據的特點及生物數據之間的關系,增加用戶和項目數量,更好地發揮推薦系統的優勢。

參考文獻:

[1]PAULR,HALRV.Recommendersystems[J].CommunicationsoftheACM,1997,40(3):56-58.

[2]陳新.生物信息學簡介[EB/OL].(2001).166.111.68.168/bioinfo/papers/Chen_Xin.pdf.

[3]林毅申,林丕源.基于WebServices的生物信息解決方案[J].計算機應用研究,2005,22(6):157-158,164.[4]邢仲璟,林丕源,林毅申.基于Bioperl的生物二次數據庫建立及應用[J].計算機系統應用,2004(11):58-60.

[5]AIRIAS,TAKAHISAA,HIROYAI,etal.Personalizationsystembasedondynamiclearning:InternationalSemanticWebConference[C].Sardinia:[s.n.],2002.

[6]BREESEJS,HECKERMAND,KADIEC.Empericalanalysisofpredictivealgorithmsforcollaborativefiltering:proceedingsoftheFourteenthConferenceonUniversityinArtificialIntelligence[C].Madison:WI,1998:43-52.

[7]SCHAFERJB,KONSTANJ,RIEDLJ.Recommendersystemsine-commerce:proceedingoftheACMConferenceonElectronicCommerce[C].Pittsburgh:PA,1999:158-166.

[8]PRYORMH.Theeffectsofsingularvaluedecompositiononcollaborativefiltering[EB/OL].(1998).cs.dartmouth.edu/reports/TR98-338.pdf.

第2篇

關鍵詞:生物信息學 交叉學科 學生培養

一、生物信息學的產生

生物學是一門古老的學科,在人類歷史發展的長河中,人類從未停止過對生命奧秘的探索。人們逐漸認識到,雖然生物種類多種多樣,但是它們的最基本分子卻是相同的。DNA、RNA和蛋白質等分子構成了生命的基本單位,再由細胞到組織、器官,最后器官系統組成完整的生物體。

傳統的生物學研究中,由于受到技術水平的限制,生物學家多采用低通量的生物實驗方法,其研究對象通常是一個基因或者幾個基因組成的通路。在這種情況下,實驗后的簡單觀察就可以滿足研究需要。隨著生物研究的不斷深入,積累了大量實驗數據,人們不禁想到,如何把不同的實驗結果整合起來?另一方面,隨著生物技術的發展,大量新興技術出現,產生了海量的數據。例如90年代興起的基因芯片技術,單張芯片就可以測定成千上萬個基因在某一狀態下的表達情況。1990年啟動的人類基因組計劃更為生命科學的研究提供了海量的序列數據。面對如此多的數據,以前依靠生物實驗研究單個或幾個基因的方法很難再適用,生命科學、統計學、計算機科學和信息科學等若干學科的交叉學科――生物信息學應運而生。生物信息學以計算機、統計、模式識別等方法為手段,以生物數據為研究對象,通過對大量生物數據的儲存、處理和分析,提取其中有意義的生物知識[1],從而最終揭示蘊藏在核酸序列和蛋白質序列中的信息,對了解生命活動的基本規律出貢獻。

二、生物信息學在生命科學研究中的作用

作為一門新興的學科,大家對生物信息的作用并不十分明確。很多人認為生物信息學只是為實驗科學服務。從廣義上講,這種說法也不無道理,但是生物信息學并不是實驗科學的附屬品,與生物實驗一樣,它也是解決生物問題的一種手段。為了解決生物問題,生物學家依靠的是實驗臺,生物信息學家依靠的是計算機。

在生命科學的發展過程中,以分子生物學的產生為界,可以分為傳統生物學和現代生物學。傳統生物學和現代生物學取得的成就為生命科學的發展做出了巨大貢獻。人類基因組計劃啟動以來,人們一度認為只要把各種生物基因組的全部堿基排列順序測定清楚,生命的遺傳奧秘就會顯露無余,但是真實的情況遠不像想象的那樣簡單。人類的個體發育開始于一個單細胞受精卵,受精卵經過一系列的細胞分裂和分化,產生具有不同形態和功能的細胞,不同細胞之間相互作用構成各種組織和器官。雖然人類基因組中有兩萬多個基因,但是在單個細胞當中,同時起作用的基因往往是很少的。有些基因只在特定階段起作用,有些基因只在特定組織起作用。只關心某個基因或蛋白的功能是不夠的,因為在不同時空條件下,同一個基因或蛋白的功能可能不同。生物是一個復雜的系統,其表型和功能不僅體現于基因數量和序列的不同,更體現在基因、蛋白以及其他生物分子之間的相互作用之中。因此,把研究對象當成一個整體,系統地分析內部的相互關系尤其重要。但是無論是傳統生物學還是現代生物學,都是一門實驗學科,生物學的發展中缺乏一種系統思想。生物信息學可以從大量生物數據中提取有意義的生物知識,通過對已有數據的總結,進一步推測生物體的某些性質和變化趨勢,生物信息學為大量生物數據的整合提供了可能,與生物實驗一樣,是生物研究中的一種重要途徑。

三、生物信息學學生的培養

生物信息學是一門交叉學科,要求學生具有較好的分子生物學、計算機科學、數學和統計學素養,目前國內只有少數幾個學校設立了生物信息學本科專業,大部分的學生都是進入研究生階段才開始生物信息學的培養。在進入生物信息學專業前,本科階段可能接受過計算機、統計學、信息學、生物學等某一方面的教育,但要進行生物信息學的研究,大多需要補充其他方面的知識。

生物信息學研究可以分為兩類:第一,在深刻理解生物問題的基礎上,利用計算技術解決生物問題,第二,為生物學家提供性能更好的方法(算法)。理工科背景學生的生物知識較少,但是對于各種計算方法的原理和使用非常熟悉,對于這類學生的培養,第二類問題比較適合他們入門。在生物信息領域,有很多經典的分類問題。這些問題已經明確了分類目標,并且大都有通用的數據集。但是這類工作也受到了生物學家的質疑,因為大部分工作都是把已有的經典算法用在生物數據上,由于對生物問題不夠了解,最后成為只有做生物信息的人才看的方法。這也在一定程度上導致了部分生物學家對生物信息存在偏見,認為生物信息就是提出新算法,做一些數據庫。要想真正讓生物學家認識到生物信息學的重要性,就要以解決生物問題為根本出發點,即使是做預測方法,也要建立在解決生物問題的基礎上。做出更好預測方法的關鍵是深入理解生物問題并抓住關鍵特征。舉個例子,要把男生和女生分開,我們可以根據很多特征,比如身高、體重、頭發長短,雖然大多數情況下來說,男生比女生高、比女生重、比女生頭發短。但是只基于這些特征還是會造成很多的分類錯誤,因為這些特征不是男生女生差別的最根本因素。如果我們是根據性染色體來分,那正確率的提高就非常顯著了。在預測問題中,利用五花八門的方法并不是關鍵,如何能夠對生物問題深入了解并找到關鍵特征,才是最主要的。

作為一門新興的學科,大家對生物信息的了解還很少,很多人對它的定位也不同。但既然是生物信息,就是先生物后信息,可見生物的重要性。所以,在生物信息的研究過程中,對生物問題只限于表面地理解,勢必不能做出好的工作。只有對生物問題有了深入了解,才能發現其中的問題。能夠找到值得做的問題,可以說工作已經成功了一大半。當然,解決問題過程中也會有很多困難,比如發現了值得研究的課題,但在解決的過程當中發現某些數據無法獲得,或者某些技術超出了自己的能力范圍。在這種情況下,可以首先想想有沒有其它變通的辦法可以解決問題,如果經過慎重的考慮都無法找到,就要果斷的放棄。這里要強調一定要慎重考慮,不能遇到一點困難就放棄。

相比理工科背景的學生,生物背景的學生有著扎實的生物學知識基礎。但是如果是從本科階段直接進入生物信息學,由于還沒有進行過實驗操作,他們對生物問題的理解也很難非常深入。不管是理工科背景還是生物背景的學生,豐富的生物學知識都是進行好的生物信息學研究的前提。在培養學生時不可忽視對其基礎生物學知識的傳授和教育,并適當引導其對生物學問題的思考。生物學問題可以很大也可以很小。大的生物學問題任何一個懂得基礎生物學知識的人都可以提出,但也是最難解決的,比如到底是什么改變使細胞惡變,自身免疫病是如何形成的,心血管病糖尿病等復雜疾病是如何發生的,為何有人容易生某種病而其他人不易感。小的生物學問題就是各自領域的具體研究課題,比如表觀遺傳學領域的DNA去甲基化酶是否存在,基因表達調控領域的轉錄起始頻率是如何決定的,RNA領域的大量非編碼RNA的作用,蛋白修飾領域新發現的修飾如何調控蛋白的功能等等。在腦中提出并試圖思考一系列大大小小的生物學問題是對學生培養目標的第一步。這些問題的產生的前提是對生物學知識的熟悉掌握。然而在對學生培養的過程中沒必要也不可能告訴他們所有的知識,生物學知識教育的原則是為他們打開門,當他們思考問題的時候知道去哪里找到相關的知識。

另一方面,只有生物學基礎知識和問題是不夠的。很多問題在生物信息學產生之前就存在了,傳統的方法無法帶給人們問題的答案。人們一直期待新的方法去理解和解決這些問題。生物信息學的產生無疑提供給人們另一種思考生物問題的方式,為一些經典問題的解決提供了可能。例如最近的大規模的腫瘤基因組測序和分析使我們發現了很多新的腫瘤相關基因[2]。對于生物背景的學生,在教學中要把這樣的例子介紹給學生,生物背景的學生在理解信息學理論方面會存在困難。最初很難要求他們理解所有具體過程。但是至少要讓他們知道這些方法的基本原理,還有在什么情況下使用。這樣在以后的研究中遇到類似問題才能想到應該選擇什么樣的信息學工具去解決,在具體應用過程中加深對整個過程的理解。生物背景的學生如果想成為生物信息學專家,只會應用是不夠的,補充一些計算機、統計、信息方面的基礎知識是必不可少的。

生物信息學是一門仍處在快速發展之中的學科。還沒有一本教材能夠滿足生物信息學教學的需要,生物信息學立足于分子生物學、模式識別、計算機科學與技術、數學和統計學等學科,所以學生要先對這些學科的基本概念和系統有一個較為全面和直觀的認識,為日后的科研打下堅實的基礎。另外,培養過程中要包括大量的實例介紹,對一些重要的應用還加以詳細解剖,使得同學們不再僅掌握理論,而是能夠學會如何在實際工作中靈活應用這些理論。在此基礎之上,向同學們推薦一些最新的論文、期刊、參考讀物和相關的學術報告,讓同學們能夠切身感受到學科發展的前沿,培養學生的創新能力。21世紀是生命科學的時代,也是信息科學的時代。生物信息學在這樣的歷史條件下產生并壯大,它作為多個領域的交叉新興學科,對生命科學研究有著巨大的推動力。生物信息學是一門應用性非常強的學科,也是一門非常活躍的前沿學科,良好的教學效果必須以先進的內容體系為基礎,我們應時刻注意以科研促進教學,教學科研相長,使教學研究達到更高的水平。

[參考文獻]

[1]蔣彥等.基礎生物信息學及應用[M].北京:清華大學出版社,2003

第3篇

中圖分類號: G643;Q-3 文獻標識碼: B 文章編號: 1008-2409(2008)05-0967-03

人類基因組計劃的成功實施使生命科學進入了信息時代。基因組學、蛋白質組學和生物芯片 技術的發展,使得與生命科學相關的數據量呈線性高速增長。對這些數據全面、正確的解讀 ,為闡明生命的本質提供了可能。連接生物數據與醫學科學研究的是生物信息學(Bioinform atics)。應用生物信息學研究方法分析生物數據,提出與疾病發生、發展相關的基因或基因 群,再進行實驗驗證,是一條高效的研究途經。醫學是研究生命的科學,醫學研究在基礎上 就注定離不開對生物信息的了解。

我國目前醫學研究生教學模式主要有兩種, 一是醫學本科教育延續過來的理論型, 這種類型 的教育是在本科教學大綱的基礎上, 按照教學計劃進行理論講授, 最后按照導師指定的課題 完成畢業論文。這種培養模式突出理論學習, 忽視了實驗機能和科研能力的培養。二是科研 能力培養的前輕后重型, 前期只是進行理論授課, 后期由導師指導學生的科研。這種模式雖 然開設了一定的實驗項目, 但對研究生科研能力的培養缺乏系統性, 并且前期的培養不足直 接影響到研究生后期的學位課題和論文的進度、質量。

因此,筆者對生物信息學在醫學碩士研究生中的教育初探,不但有利于該門課程尚未完全形 成成熟的課程體系之際,為教師學習借鑒先進的教育思想與教學實踐經驗,更有利于醫學碩 士研究生對生物信息學的學習。

1 生物信息學的研究范圍

生物信息學是一門新興的交叉學科,涉及生物學、數學和信息科學等學科領域,并注定以互 聯網為媒介,數據庫為載體,利用數學知識、各種計算模型,并以計算機為工具,進行各種 生物信息分析,以理解海量分子數據中的生物學含義。

生物信息包括多種類型的數據,如核酸和蛋白質序列、蛋白質二級結構和三級結構的數據等 。由實驗獲得的核酸蛋白序列和三維結構數據等構成初級數據,由此構建的數據庫稱初級數 據庫。由初級數據分析得來的諸如二級結構、疏水位點、結構域(Domain),由核酸序列翻譯 來的蛋白質以及預測的二級三級結構,稱為二級數據。創新算法和軟件是生物信息學持續發 展的基礎,高通量生物學研究方法和平臺技術是驗證生物信息學研究結果的關鍵技術。因此 ,現代生物信息學是現代生命科學與信息科學、計算機科學、數學、統計學、物理學和化學 等學科相互滲透而形成的交叉學科,是應用計算機技術和信息論方法研究蛋白質及核酸序列 等各種生物信息的采集、存儲、傳遞、檢索、分析和解讀,以幫助了解生物學和遺傳學信息 的科學。從其研究所涉及的學科上看,生物信息學是集生物學、數學、信息學和計算機科學 一體化的一門新的科學;從其研究的主要內容上看,基因組信息學、蛋白質的結構模擬以及 藥物設計是生物信息學的三個重要組成部分,并有機地結合在一起[1]。

2 醫學碩士研究生中的生物信息學教學初探

2.1 課堂教學重在教授實踐技巧與方法

生物信息學在醫學研究生中的教學應以教授實踐技巧為主,以介紹原理為輔,深入淺出,注 重課堂知識與科研實踐的緊密結合。課堂講授應簡要介紹生物信息學的相關算法、原理,著 重介紹其使用技巧與方法,真正做到“有的放矢”,而這也是教學的重點和難點。

在教學中對于這部分內容應遵循深入淺出、避繁就簡的原則,結合具體實例分析算法,避免 空洞復雜的算法講解讓學生覺得枯燥乏味、晦澀難懂,產生畏懼心理,知難而退;注重講解 使用技巧與方法的思想和來龍去脈,讓學生真正掌握解決問題的思路,培養其科學思維能力 ,并采用探討式教學鼓勵學生思考,通過討論與研究的方式循序漸進的掌握復雜的內容,介 紹相關的教學和物理學知識,使學生充分體會到生物信息學與其他學科的關系,其他學科的 思想方法對于生物科學的重要性,培養其自覺地將其他學科的方法和思想應用于解決生物 學問題的科學素質。 任何學科都處于不斷地發展、更新中,生物信息無論是理論研究還是 應用研究仍處于不斷發展完善中,同時隨著新的應用領域和新問題的發現,其他學科的方 法也在不斷地應用于生物信息學,進一步增加了其多學科交叉融合的深度和廣度。

2.2 充分利用現代化教育技術,采用案例教學

目前,高等院校在教室內配備的多媒體投影播放系統,促進了多媒體教學的廣泛應用。生物 信息學采用多媒體教學是適應學科特點、提高教學效果和充分利用現代化教育技術的一項基 本要求。作為生物信息學教學的基本模式,多媒體教學使講解的內容更加直觀形象,尤其是 對于具體數據庫的介紹以及數據庫檢索、數據庫相似性搜索、序列分析和蛋白質結構預測等 內容涉及到的具體方法和工具的講解,可以激發學生的學習興趣,加深學生對知識的理解和 掌握,提高學生理論與實踐相結合的能力。

但多媒體教室也有局限性,學生主要以聽講為主不能及時實踐,教師講解與學生實踐相脫節 ,如果將生物信息學課程安排在計算機房內進行,并采用多媒體電子教室的教學方式可以解 決上述問題。在教學中采用啟發式教學,為學生建立教學情景,學生通過與教師、同學的協 商討論,參與操作,發現知識,理解知識并掌握知識。例如在講授“目的基因序列的查尋” 時,除對基本內容的介紹,如數據庫的發展、分類等,其他采用案例法,讓學生利用搜索工 具查找三大公共核酸數據庫,并通過數據庫網站的介紹內容對該數據庫的發展、內容、特點 進行學習并總結,通過討論和實際的數據庫瀏覽操作了解三大公共核酸數據庫并且掌握數據 庫使用方法。

2.3 采用“講、練”一體化的教學模式,強調學生實踐能力的培養

生物信息學課堂教學積極學習借鑒職業培訓和計算機課程教學中“講、練、做”一體化的教 學模式,在理論教學中增加實訓內容,在實踐教學中結合理論講授,改變了傳統的“以教師 為中心、以教材和講授為中心”教學方式。

根據教學內容和學生的認知規律,靈活地采用先理論后實踐或先實踐后理論或邊理論邊實踐 的方法,融生物信息學理論教學與實踐操作為一體,使學生的知識和能力得到同步、協調、 綜合發展。通常采用先講后練的方法,即首先介紹原理、方法,之后設計相關的實訓內容 讓學生上機實踐。對于操作性內容和生物信息分析的方法和工具的講解采取了進行實際演示 的方法,教師邊講解邊示范,學生在聽課時邊聽講邊練習或者教師講解結束后學生再進行練 習,理論與實踐高度結合,充分發揮課堂教學的生動性、直觀性,加深學生對知識的理解, 培養和提高學生的實踐操作能力。

2.4 發揮網絡教學優勢,優化生物信息學實驗教學內容

生物信息學實驗教學主要是針對海量生物數據處理與分析的實際需要,培養學生綜合運用生 物信息學知識和方法進行生物信息提取、儲存、處理、分析的能力,提高學生應用理論知識 解決問題的能力和獨立思考、綜合分析的能力。生物信息學實驗教學內容的選擇與安排應按 照循序漸進的原則,針對特定的典型性的生物信息學問題設計,以綜合性、設計性實驗內容 為主,明確目的要求,突出重點,充分發揮學生的主觀能動性和探索精神,以激發學生學習 的主動性和創造性為出發點,加強學生創新精神和實驗能力的培養。生物信息學實驗教學以 互聯網為媒介、計算機為工具,全部在計算機網絡實驗室內完成。在教學中,充分利用網絡 的交互特點實現信息技術與課程的結合。教師通過電子郵件將實驗教學內容、實驗序列、工 具等傳遞給學生,學生同樣通過電子郵件將實驗報告、作業、問題和意見等反饋給教師,教 師在網上批改實驗報告后將成績和評語發送給學生,讓學生及時了解自己的學習情況。

生物信息實驗教學與現代網絡和信息技術密不可分,在教學工作中充分利用現代教育技術較 其他課程更具優勢。區別于其他生命科學課程,在教學過程中要求有發達的互聯網和計算機 作為必備條件。調查顯示國內高校都已建立校園網,其中擁有1000 M主干帶寬的高校已占調 查 總數的64.9%,2005年一些綜合類大學和理工類院校將率先升級到萬兆校園網[2] ,這些都為生物信息學課程在高校開設提供了良好的物質基礎。

2.5 考試無紙化,加強實踐能力考核

考試重點是考查學生對生物信息分析的基本方法和技能的掌握程度和對結果的分析解釋能力 。因此,在生物信息學考試中嘗試引入實踐技能考試,重點考核學生知識應用能力。實踐技 能考試采用無紙化考試方式,學生在互聯網環境下,對序列進行生物信息分析并對結果進行 解釋,不僅考核學生對基本知識和基本原理的掌握,而且考查學生進行生物信息分析的實際 能力和分析思考能力。通過實踐技能考試,淡化理論考試,克服傳統的死記硬背,促進學生 注重提高理論用于實踐的綜合能力,同時更有效地提高學生計算機應用能力。除采用實踐技 能考試并將其作為學生成績的主要部分外,還加強了對學生平時學習態度、學習能力、創新 思維等方面的考核。

總之,生物信息學教學是網絡環境下生物教學的全新內容。通過上述教學措施,提高了學生 的 學習積極性、實踐操作能力、解決實際問題的綜合應用能力及創新能力,收到了良好的教學 效果,得到了學生的普遍歡迎,具有較強的可操作性和實踐性。在今后的教學實踐中,隨著 教師自身素質的提高和進一步的教學改革將會不斷完善生物信息學教學,培養具有“大科學 ”素質和意識的醫學研究生人才。

參考文獻:

[1] 張陽德.生物信息學[M].北京:科學出版社,2004:4.

第4篇

關鍵詞: 生物信息學 農業研究領域 應用

“生物信息學”是英文單詞“bioinformatics”的中文譯名,其概念是1956年在美國田納西州gatlinburg召開的“生物學中的信息理論”討論會上首次被提出的[1],由美國學者lim在1991年發表的文章中首次使用。生物信息學自產生以來,大致經歷了前基因組時代、基因組時代和后基因組時代三個發展階段[2]。2003年4月14日,美國人類基因組研究項目首席科學家collins f博士在華盛頓隆重宣布人類基因組計劃(human genome project,hgp)的所有目標全部實現[3]。這標志著后基因組時代(post genome era,pge)的來臨,是生命科學史中又一個里程碑。生物信息學作為21世紀生物技術的核心,已經成為現代生命科學研究中重要的組成部分。研究基因、蛋白質和生命,其研究成果必將深刻地影響農業。本文重點闡述生物信息學在農業模式植物、種質資源優化、農藥的設計開發、作物遺傳育種、生態環境改善等方面的最新研究進展。

1.生物信息學在農業模式植物研究領域中的應用

1997年5月美國啟動國家植物基因組計劃(npgi),旨在繪出包括玉米、大豆、小麥、大麥、高粱、水稻、棉花、西紅柿和松樹等十多種具有經濟價值的關鍵植物的基因圖譜。國家植物基因組計劃是與人類基因組工程(hgp)并行的龐大工程[4]。近年來,通過各國科學家的通力合作,植物基因組研究取得了重大進展,擬南芥、水稻等模式植物已完成了全基因組測序。人們可以使用生物信息學的方法系統地研究這些重要農作物的基因表達、蛋白質互作、蛋白質和核酸的定位、代謝物及其調節網絡等,從而從分子水平上了解細胞的結構和功能[5]。目前已經建立的農作物生物信息學數據庫研究平臺有植物轉錄本(ta)集合數據庫tigr、植物核酸序列數據庫plantgdb、研究玉米遺傳學和基因組學的mazegdb數據庫、研究草類和水稻的gramene數據庫、研究馬鈴薯的pomamo數據庫,等等。

2.生物信息學在種質資源保存研究領域中的應用

種質資源是農業生產的重要資源,它包括許多農藝性狀(如抗病、產量、品質、環境適應性基因等)的等位基因。植物種質資源庫是指以植物種質資源為保護對象的保存設施。至1996年,全世界已建成了1300余座植物種質資源庫,在我國也已建成30多座作物種質資源庫。種質入庫保存類型也從單一的種子形式,發展到營養器官、細胞和組織,甚至dna片段等多種形式。保護的物種也從有性繁殖植物擴展到無性繁殖植物及頑拗型種子植物等[6]。近年來,人們越來越多地應用各種分子標記來鑒定種質資源。例如微衛星、aflp、ssap、rbip和snp等。由于對種質資源進行分子標記產生了大量的數據,因此需要建立生物信息學數據庫和采用分析工具來實現對這些數據的查詢、統計和計算機分析等[7]。

3.生物信息學在農藥設計開發研究領域中的應用

傳統的藥物研制主要是從大量的天然產物、合成化合物,以及礦物中進行篩選,得到一個可供臨床使用的藥物要耗費大量的時間與金錢。生物信息學在藥物研發中的意義在于找到病理過程中關鍵性的分子靶標、闡明其結構和功能關系,從而指導設計能激活或阻斷生物大分子發揮其生物功能的治療性藥物,使藥物研發之路從過去的偶然和盲目中找到正確的研發方向。生物信息學為藥物研發提供了新的手段[8,9],導致了藥物研發模式的改變[10]。目前,生物信息學促進農藥研制已有許多成功的例子。itzstein等設計出兩種具有與唾液酸酶結合化合物:4-氨基-neu5ac2en和4-胍基-neu5ac2en。其中,后者是前者與唾液酸酶的結合活性的250倍[11]。目前,這兩種新藥已經進入臨床試驗階段。tang sy等學者研制出新一代抗aids藥物saquinavir[12]。pungpo等已經設計出幾種新型高效的抗hiv-1型藥物[13]。楊華錚等人設計合成了十多類數百個除草化合物,經生物活性測定,部分化合物的活性已超過商品化光合作用抑制劑的水平[14]。

現代農藥的研發已離不開生物信息技術的參與,隨著生物信息學技術的進一步完善和發展,將會大大降低藥物研發的成本,提高研發的質量和效率。

4.生物學信息學在作物遺傳育種研究領域中的應用

隨著主要農作物遺傳圖譜精確度的提高,以及特定性狀相關分子基礎的進一步闡明,人們可以利用生物信息學的方法,先從模式生物

中尋找可能的相關基因,然后在作物中找到相應的基因及其位點。農作物的遺傳學和分子生物學的研究積累了大量的基因序列、分子標記、圖譜和功能方面的數據,可通過建立生物信息學數據庫來整合這些數據,從而比較和分析來自不同基因組的基因序列、功能和遺傳圖譜位置[15]。在此基礎上,育種學家就可以應用計算機模型來提出預測假設,從多種復雜的等位基因組合中建立自己所需要的表型,然后從大量遺傳標記中篩選到理想的組合,從而培育出新的優良農作物品種。

5.生物信息學在生態環境平衡研究領域中的應用

在生態系統中,基因流從根本上影響能量流和物質流的循環和運轉,是生態平衡穩定的根本因素。生物信息學在環境領域主要應用在控制環境污染方面,主要通過數學與計算機的運用構建遺傳工程特效菌株,以降解目標基因及其目標污染物為切入點,通過降解污染物的分子遺傳物質核酸 dna,以及生物大分子蛋白質酶,達到催化目標污染物的降解,從而維護空氣[16]、水源、土地等生態環境的安全。

美國農業研究中心(ars) 的農藥特性信息數據庫(ppd) 提供 334 種正在廣泛使用的殺蟲劑信息,涉及它們在環境中轉運和降解途徑的16種最重要的物化特性。日本豐橋技術大學(toyohashi university of technology) 多環芳烴危險性有機污染物的物化特性、色譜、紫外光譜的譜線圖。美國環保局綜合風險信息系統數據庫(iris) 涉及 600種化學污染物,列出了污染物的毒性與風險評價參數,以及分子遺傳毒性參數[17]。除此之外,生物信息學在生物防治[18]中也起到了重要的作用。網絡的普及,情報、信息等學科的資源共享,勢必會創造出一個環境微生物技術信息的高速發展趨勢。

6.生物信息學在食品安全研究領域中的應用

食品在加工制作和存儲過程中各種細菌數量發生變化,傳統檢測方法是進行生化鑒定,但所需時間較長,不能滿足檢驗檢疫部門的要求,運用生物信息學方法獲得各種致病菌的核酸序列,并對這些序列進行比對,篩選出用于檢測的引物和探針,進而運用pcr法[19]、rt-pcr法、熒光rt-pcr法、多重pcr[20]和多重熒光定量pcr等技術,可快速準確地檢測出細菌及病毒。此外,對電阻抗、放射測量、elisa法、生物傳感器、基因芯片等[21-25]技術也是未來食品病毒檢測的發展方向。

轉基因食品檢測是通過設計特異性的引物對食品樣品的dna提取物進行擴增,從而判斷樣品中是否含有外源性基因片段[26]。通過對轉基因農產品數據庫信息的及時更新,可準確了解各國新出現和新批準的轉基因農產品,便于查找其插入的外源基因片段,以便及時對檢驗方法進行修改。目前由于某些通過食品傳播的病毒具有變異特性,以及檢測方法的不完善等因素影響,生物信息學在食品領域的應用還比較有限,但隨著食品安全檢測數據庫的不斷完善,相信相關的生物信息學技術將在食品領域發揮越來越重要的作用。

生物信息學廣泛用于農業科學研究的各個領域,但是僅有信息資源是不夠的,選出符合自己需求的生物信息就需要情報部門,以及信息中介服務機構提供相關服務,通過出版物、信息共享平臺、數字圖書館、電子論壇等信息媒介的幫助,科研工作者可快速有效地找到符合需要的信息。目前我國生物信息學發展還很不均衡,與國際前沿有一定差距,這需要從事信息和科研的工作者們不斷交流,使得生物信息學能夠更好地為我國農業持續健康發展發揮作用。

參考文獻:

[1]yockey hp,platzman rp,quastler h.symposium on information.theory in biology.pergamon press,new york,london,1958.

[2]鄭國清,張瑞玲.生物信息學的形成與發展[j].河南農業科學,2002,(11):4-7.

[3]駱建新,鄭崛村,馬用信等.人類基因組計劃與后基因組時代.中國生物工程雜志,2003,23,(11):87-94.

[4]曹學軍.基因研究的又一壯舉——美國國家植物基因組計劃[j].國外科技動態,2001,1:24-25.

[5]michael b.genomics and plantcells:application ofgenomics strategies to arabidopsis cellbiology[j].philostransr soc lond b bio sci,2002,357(1422):731-736.

[6]盧新雄.植物種質資源庫的設計與建設要求[j].植物學通報,2006,23,(1):119-125.

[7]guy d,noel e,mik

e a.using bioinformatics to analyse germplasm collections [j].springer netherlands,2004:39-54.

[8]鄭衍,王非.藥物生物信息學,化學化工出版社,2004.1:214-215.

[9]俞慶森,邱建衛,胡艾希.藥物設計.化學化工出版社,2005.1:160-164.

[10]austen m,dohrmann c.phenotype—first screening for the identification of novel drug targets.drug discov today,2005,10,(4):275-282.

[11]arun agrawal,ashwini chhatre.state involvement and forest cogovernance:evidence from the indianhmi alayas.stcomp international developmen.t sep 2007:67-86.

[12]tang sy.institutionsand collective action:self-governance in irrigation [m].san francisco,ca:icspress,1999.

[13]pungpo p,saparpakorn p,wolschann p,et a.l computer-aided moleculardesign of highly potenthiv-1 rt inhibitors:3d qsar and moleculardocking studies of efavirenz derivatives[j].sar qsar environres,2006,17,(4):353-370.

[14]楊華錚,劉華銀,鄒小毛等.計算機輔助設計與合成除草劑的研究[j].計算機與應用化學,1999,16,(5):400.

[15]vassilev d,leunissen j,atanassov a.application of bioinformatics in plant breeding[j].biotechnology & biotechnological equipment,2005,3:139-152.

[16]王春華,謝小保,曾海燕等.深圳市空氣微生物污染狀況監測分析[j].微生物學雜志,2008,28,(4):93-97.

[17]程樹培,嚴峻,郝春博等.環境生物技術信息學進展[j].環境污染治理技術與設備,2002,3,(11):92-94.

[18]史應武,婁愷,李春.植物內生菌在生物防治中的應用[j].微生物學雜志,2009,29,(6):61-64.

[19]趙玉玲,張天生,張巧艷.pcr 法快速檢測肉食品污染沙門菌的實驗研究[j].微生物學雜志,2010,30,(3):103-105.

[20]徐義剛,崔麗春,李蘇龍等.多重pcr方法快速檢測4種主要致腹瀉性大腸埃希菌[j].微生物學雜志,2010,30,(3) :25-29.

[21]索標,汪月霞,艾志錄.食源性致病菌多重分子生物學檢測技術研究進展[j].微生物學雜志,2010,30,(6):71-75

[22]朱曉娥,袁耿彪.基因芯片技術在基因突變診斷中的應用及其前景[j].重慶醫學,2010,(22):3128-3131.

[23]陳彥闖,辛明秀.用于分析微生物種類組成的微生物生態學研究方法[j].微生物學雜志,2009,29,(4):79-83.

[24]王大勇,方振東,謝朝新等.食源性致病菌快速檢測技術研究進展[j].微生物學雜志,2009,29,(5):67-72.

[25]蘇晨曦,潘迎捷,趙勇等.疏水網格濾膜技術檢測食源性致病菌的研究進展[j].微生物學雜志,2010,30,(6):76-81.

第5篇

【關鍵詞】云計算 生物信息學

下一代測序技術的應用產生了大量的測序數據,這對生物學特別是生物信息學在數據的存儲、管理和搜索等方面帶來了新的挑戰。一直以來計算機存儲和處理數據能力的增長速度都快于生物數據的增長速度,但2003年后,由于測序技術的發展使得測序成本大幅度下降,產生了大量的生物數據,計算機的存儲和計算能力逐漸無法滿足大數據的需求。這促進了云計算的運用和發展,它使得用戶可以根據需求租用硬件設備和軟件,避免了對硬件設備的大量資金投入和管理投入。

1 云計算定義

“云”是一個通過虛擬技術把云端計算機或是服務器連接在一起的服務網絡。存儲和分析數據都由“云”端的服務器或是計算機完成。中國云計算專家劉鵬給出如下定義:“云計算是一種商業計算模型,它將計算任務分布在大量計算機構成的資源池上,使用戶能夠按需獲取計算力、存儲空間和信息服務。”

按照資源的共享水平,云計算的服務模式分為三種,基礎架構即服務(Infrastructure as a service), 平臺即服務(Platform as a service)和軟件即服務(Software as a service)。

IaaS(Infrastructure as a service) Service:基礎架構即服務。它整合了基礎設施如虛擬主機、存儲設備、網絡設備等資源成為一個服務平臺提供給用戶使用。IaaS位于網絡的底層,向用戶提供按需分配、按需付費的計算設備和存儲設備。

PaaS(Platform as a service)提供服務平臺,用戶掌控運作應用程序的環境,可以在平臺上應用,測試和開發軟件。

SaaS(Software as a service)即在服務平臺上提供軟件供用戶使用,用戶只使用軟件,不掌握操作系統、硬件等網絡基礎架構。用戶不必自己安裝軟件,只需要瀏覽器連接到公共的服務平臺即可。供應商會按照用戶的要求安裝所需的軟件,并負責軟件的升級和維護。

云計算的主要優點:

(1)把用戶從安裝和測試軟件的工作中解脫出來。云計算平臺可以按照用戶的需求提供軟件及硬件的服務。用戶不需要考慮網絡下面復雜的硬件架構,僅僅需要關注計算和分析就可以。

(2)按需租用計算資源可以讓用戶支付更少的費用。在云計算平臺上,用戶在最初時可以租用少量的機器,以后隨著需求的增加或減少相應的增加或減少租用的機器。用戶所付的費用就是實際租用機器的費用。

(3)云計算方便研究人員之間的數據共享和分析。不同研究者在本地服務器上安裝的軟件版本可能不同,所以共享數據和軟件很困難。云計算可以使登錄同一個平臺的用戶共享操作系統和所有的軟件數據,保證了軟件的版本同步更新。

2 云計算在生物信息中的應用

我們把云計算在生物信息學中的應用按IaaS, PaaS和SaaS三個方面分別介紹。

2.1 IaaS

用戶租用云計算上的虛擬主機可以自己控制計算、存儲等硬件設備,建立需要的計算環境。并且大量的生物信息學工具可以打包為虛擬鏡像用于租用的云計算的虛擬主機上,可以很方便的進行多種數據分析。如CloVR提供的一個包含預配置和自動的生物信息學流程的虛擬主機,可以運行在本地的計算機上也可以運行在云計算平臺上。這個虛擬機以Ubuntu和BioLinux為基礎,安裝了Grid Engine和Hadoop作為作業調度,Ergatis作為工作流系統,還有很多開源的生物信息學軟件,如BLAST、16S rRNA等。用戶也可以開發自己的軟件運行在虛擬機上。Bioconductor是一個開源的關于R語言的生物信息學庫,提供了一系列的軟件包用于微陣列數據分析。用戶可以下載Bioconductor提供的鏡像安裝到租用的云計算平臺上。

2.2 PaaS

Galaxy Cloudman和Eoulsan可以看做PaaS。Galaxy整合了一系列的簡單易用的工具,提供一個簡易的網頁用來分析數據。Galaxy Cloudman把Galaxy的軟件工具打包成一個鏡像,可以在AWS(Amazon Web Service)上應用。用戶可以將其他安裝在Galaxy平臺上的軟件安裝到自己的云計算平臺上,甚至可以在Galaxy Cloudman上定義插件。通過添加額外的工具,可以擴展默認函數并測試和使用。從這個意義上說,Galaxy Cloudman可以看做PaaS。

Eoulsan整合了很多下一代基因數據分析工具,如BWA,Bowtie,SOAP2,GSNAP,edgeR,和DEdeq于一個框架內,同時,它也支持用戶自己開發的插件用于數據分析。

2.3 SaaS

很多傳統的生物信息學工具如BLAST、UCSC Genome Browser僅僅用一個瀏覽器就可以登錄到服務器使用相應的服務,它們也可以稱為SaaS。這些服務一般由軟件工具的開發者提供,伸縮性很差。我們主要介紹應用于云計算平臺上可以伸縮的生物信息學工具。

短序列(讀段)匹配是指將測序得到短序列匹配到參考基因組上,這是許多測序數據分析的第一步,如SNP識別和基因表達譜分析。CloudBurst,CloudAligner,SEAL和Crossbow都是應用于云計算基于MapReduce的軟件,可以匹配數以百萬計的序列。Schatz用”seed-and-extend”算法開發的CloudBurst可以確定錯誤匹配的數目。CloudBurst模仿了RMAP的算法,但速度提高了30倍。但是CloudBurst不支持fastq文件,并且不能處理重亞硫酸鹽測序和(雙)末端測序產生的數據。CloudAligner彌補了這個缺點,并且比CloudBurst快35%到80%。SEAL整合了BWA,在序列匹配時可以去除重復的序列,這對SNP識別和以后分析很有用。應用MapReduce的Crossbow整合了Bowtie和SOAPsnp,可以在幾個小時內匹配數以十億計的序列。

差異表達分析可以用來尋找不同樣本中表達有明顯差別的基因,而RNA測序(RNA-seq)用來量化樣本中的基因表達水平。Myrna是一個云計算平臺上計算大規模RNA測序的軟件。它整合了序列匹配、歸一化、聚類分析和統計模型,直接輸出不同樣本的基因表達水平和不同表達水平的基因。然而,Myrna 最大的缺陷是不能正確地將短序列匹配到外顯子拼接位點上。但FX彌補了這個缺點。FX用改進的匹配函數分析RNA數據,以RPKM或是BPKM的格式輸出不同基因的表達水平。

3 云計算面臨的問題

云計算提供了強大的計算能力,但云計算自身的特點也使它的發展面臨了一些困難和制約。云計算在生物信息學上的應用尚處于初期階段,盡管已經出現了一定數量的生物信息學工具,但仍有很多的分析無法完成,很多的工具還需升級或者開發。云計算上數據的隱私性和安全性也是用戶需要考慮的方面。特別是一些生物數據涉及到病人的隱私,但很多國家還沒有保護這種數據隱私的法律。云計算服務提供商需要制定一些規則來保護用戶的數據。

4 對應用云計算的建議

對于將要使用云計算的用戶,需要考慮以下三個方面:數據規模、安全隱私和費用。

數據規模及安全隱私:首先要考慮你的數據規模是否超過了本地計算機的處理能力。現在本地的個人電腦可以處理數千兆的數據,服務器一次可以處理數百G的數據。如果用戶熟悉并行計算的技術,可以處理數TB的數據。但如果你的數據更大并且不精通并行計算,本地計算機和服務器就很難處理了,就可以考慮云計算。用戶如果要向云計算平臺上傳輸數據,需要考慮數據的安全性和隱私性。比如涉及病人的隱私是否會泄露,云計算服務提供商是否可以保證數據的安全等。

費用:云計算的費用一般是按照使用的計算資源的多少和使用時間的長短計算的。使用云計算前應該評估其使用費用。用戶應該考慮所有階段的費用,如數據傳輸、保存、分析等。

目前,云計算和生物信息學都處在快速發展當中,云計算在生物信息學中的應用也越來越廣泛和深入。特別是生物數據的大規模增漲,生物學家必須從大量的數據當中分辨出有用的信息。這就需要強大的存儲能力和計算分析能力,云計算可以很好的解決這個問題。 云計算和生物信息學的結合將極大的促進生物學的發展。

參考文獻

[1]劉鵬主編.云計算(第二版)[M].北京:電子工業出版社,2011(05).

[2]Schatz MC,CloudBurst:Highly sensitive read mapping with MapReduce,Bioinformatics

25(11):1363-1369,2009.

[3]Nguyen T,ShiW,Ruden D,CloudAligner:A fast and full-featured mapreduce based tool.for sequence mapping, BMC Res Notes 4:171,2011.

[4]Hong D,Rhie A,Park SS,Lee J,Ju YS,Kim S,Yu SB,Bleazard T,Park HS,Rhee H,Chong H,Yang KS,Lee YS,Kim IH,Lee JS,Kim JI,Seo JS,FX:An RNA-seq analysis tool on the cloud, Bioinformatics 28(5):721-723,2012.

作者簡介

李淵(1985-),男,河南省延津縣人。碩士研究生學歷。現為蘇州大學系統生物學研究中心助理實驗師。主要研究方向為實驗技術。

第6篇

基因組信息爆炸的時代,需要超大規模計算系統來運算。

伴隨著基因組研究日新月異的快速發展,相關信息出現了爆炸性增長,迫切需要對海量生物信息進行處理。以DNA堿基數為例,其增長速度呈指數性增長,大約每14個月就會增長一倍,這種增長速度只有計算機運算能力的增長可以與之相比。所以在當前基因組信息爆炸的時代,需要建立超大規模計算系統,用更準確、更可靠的方法來分析這些數據,從中獲得有用的信息是生物信息學取得成果的決定性步驟。

近日,具有萬億次浮點運算能力、基于四核處理器的聯想高性能機群――深騰1800落戶于上海交通大學,承載著該校在生命科學研究領域的多種核心應用軟件。上海生物信息技術研究中心主任李亦學在接受記者采訪時說: “生物與計算結合最早叫做計算生物學,從要求來講,能夠進行大規模計算即可,對單個CPU結點的內存沒有多大的要求,但隨著生物學的發展,對計算機的要求變得比較復雜。一個完整的解決方案,要求對大量不同的數據庫同時進行快速檢索,然后是數據整合,同時還要做很多并發計算,很多計算是非常耗內存的。實際上并不一定非得要求計算能力非常高,但一定要可靠。再者,需要同時并發完成許多不同的計算。”

李亦學說,他們在進行生物信息計算時會同時存在幾十種不同的任務,這不但需要計算機運算速度快,還要求有很大的共享內存。現代生物學為了獲得高速運算,必須把所有的數據放在內存中進行操作,這樣會節省時間。如果沒有很大的共享內存,他們的很多案例就沒有辦法做了。比如大的基因組測序數據的拼接工作,內存要30G左右,大內存的胖結點可以做到。而四核的發展,其實可以把每個結點共享內存加大,在性價比方面也比較高,這種發展非常符合生物學發展對復雜生物系統計算性能的要求。

據介紹,深騰1800能提供每秒1.02萬億次的雙精度浮點峰值運算平臺。而此次HPC的部署總計12個計算結點、1個胖結點以及管理結點和存儲結點,共計116個CPU內核,附帶完備的基礎架構。該方案滿足了上海交大的需求,也提升了其科研工作效率和綜合科研實力。

在高性能計算領域,相對于低端的PC服務器而言,機群服務器及其系統構建更需要專業的應用方案設計技術和精湛的技術服務能力,高性能計算大多用于對計算能力要求比較嚴格的行業,比如說生物信息學、材料分子學、地質分析以及證券金融等。但是也應該看到我國的HPC已經有了很大的發展,中國的HPC的系統方案也將從標準的通用型走向更切合應用需求特點的專用型。

第7篇

關鍵詞:醫學檢驗;生物信息學;課程教學

近年來,生物信息學在各醫藥院校越來越受到重視,多所院校相繼在研究生教學中開設了生物信息學課程[1]。而對于醫學本科層次是否需要開設生物信息學課程這一問題,雖然目前各方面的觀點不一,但是已經有一些院校開始進行嘗試。目前醫學檢驗專業(五年制,畢業時授予醫學學士學位)已調整為醫學檢驗技術專業(四年制,畢業時授予理學學士學位),而生物信息學作為一門新課程,在醫學檢驗(技術)專業學生培養中的作用正日益受到關注,逐步被某些院校選擇作為必修課或者選修課。

一、開設課程的必要性

空前繁榮的生物醫學大數據的產出,及其蘊含的重大生命奧秘的揭示,將決定現代生命科技和醫藥產業研發的高度,決定人們對疾病的認識和掌控能力,也將對主導生物醫學大數據存儲、管理、注釋、分析全過程,解決生命密碼的關鍵手段———現代生物信息學技術的發展帶來前所未有的機遇和挑戰[2]。對于醫學專業學生而言,通過學習生物信息學,從而掌握利用各種網絡信息資源來檢索和獲取生物信息數據,并選擇和使用各種生物信息學軟件來分析數據。在當今大數據時代,這方面的知識和技能的培養對于醫學生今后從事醫學科研工作是非常重要的。因此,在醫學專業學生中開設生物信息學課程非常必要。我校從2010年開始將生物信息學設置為研究生教學的必修課;從2013年開始在醫學檢驗專業中開設生物信息學選修課,自2015年開始轉為醫學檢驗技術專業。在醫學檢驗技術專業中開設生物信息學課程,能夠為該專業學生的臨床和科研方面的素質積累提供必要的支持,更重要的是增強了在醫學和信息科學交叉領域解決問題的技能,其意義幾乎等同于在研究生教學中的設課意義。

二、教學內容的安排

醫學檢驗技術專業的教學任務非常緊張,幾乎將原來醫學檢驗專業前八個學期(最后兩個學期為實習階段)課程壓縮到六個學期來完成,學生學習壓力可想而知。我校為了減輕學生負擔,各課程的課時數都比醫學檢驗專業有所減少。但生物信息學并未改變,仍然為16學時。為了在較短的學時內實現教學效果的最大化,我們結合該專業學生的特點和需求,將授課內容分為理論課和實踐課兩部分,實踐課不占學時。理論課主要介紹基本的生物信息學理論、資源和數據的獲取、分析方法和工具的使用;實踐課則通過布置作業,課后上機操作來解決問題。理論課主要內容包括:生物信息學導論、DNA測序技術、序列的獲取、雙序列比對、多序列比對、蛋白質結構分析和預測共計六個專題。實踐課主要內容包括:cDNA及基因組參考序列的獲取;常見序列格式的釋義與轉換;雙序列比對(局部比對);多序列比對(全局比對);蛋白質綜合信息查詢;蛋白質基本性質、疏水區、亞細胞定位、信號肽、跨膜區、模體及結構域分析與二級結構預測;蛋白質三級結構預測。在理論課實施過程中,注重將與生物信息學相關的生命科學和醫學前沿的一些最新進展和最新成果引入理論知識講授中,讓學生在有限學時內能夠進一步認識生物信息學的內涵和課程的價值,追蹤前沿學科的動態,開拓視野。

三、教學方法的設計

生物信息學涉及多個學科領域,交叉性強,在較短的學時內學好這門課程的難度很大。學生的學習興趣與教學內容和手段關系密切,除了精心選擇教學內容外,教學方法上也有很多需要革新乃至創新的地方。在教學過程中,我們形成了頗具特色的教學經驗,由授課教師獨創的授課———實踐———演示(Teaching-Practicing-Showing,TPS)教學模式已應用于教學。TPS教學模式著力于以實際問題為引線,將理論授課與上機實踐有機地融為一體,逐步介紹生物數據分析的各項技能,并指導學生將其融會貫通以真正掌握相關的基本方法與常用工具。首先,在教學內容上引入具體實例來進行教學,比如講解生物信息數據庫(Gene、Nucleotide、UniProt、PDB等)時,通過給出檢索某個人類疾病基因數據的例子來學習數據庫的使用方法。課堂上教學實例的設計需要任課教師在備課時投入大量精力來完成,還需要教師具備多學科交叉的知識。教學實踐表明,與醫學相關的生物信息學分析實例可以讓學生更好地認識該課程的作用,大幅度提高學生的學習興趣和學習的主動性。此外,課堂教學手段也應該豐富多彩,多媒體教學中可以充分使用圖片、動畫等元素。其次,舉例分析時可以進行一定的現場演示,比如講解檢索Unigene數據庫時可以一邊上網演示一邊解釋說明。

四、考核方式的變革

生物信息學作為選修課,既要遵循學校相關的考試制度,也要通過對考試方式的變革來提高考試效果。我們將理論考核與學生的實踐能力考核聯系起來,結合學生課外實踐任務的完成情況和開卷考試成績進行綜合評定。在課程中安排一次課外實踐任務,要求每位學生獨立完成相關分析并提交書面分析報告,該部分占考核成績的20%。具體內容為自行選擇一個人類細胞外功能蛋白:1.利用ClustalX對各物種參考蛋白序列進行多序列比對(輸出PS格式結果);2.分析分子量、等電點、分子式、穩定性、親疏水性及亞細胞定位;3.預測二級結構并模擬三維結構。課程結束后進行開卷考試,內容包括基礎知識和綜合分析,盡量采取靈活的出題方式,并控制題量,該部分占考核成績的80%。近年來的教學實踐表明,這種綜合評定的方式能夠反映學生對該課程的掌握程度,體現學生利用生物信息學知識解決問題的能力。

五、展望

實踐表明,生物信息學課程教學能夠給學生提供所需要的生物信息學知識和技能,但是在教學內容安排、教學方法設計、教學手段使用和教學效果評價等諸多環節都需要進一步探討。在這個過程中,我們既需要吸收傳統教學模式中的優點和精髓,做到嚴謹和切合實際,又需要更新教學理念,突出醫學特色,大膽嘗試新的教學方法和手段,最終形成本課程別具一格的教學特色。

作者:倫永志 單位:大連大學

參考文獻

第8篇

關鍵詞:生物信息學;形成性評價;教育教學改革

中圖分類號:G642.4 文獻標志碼:A 文章編號:1674-9324(2014)22-0147-02

生物信息學(Bioinformatics)是近二十年來迅速發展起來的一門新興前沿學科,它綜合利用計算機科學和信息技術,通過對海量生物學數據的處理和分析,揭示其中蘊藏的內在聯系和生物學含義,進而提煉有用的生物學知識。隨著人類基因組和多種模式生物測序的完成,有關核酸、蛋白序列和結構的數據呈指數增長,面對如此龐大而復雜的數據資源,運用計算機獲取管理分析數據、控制分析誤差、加速分析過程勢在必行,生物信息學應運而生并迅速蓬勃發展起來,并逐步成為生命科學在信息時展的核心內容之一,對生命科學研究帶來革命性變革。受到國際大環境的影響,國內各重點大學紛紛開展了生物信息學專業的設立,一般醫學院校也開展了生物信息學必修及選修課課程,由于生物信息學是新興學科,在教學現狀上存在很多不足,如:教學手段落后;只注重理論教學,忽視理論應用于實踐的重要性,導致學生所學的理論知識與實際工作脫節;教學內容簡單,體系不完整,完成課程后學生不能將所學知識融會貫通;不注重培養學生的整體生物信息學思維。如何提高生物信息學課程的教學質量是教育教學改革的重要內容。

一、生物信息學的教學特點

1.是多學科、綜合交叉的產物。生物信息學是一門由計算機技術、數學、生物醫學多學科綜合交叉的新興學科,對本課程的學習,除了要求掌握獲取和利用大量生物數據信息的基本知識和技術外,還要求掌握相關的數學、物理學、計算機程序設計、分子生物學等醫學基礎知識相關的知識和技術,培養的是復合型、交叉型人才。

2.數據、信息量龐雜,發展迅速。目前生物信息數據處于高速的實時更新中,數據類型和內容相當豐富,同時亦包含大量的冗余及錯誤數據,僅GenBank數據庫就包含了來源于十多萬個物種的數據,除了人類還包括小鼠、擬南芥、水稻、斑馬魚、果蠅等模式生物及原核生物、病毒等數據。近十年來,核酸堿基數目大約每14個月就翻一倍,2014年1月2日,在Nucleotide數據庫中輸入Human,就可以獲取30 942 725條數據,而兩年前這數字僅為14 617 064。面對這么龐雜的海量數據,教學內容必須圍繞方式、方法來展開。

3.教學及課后學習應用必須在網絡環境中進行。海量的數據均存儲在網絡環境下的數據庫中,信息的獲取、分析和處理都必須通過Internet網絡來實現。因此教學活動亦必須圍繞網絡環境展開,利用網絡,傳授學生獲取數據信息并開發和利用的技能,強化操作訓練,增強學生分析解決問題的能力。綜合來說,生物信息學的教學內容豐富,教學方法多樣,考核評價及教學效果反饋復雜,因此,傳統的學習評價不能適應生物信息學教學的發展。

二、形成性評價的內涵

形成性評價(Formative assecssment)是1967年由美國的評價學專家斯克里芬(M. Scriven)提出的,后被美國的教育學家布盧姆(B.S.Bloom)應用于教學領域。指在教育活動中,即學生知識、技能及態度的形成過程中檢測學生的進步,監控學生知識與技能的獲得,評價學生的學習進展情況,最終通過反饋來調整教學以提高教學質量。形成性評價是在教學過程中為了獲得有關教學的反饋信息,改進教學,使學生知識達到的掌握程度所進行的系統性評價。

三、形成性評價應用于生物信息學的優勢

形成性評價強調的是對教和學過程進行多層次、多元化的分析和判斷,促進教和學過程的完善和發展,同時,形成性評價還強調對學生的學習過程進行評價,它不僅從評價者的需要出發,更注重從被評價者的需要出發,重視學生在學習中的體驗,重視師生間的交流,使學生在評價中能正確了解自我、完善自我,利于培養學生的自主學習能力。

1.評價貫穿整個學習過程,符合生物信息學內容的復雜性。生物信息學內容豐富、龐雜,更新快,傳統的終結性評價只考察學生掌握的部分內容,因此評價過于片面,而形成性評價貫穿在學生學習的整個過程,對學生日常學習過程的表現、所取得的成績及所反映的情感、態度、學習策略等方面做出評價,更符合生物信息學的教學工作。

2.評價主體更加多元,激發學生學習主動性,有益于生物信息學技術的自主學習。傳統的終結性評價主要是教師對學生的評價,學生往往處于被動狀態,無法激發其學習興趣。形成性評價則強調學生的主動參與,使學生成為積極評價的主體,加強評價者與被評價者之間的互動,鼓勵學生自我評價與同學間互評,促使他們不斷回顧和反思自己的學習過程及方法,從而進一步培養學生學習的主動性與積極性。這點與生物信息學課程的教學方法多樣性不謀而合,激發學生的自主學習、多方法、多手段綜合運用的能力。

3.評價結果更全面,更符合生物信息學教學目標。終結性評價常以一次或少數幾次測試來批判,重知識輕能力,重片面的知識結果輕學習過程,而形成性評價的內容貫穿整個教與學的過程,不僅注重學生對知識的掌握情況,而且也重視評價學生的學習態度、策略及情感因素,因此更全面更科學。

4.評價結果的反饋作用更有針對性,有利于及時調整教學方法。形成性評價能及時準確地反映學生在一定階段的學習情況,給學生及教師提供及時的反饋,更有針對性地幫助學生建立自信心,激發和培養學生的學習興趣及良好的學習習慣,同時可以使教師及時了解學生的學習情況和需要,以便調整教學內容,改進教學方法,從而提高教學效果。

四、形成性評價在生物信息學教學中的應用策略

1.統一規劃,制定綜合評價方案。開課之初,制定詳細的學習評價體系,將該學期的學習教學大綱及課程進度表發給每一位同學,由學生及教師共同參與制定學習計劃及學習評價表,每一部分分別由教師評價、學生自評、和小組同學互評三項構成。教師需事先給出評價范例和評估標準,對標準進行合理的描述和解釋,以便學生對照執行。在每次自評及互評后,教師應利用E-mail及QQ等在線工具及時的將結果反饋,指出評價過程中的問題及改進的意見。評價方案獲得學生的認可方能使學生樂于參與,樂于反思和改進自我,并在評價中體驗成功和快樂。

2.建立學習及評價小組。生物信息學的學習方法、獲取數據信息的手段很多,學習小組的成立有利于在學習過程中及時交流、相互學習促進和共同解決問題,小組成員間相互更為了解,可以開展課堂學習及課外自主學習的監控和評估,并保證學生互評環節的順利開展。每次互評將根據參與程度、合作行為、知識掌握程度等記錄在冊,教師亦應關注和指導小組評價工作的開展,并及時做好小組成員間的協調工作。

3.建立學生學習檔案。生物信息學課程基本都依賴網絡來完成,每次課堂學習后練習、學生間討論及學生自評互評等都以電子檔案的形式保存,可以包括文字、圖片、聲音、視頻等。學習檔案體現了學生的整個學習過程,展示學生努力學習后所取得的進步和成績,也客觀地反映學生的不足,有利于學生形成自我反思和自我評估,有助于培養獨立的自我學習習慣,增強參與感和學習積極性。

4.綜合成績評定。在學期末,根據學生學習的全過程,將對學生學習狀態的監控納入最后的成績評定,制定合理的比例方案,用綜合成績評定取代單一的終結行評定方法,更全面的評價學生。

綜上所述,形成性評價體系更適應生物信息學教學特點,有傳統評價無法比擬的優點,但同時增加了教師的工作量,無形中實施難度亦加大。為了更好地實施形成性評價,首先應明確的是,這不是教師個人的問題,學校、院系及各部門均應統一認識,建立從上而下的評價機制和比較完善的教學管理及學分管理制度。其次,健全教師參與形成性評價的激勵制度,解決教師業績考核等制約形成性評價實施的因素,建立具體的獎勵制度使教師自覺納入形成性評價,優化課題教學模式。最后,鼓勵教師以團隊形式參與形成性評價教學改革,分享教學經驗,探討教學問題,進一步提高教學效果。

參考文獻:

[1]石曉衛,李永海.淺議高校生物信息學教學改革[J].科技信息,2011,(8):89-89.

[2]胡建平,楊彩萍.生物信息學教學內容改革研究[J].安徽農學通報.2012,18(15):173-175.

[3]謝娜.論形成性評價在大學英語教學中的應用[J].國家教育行政學院學報,2010,(7):74-77.

[4]駱巧麗.網絡教學模式下大學英語教學評價體系的構建[J].四川教育學院學報,2010,26(3):95-98.

第9篇

>> 人組蛋白去乙酰化酶11的克隆表達與生物信息學分析 FZ6基因及其蛋白的生物信息學分析 擬南芥和大白菜YABBY蛋白家族的生物信息學分析 斑馬魚TATA結合蛋白的生物信息學分析 黃瓜DVR基因的生物信息學分析 金鐵鎖糖基轉移酶PtT1的克隆與生物信息學分析 黃芩葡萄糖醛酸水解酶基因的克隆、生物信息學分析及表達 蓖麻油體固醇蛋白質的鑒定與生物信息學分析 結核分枝桿菌38kDa蛋白結構與功能的生物信息學分析 新疆細粒棘球絳蟲EgAgB8/3蛋白的生物信息學分析及意義 棉鈴蟲的巧防技術 太子參分解代謝關鍵酶8′羥化酶基因的克隆及生物信息學分析 紅白忍冬SABATH甲基轉移酶基因克隆及其生物信息學分析 希金斯炭疽菌腺苷酸環化酶生物信息學分析 丹參類貝殼杉烯氧化酶(SmKOL)基因全長克隆及其生物信息學分析 唇形科植物腳6基腳6基焦磷酸合酶編碼基因及其氨基酸序列的生物信息學分析 人ALK-1近端啟動子的生物信息學分析 酵母轉錄因子結合位點保守性的生物信息學分析 玉米谷胱甘肽過氧化物酶的生物信息學分析 歐文氏桿菌鐵代謝相關基因的生物信息學分析 常見問題解答 當前所在位置:l)分析棉鈴蟲類胰蛋白酶氨基酸序列的理化性質;運用DNAMAN軟件比對分析氨基酸序列同源性;運用MEGA 5.0中的Fhylogenetic Tree方法構建分子系統發育樹;運用在線工具ProtScale ()進行親、疏水性的分析;運用Psort在線工具()進行蛋白質二級結構的分析預測;運用NCBI數據庫中CDD在線工具(http://ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi)進行功能結構域的分析。

2 結果與分析

2.1 棉鈴蟲類胰蛋白酶氨基酸序列理化性質分析

運用ProtParam在線軟件分析棉鈴蟲7種類胰蛋白酶氨基酸序列理化性質,結果見表1。由表1可知,棉鈴蟲7種類胰蛋白酶在理論等電點、脂溶指數以及氨基酸組成等方面均表現出相似性。其相對分子質量約為70 000,等電點約為5.00,氨基酸數目為253~256,Ala、Cys、Gly和Thr殘基含量較高。7種類胰蛋白酶的不穩定系數均較高,其中類胰蛋白酶Ⅲ的不穩定指數最低,為52.08,表明類胰蛋白酶在棉鈴蟲細胞內的穩定性較差,推測類胰蛋白酶代謝較為活躍,代謝周轉的速度較快。棉鈴蟲7種類胰蛋白酶的脂溶指數均較低,屬于親水性蛋白質。

2.2 棉鈴蟲類胰蛋白酶氨基酸序列磷酸化位點預測分析

使用NetPhosk 2.0 Server在線工具對棉鈴蟲7種類胰蛋白酶的氨基酸序列分別進行預測Ser、Thr與Tyr位點處發生磷酸化的概率結果見表2。從表2可見,在氨基酸磷酸化位點中Ser的預測分值最高,表明Ser發生磷酸化的概率最高,并且發現類胰蛋白酶Ⅲ中不具有Thr磷酸化位點;只有類胰蛋白酶Ⅴ具有Tyr磷酸化位點。以類胰蛋白酶Ⅲ為例進行說明:其氨基酸序列在第83位、243位、246位、247位這4個Ser位點處都有可能發生磷酸化,但第247位Ser發生磷酸化的概率最大,為M3=0.973。

2.3 棉鈴蟲類胰蛋白酶氨基酸序列分子進化樹分析

使用MEGA 5.0中的Fhylogenetic Tree方法構建分子系統發育樹結果見圖1。由圖1可知,7種類胰蛋白酶分為兩個分支,類胰蛋白酶Ⅰ、Ⅱ、Ⅶ與Ⅴ處于一個分支,類胰蛋白酶Ⅳ、Ⅲ與Ⅵ處于另一個分支。其中,類胰蛋白酶Ⅰ和類胰蛋白酶Ⅱ進化關系較近,類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進化關系較近。

2.4 棉鈴蟲類胰蛋白酶的氨基酸序列分析

1)使用TMHMM 2.0在線工具對7種類胰蛋白酶的氨基酸序列跨膜結構進行預測分析,均不存在跨膜結構域。

2)使用ProtScale工具對7種蛋白酶的親、疏水性進行分析。7種類胰蛋白酶的總平均親水性為0.860~0.960,均表現為親水性。其中,多肽鏈靠近N末端區域親水性最強,最低分值為-0.500到-0.600,而C末端區域疏水性最強,最高分值為2.100到2.300。

3)用DNAMAN軟件比對分析7種類胰蛋白酶的氨基酸序列同源性(圖2)。在這7種蛋白酶氨基酸序列中,有較多保守的區域(如圖2中深顏色區域所示)。經過分析發現,7種類胰蛋白酶氨基酸序列結構相似,同源性最高為85.71%。7種類胰蛋白酶中均含有高度保守的必需氨基酸殘基,參與維持蛋白酶的空間結構及行使催化功能。比如第10、54、70、179、196、207與231位的Cys殘基,它們之間能夠形成二硫鍵以穩定蛋白酶的空間結構。第205位的Asp殘基與228、238位的Gly殘基能夠與底物形成離子鍵、氫鍵,參與類胰蛋白酶對底物的識別與結合。第69位的His殘基、114位的Asp殘基與211位的Ser殘基組成了類胰蛋白酶的催化基團,通過電子的傳遞,與底物分子中的Arg和(或)Lys殘基羧基端肽鍵發生親核反應,實現催化功能(氨基酸殘基位置以類胰蛋白酶Ⅲ為準)。

2.5 棉鈴蟲類胰蛋白酶的功能結構域分析

使用NCBI數據庫中CDD在線工具對類胰蛋白酶Ⅲ進行功能結構域分析(圖3)。結果表明,類胰蛋白酶Ⅲ屬于胰蛋白酶超家族,具有該家族特有的功能區域。類胰蛋白酶Ⅲ的16位(Ala)與17位(Arg)氨基酸殘基之間含有一個自剪切位點(Cleavage site),該位點與酶翻譯后的活化及轉運有關;69(His)位、114(Asp)位、211(Ser)位氨基酸殘基構成酶的催化位點(Active site);205(Asp)位、228(Gly)位、238(Gly)位氨基酸殘基形成3個底物結合位點(Substrate binding sites),參與酶對底物的識別與結合,其他類胰蛋白酶的分析也得到相似的結果。

2.6 棉鈴蟲類胰蛋白酶的亞細胞定位分析

亞細胞定位預測結果見表3。由表3可以看出,類胰蛋白酶Ⅰ、Ⅱ主要位于內質網中,類胰蛋白酶Ⅲ主要位于內質網、液泡及細胞外基質中,而類胰白酶Ⅳ、Ⅴ、Ⅵ與Ⅶ主要位于細胞外基質中。亞細胞定位的多樣性體現了類胰蛋白酶在棉鈴蟲生命活動過程中具有多樣性的生物學功能,其中類胰白酶Ⅲ、Ⅳ、Ⅴ、Ⅵ與Ⅶ主要發揮消化作用,因為棉鈴蟲對食物的消化場所主要位于中腸(細胞外)。而類胰蛋白酶Ⅰ、Ⅱ與Ⅲ可能主要行使免疫保護作用,參與棉鈴蟲對外界環境的免疫應答。

2.7 棉鈴蟲類胰蛋白酶的二級結構分析預測

利用NPSA在線工具預測類胰蛋白酶的二級結構(表4)。由表4可知,無規卷曲是該類胰蛋白酶整體結構中的主要組成結構元件,β轉角出現概率相對較小。α螺旋主要分布于氨基酸序列兩側,而無規卷曲、延伸鏈則主要分布在多肽鏈中間區段。

3 小結與討論

本研究以棉鈴蟲腸道內7種類胰蛋白酶為研究對象,運用在線工具對其進行生物信息學分析。結果表明,7種類胰蛋白酶理化性質較為相似,為親水性蛋白酶。Ser是類胰蛋白酶序列中磷酸化概率最大的氨基酸殘基。分子系統發育樹結果顯示類胰蛋白酶Ⅲ與類胰蛋白酶Ⅵ進化關系較近,而類胰蛋白酶I和類胰蛋白酶Ⅱ在進化關系上更為接近。類胰蛋白酶不存在跨膜結構域,屬于基質類蛋白,這與其親水性的特點吻合。功能結構域分析發現類胰蛋白酶屬于胰蛋白酶超家族,其氨基酸序列中含有自切割位點、若干催化殘基與結合殘基。類胰蛋白酶的亞細胞定位具有多樣性,主要分布在細胞外與內質網中,這體現了類胰蛋白酶在棉鈴蟲生命活動過程中具有多樣性的生物學功能。二級結構分析預測表明無規卷曲在該類胰蛋白酶整體結構中所占比例最大,是其主要的結構元件。氨基酸序列同源性分析,7種類胰蛋白酶氨基酸序列的同源性較高,達到了85.71%,并且含有高度保守的必需殘基,參與維持蛋白酶的空間結構及行使催化功能,包括維持高級結構的Cys殘基,形成底物結合口袋的結合殘基及參與催化作用的催化殘基。依據此研究結果,能夠設計出與類胰蛋白酶活性中心特異性結合的抑制劑,抑制其活性,從而擾亂棉鈴蟲的正常消化,實現抗蟲目的。

參考文獻:

[1] 常團結,陳 蕾,路子顯,等. 棉鈴蟲幼蟲中腸類胰蛋白酶基因的克隆及在大腸桿菌中的表達[J]. 動物學報,2002,48(6):790-796.

[2] 任曉霞,韓召軍,王蔭長. 棉鈴蟲乙酰膽堿酯酶cDN段的克隆和序列分析[J]. 動物學報,2002,48(1):121-124.

[3] 郭線茹,蔣金煒,羅梅浩,等. 轉基因抗蟲煙草研究進展[J]. 昆蟲知識,2005,42(4):358-363.

[4] CHOUGULE N P, GIRI A P,SAINANI M N, et al. Gene expression patterns of Helicoverpa armigera gut proteases[J]. Insect Biochemistry and Molecular Biology,2005,35(4):355-367.

[5] KANG Z, JIANG J H, WANG D, et al. Kunitz-type trypsin inhibitor with high stability from Spinacia oleracea L. seeds[J]. Biochemistry (Moscow),2009,74(1):102-109.

[6] TELANG M A, GIRI A P, SAINANI M N, et al. Characterization of two midgut proteinases of Helicoverpa armigera and their interaction with proteinase inhibitors[J]. Journal of Insect Physiology,2005,51(5):513-522.

[7] TAMHANE V A, CHOUGULE N P, GIRI A P, et al. In vivo and in vitro effect of Capsicum annum proteinase inhibitors on Helicoverpa armigera gut proteinases[J]. Biochim Biophys Acta,2005,1772(2):156-167.

[8] BOWN D P, GATEHOUSE J A. Characterization of a digestive carboxypeptidase from the insect pest corn earworm (Helicoverpa armigera) with novel specificity towards C-terminal glutamate residues[J]. European Journal of Biochemistry,2004, 271(10):2000-2011.

第10篇

關鍵詞 高叢越桔;UFGT;電子克隆;生物信息學

中圖分類號 S662.2 文獻標識碼 A 文章編號 1007-5739(2017)06-0081-04

Analysis on Insilico Cloning and Bioinformatics of Vaccinium corymbosum UFGT Gene

XIN Xiao-juan 1 MA Wei 2 * LI Yu-cheng 3

(1 Daxing′ anling Academy of Agriculture and Forestry in Heilongjiang Province,Daxing′ anling Heilongjiang 165000; 2 Heilongjiang University of Chinese Medicine; 3 Daxing′ anling Forestry Administration)

Abstract [Objective]Using electronic cloning technology to predict UFGT gene of Vaccinium corymbosum.[Methods]Taking Vaccinium uliginosum UFGT sequence as the probe sequence,based on EST sequence from NCBI and assembled by CAP3 sequence assembly programme,using bioinformatics database and related software to predict the structure and function analysis.[Results]The full length of UFGT gene was 1 789 bp and it contained a 1 161 bp ORF,encoding 386 amino acid and the protein is a hydrophilic protein.[Conclusion]The study can provide theoretical and experi-mental basis for further explain of molecular genetic function.

Key words Vaccinium corymbosum;UFGT;insilico cloning;bioinformatics

高叢越桔(Vaccinium corymbosum)原產地為北美,是杜鵑花科(Ericaceae)越桔屬(Vaccinium)木本植物,比^適合在中國北方地區栽培,是經濟價值最高的優良品種,因其果實大、品質佳、口感好深受人們青睞[1]。

類酮類化合物在高等植物界分布廣泛,可以參與花、葉片及果實等顏色的形成,還具有抗炎、抗癌、抗氧化和保護心腦血管系統等多種藥理作用[2]。植物中的類黃酮-3-O-葡萄糖基轉移酶(UFGT)處于類黃酮合成途徑中,形成各種花色苷[3]。目前,科研人員已在葡萄、玉米、水稻、草莓、荔枝等植物上對UFGT基因進行了分析研究[4-5]。

電子克隆是一種基因克隆方法,具有高效、快速、投入低,并可以為實驗克隆提供精準的參考序列等優點[6-8]。

本研究基于電子克隆技術,對預測的高叢越桔的UFGT基因進行序列分析,從理化性質、亞細胞定位、氨基酸組成、信號肽、跨膜結構域等方面對該基因編碼的蛋白進行了預測,以期為進一步解釋基因的分子功能奠定理論及實驗基礎。

1 材料與方法

1.1 電子克隆獲得新基因序列

以篤斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)作為探針,使用Blastn工具檢索NCBI中與探針序列同源性較高的高叢越桔EST序列,使用在線工具CAP3[9]進行拼接,以拼接好的重疊群(Contig)為探針,再次Blast檢索,如此反復。

1.2 生物信息學分析

對預測的高叢越桔UFGT基因序列進行分析,具體在線生物信息學軟件如表1所示。

2 結果與分析

2.1 新基因的識別

以篤斯越橘UDP-glucose:flavo-noid 3-O-glucosyltran-sferase(UFGT)基因(KP218512)為探針,獲得全長為1 789 bp的Contig 1條,其開放閱讀框長度為1 161 bp,編碼386個氨基酸,具體見圖1。

2.2 高叢越桔UFGT基因編碼氨基酸一級結構預測

蛋白質是生命功能的執行者,分析蛋白質的氨基酸序列,是蛋白質研究的重要組成部分。基于蛋白質數據庫,通過在線軟件ProtParam[10],對高叢越桔UFGT基因編碼的氨基酸的一級結構預測見表2。

2.3 高叢越桔UFGT信號肽預測和分析

蛋白質的跨膜轉運主要依靠信號肽指導。采用SignaIP-4.1 Server[11],預測高叢越桔UFGT的信號肽,結果如圖2所示。可以看出,高叢越桔UFGT基因所編碼的蛋白質不存在信號肽,該蛋白不進行轉運。

2.4 高叢越桔UFGT蛋白疏水性/親水性分析

對高叢越桔UFGT編碼的氨基酸用ProScale在線軟件[12]進行親疏水性預測,一般負值越大表示蛋白親水性越強,正值越大疏水性越強,結果如圖3所示。可以看出,高叢越桔UFGT編碼的蛋白為親水性蛋白質,最小值-1.476,最大值1.205,這與一級結構預測的結果一致。

2.5 高叢越桔UFGT蛋白質跨膜結構預測

生物膜功能的主要承擔者為膜蛋白。通過在線跨膜蛋白結構預測TMpred軟件預測其蛋白質跨膜區和跨膜方向,結果如圖4所示。可以看出,該蛋白中存在3個跨膜區,即32-51、86-104、249-270氨基酸位置。

2.6 高叢越桔UFGT蛋白的亞細胞定位

蛋白質由位于細胞質中的核糖體合成之后,需要轉運到合適的位置才能正常行使其功能。基于蛋白質數據庫,使用Psort在線軟件[13]對高叢越桔UFGT蛋白進行亞細胞定位,具體結果見圖5。可以看出,該蛋白在細胞質和線粒體的概率是39.1%,在細胞核的概率是13.0%,在細胞液中有8.7%的概率,可能主要分布于細胞質和線粒體中。

2.7 高叢越桔UFGT蛋白的二級結構預測

蛋白質中約85%的殘基處于3種穩定二級結構,即α-螺旋、β-折疊和β-轉角。二級結構預測的目的是根據一級結構判斷殘基是否處于特定二級結構。基于蛋白數據庫,通過在線軟件SOPMA[14] 對高叢越桔UFGT蛋白進行二級結構預測,具體結果見圖6。可以看出,該蛋白質的二級結構主要由4種形式組成,即由α-螺旋占41.97%,無規卷曲占30.57%,延伸鏈占17.88%,β-轉角占9.59%。據此推測,α-螺旋是高叢越桔UFGT蛋白二級結構中數量最多的結構元件。

2.8 高叢越桔UFGT蛋白的三級結構預測

采用同源建模法,利用SWISS-MODEL在線軟件[15]對高叢越桔UFGT蛋白的三級結構進行預測,具體結果見圖7。可以看出,該蛋白主要有無規則卷曲、α-螺旋2種結構,同時還伴隨著延伸鏈、β-轉角2種結構,基本與二級結構預測結果一致。

2.9 蛋白質磷酸化位點分析

蛋白質翻譯后有精氨酸甲基化、磷酸化、ADP核糖基化、糖基化等多種修飾形式,其中,磷酸化是一種重要的共價修飾方式。利用NetPhos 3.1 Server在線軟件分析[16]的具體結果見圖8。可以看出,有15個絲氨酸(Ser)、10個蘇氨酸(Thr)、1個酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點。

3 結論與討論

目前,越桔具有較高的營養價值,且藥理作用正逐漸被人們認識[17]。越桔含有豐富的多酚類物質,如黃酮醇、酚酸和花青素。其中黃酮醇具有降低心血管和退化性疾病的風險能力[18]。花青素被證明具有減輕炎癥、降低血糖、影響脂質代謝和脂肪沉積、減少大分子的氧化損傷[19]等作用。

通過電子克隆技術預測高叢越桔UFGT基因,全長為1 789 bp,開放閱讀框長度為1 161 bp,編碼386個氨基酸。該蛋白為親水性的非分泌蛋白,且其中存在一處跨膜區。該蛋白主要由α-螺旋、無規則卷曲構成的二級結構,在細胞質和線粒體中分布的可能性最大,有15個絲氨酸(Ser)、10個蘇氨酸(Thr)、1個酪氨酸(Tyr)可能成為蛋白激酶磷酸化位點[20-21]。通過本研究預測的結果,為未來UFGT基因在高叢越桔中提取、克隆及基因功能方面的研究奠定基礎,同時也為電子克隆技術的廣泛應用提供參考。

4 參考文獻

[1] 趙建萍,柏新富,蔣小滿,等.北高叢越桔芽器官離體培養與快繁體系的建立[J].林業科學,2007,43(5):111-115.

[2] 周軍,姚泉洪,彭日荷,等.巨峰葡萄查爾酮異構酶基因克隆及表達分析[J].西北植物學報,2009,29(9):1723-1729.

[3] KOBAYASHI S,ISHIMARU M,DING C K,et parison of UDP-glucose:flavonoid 3-O-glucosyltransferase (UFGT) gene sequences be-tween white grapes(Vitis vinifera) and their sports with red skin[J].Plant Science,2001,160(3):543-550.

[4] 付海輝,辛培堯,許玉蘭,等.幾種經濟植物 UFGT 基因的生物信息學分析[J].基因組學與應用生物學,2010,30(1):92-102.

[5] 趙志常,胡福初,胡桂兵,等.荔枝類黃酮糖基轉移酶 (UFGT) 基因的克隆及其原核表達研究[J].廣西師范大學學報(自然科學版),2011,29(4):104-110.

[6] HUMINIECKI L,BICKNELL R.In silico cloning of novel endothelial-specific genes[J].Genome Research,2000,10(11):1796-1806.

[7] GILL R W,SANSEAU P.Rapid in silico cloning of genes using expressed sequence tags (ESTs)[J].Biotechnology annual review,2000,5:25-44.

[8] 王冬冬,朱延明,李勇,等.子克隆技術及其在植物基因工程中的應用[J].東北農業大學學報,2006,37(3):403-408.

[9] PHUANG X,MADAN A.CAP3:A DNA sequence assembly program[J].Genome research,1999,9(9):868-877.

[10] GASTEIGER E,HOOGLAND C,GATTIKER A,et al.Protein identifi-cation and analysis tools on the ExPASy server[M].Humana Press,2005.

[11] PETERSEN T N,BRUNAK S,VON HEIJNE G,et al.SignalP 4.0:disc-riminating signal peptides from transmembrane regions[J].Nature met-hods,2011,8(10):785-786.

[12] KYTE J,DOOLITTLE R F.A simple method for displaying the hydr-opathic character of a protein[J].Journal of molecular biology,1982,157(1):105-132.

[13] PSORT I I.PSORT:a program for detecting sorting signals in proteins and predicting their subcellular localization[J].J.Mol.Biol,1997,266:594-600.

[14] GEOURJON C,DELEAGE G.SOPMA:significant improvements in pr-otein secondary structure prediction by consensus prediction from mul-tiple alignments[J].Computer applications in the biosciences:CABIOS,1995,11(6):681-684.

[15] BIASINI M,BIENERT S,WATERHOUSE A,et al.SWISS-MODEL:m-odelling protein tertiary and quaternary structure using evolutionary in-formation[J].Nucleic acids research,2014:340.

[16] BLOM N,GAMMELTOFT S,BRUNAK S.Sequence and structure-ba-sed prediction of eukaryotic protein phosphorylation sites[J].Journal of molecular biology,1999,294(5):1351-1362.

[17] 李丹,林琳.越桔食品資源的開發與利用[J].食品與發酵工業,2000,26(4):76-81.

[18] 劉淑蘭,呂秀蓮,王曉軍,等.越橘的化學成分與藥理活性研究進展[J].中醫藥學報,2006,34(6):53-54.

[19] RISO P,KLIMIS-ZACAS D,DEL BO C,et al.Effect of a wild blueberry (Vaccinium angustifolium)drink intervention on markers of oxidative stress,inflammation and endothelial function in humans with cardiova-scular risk factors[J].European journal of nutrition,2013,52(3):949.

第11篇

人類基因組計劃的實施為分子生物學家提供了大量的生物組學數據,分析和處理這些數據以探索其中隱藏的生物學奧秘需要綜合利用數學、信息科學與物理學等知識,生物信息學由此應運而生[1]。它是分子生物學與上述學科交叉結合的產物,其研究已經滲透到生命科學的各個領域并極大促進了生命科學及相關學科的發展,已成為生命科學研究者強有力的輔助工具之一。國內很多醫學院校已開辦生物信息學課程,多種專業選擇其作為必修課或選修課。該課程旨在培養學生綜合運用生物信息學知識和方法進行生物信息提取、儲存、處理和分析的能力,但該課程的教學研究仍處于起步階段,缺乏完善的教學模式和有效的教學方法,如何在醫學院校開展生物信息學教學還有待進一步探索。

1 課程開設的重要性

生物信息學跨越了整個生命科學領域,是一門實用性很強的學科,也是未來生物醫學的重要研究工具。生物技術、計算機和互聯網的飛速發展引領了一個生物醫學大數據時代,生物信息學在生命科學領域的地位也愈發重要。利用生物信息學的知識和方法能夠深入挖掘和剖析海量生物學數據,進而探索隱藏在數據背后的生物學奧秘。無論是從分子生物學的角度闡述疾病病因,還是對疾病的預防、診斷、防治與藥物設計,生物信息學均發揮了十分重要的作用,掌握該課程的基本知識和理論無論對以后的科學研究還是從事一線醫務工作都具有比較深遠的意義。因此,在醫學院校部分專業(如:生物統計、藥學等)開設生物信息學課程具有重要意義。

2 生物信息學教學存在的問題

2.1 課程內容與教學課時不成比例

生物信息學是一門綜合性學科,理解和掌握該課程需要具有一定的計算機、數學和分子生物學等的背景知識。醫學院校學生普遍存在理科知識比較薄弱,因此,講解透徹該門課程需要教師在課堂上花費一定的時間普及相關背景知識。然而由于醫學院校學生課程門類眾多,客觀條件決定無法為生物信息學安排足夠多的課時。較之生物信息學繁多的內容而言,課時分配明顯不足。在課時相對較少的情況下,無法深入講解將每個章節的內容。

2.2 教學師資力量薄弱

生物信息學作為一門交叉學科,要求任課教師精通生物學、計算機和統計學等相關知識。由于國內生物信息學興起時間較短,培養人才數量有限,且有限的人才都流向了一流的學校,普通高校無法招到專業對口的教師。因此,能夠勝任生物信息學教學任務的老師十分匱乏。以該校為例,生物信息學課程沒有固定的任課教師,基本由生物學、醫學統計學教師完成,這些老師中大多數無法完全勝任生物信息學的教學任務。最終致使生物信息學教學質量不高。

2.3 教學模式落后

雖然多媒體已被廣泛應用于生物信息學的教學中,但由于該課程涉及內容多且有大量的數據庫和軟件知識,導致多媒體課件的容量非常大,教師在課堂上基本是照本宣科的讀完課件完成教學任務而已,忽略了學生的接受能力。這種教學模式雖然運用了先進的教學工具,但實質上采用的還是傳統的“灌輸式”教學,學生仍然是被動地學習。

2.4 實踐教學流于形式

生物信息學是一門實踐性很強的學科,實踐課程非常重要。然而在教學過程中,由于各種原因實踐課往往流于形式,原因主要包括:(1)教學設備及手段落后。雖然有些學校有計算機室,但計算機配置較低且未提供連網服務,生物信息學很多知識的學習需要借助互聯網,例如:各種數據庫、在線軟件等,導致學生無法親自操作而降低實踐課學習效果;(2)課時少、內容多。生物信息學的章節往往涉及到很多軟件和平臺,甚至有些軟件需要編寫程序。在實踐課時少的情況下,無法在短時間內讓學校親自操作每一種軟件。

3 教學改革

3.1 針對不同專業精選教學內容

針對生物信息學內容繁多的事實,應針對不同專業特點精心挑選課授課內容,在有限的課時中讓學生學到最基本且重要的生物信息學理論知識。另外,要善于挖掘課外時間,組建課外興趣小組,設置研究課題作為課外作業,鞏固和加深學生對生物信息學的理解。

3.2 培養和引進專業人才

教師知識的淵博程度和教學水平的高低對教學效果的影響十分明顯。因此,在教師隊伍建設上應采取“走出去,引進來”的措施,一方面挖掘該校教師的潛能,支持和鼓勵該校年輕教師到國內外知名高校訪學和進修,著力提高該校教師自身的知識素養與技能;另一方面提供豐厚條件引進國內外生物信息學高層人才,為生物信息學教學隊伍增添新鮮血液。此外,還可通過定期或不定期舉辦講座等方式創造機會加強該校教師及與兄弟院校的交流合作,加強學科建設,提高生物信息學教師的綜合素養。

3.3 推進“教、學、研”一體化創新教學模式

針對生物信息學課程的特點,一方面根據課程內容設計小型科研課題激發學生的科研興趣;另一方面鼓勵并指導學生申報學校、省級或國家級大學生科研項目,并鼓勵學生參與教師的科研項目,積極開展“教、學、研”一體化的創新教學模式,即融教師的“教”和學生的“學”,以及教師和學生共同參與到“研”的過程于一體[2]。通過這種教學模式能夠極大激發學生對生物信息學課程的興趣和創造力,促使學生快速高效地掌握生物信息學理論和實踐知識,有利于學生變被動的學習為主動探究式學習。與此同時,也能夠讓學生盡早地融入到生物學科學研究的大環境中來,學會合作、學會創造,真正地做到學以致用。

3.4 加強實驗課教學

生物信息學實驗課教學離不開計算機和網絡,加強實驗課教學需要在現有設備的基礎上,升級計算機配置,并為每臺計算機提供上網功能,保障實驗課教學順利進行。積極鼓勵學生自帶計算機,方便課后繼續學習。此外,充分利用發達的互聯網技術,創建網上教學平臺并將教學內容,最新分析軟件等傳遞給學生,通過教學平臺加強與學生的交流互動,及時解決學生學習過程中遇到的問題。在教學內容上,要精簡實驗課內容,選擇有代表性的軟件和數據庫進行深入講解,將其它的軟件、數據庫等相關知識設計成小型研究課題作為作業布置給學生,提高學生自主探索的學習能力。

第12篇

【關鍵詞】數學建模生物信息學教學

【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2014)05-0214-01

1. 引言

生物信息學是融合生命科學與數理科學的一門新興學科[1]。1995年在人類基因組計劃第一個五年總結報告中對生物信息學的定義是: “它是一門研究包括生物信息的獲取、處理、存儲、分發、分析和解釋等在內的所有方面,并綜合運用數學、計算機科學和生物學的各種工具,來闡明和理解大量數據所蘊含的生物學意義的新興的交叉學科。”隨著人類基因組計劃的完成,生物信息學的研究進入了后基因組時代,它已廣泛的滲透到生物、醫藥、農業、環境等各個相關研究領域中,成為生命科學和自然科學的重大前沿領域之一。目前,國內很多高等院校已經開設了生物信息學本科專業。

數學建模是一門綜合多門學科知識,集應用與能力培養為一體,有利于培養學生的創造意識和應用實踐能力的學科[2]。生物信息學專業的本科生在學習完基本的數理知識以及生物信息學專業基礎課后,通過數學建模課程的學習,能夠使學生綜合運用所學的知識解決實際問題,實現了從理論學習到實踐應用的跨越;使學生深刻體會到理論指導實踐,實踐進一步檢驗和完善理論的過程。本文對數學建模在醫學院校生物信息學專業的開展及具體的教學進行了實踐探索,目的是培養學生的建模思維和創新能力,為學生綜合運用所學知識解決實際問題以及今后的科研打下良好的基礎。

2. 教學實踐與探索

在醫學院校生物信息學專業的數學建模教學中,我們旨在通過體現學科特點的模型的學習以及實踐活動培養學生的建模思維、實際動手能力與創新能力。

2.1 精選模型,體現學科特點

在數學建模的教學中,我們主要通過學習已有的數學模型來完成整個課程的學習,包括問題的分析、模型的假設、模型的建立、模型的求解與分析以及后續的模型檢驗與應用等。因此如何選擇適當的模型成為教學中的首要問題。

在選擇數學模型時,除了注重模型需具有簡潔性和趣味性[3]以外,我們特別選擇了能夠體現醫學院校生物信息學專業特點的模型,與學生所學的專業緊密結合。如DNA序列分類模型、人類癌癥基因預測模型、人類疾病網絡模型等。此外,在選擇這些模型時注意建立的模型具有階梯性,即由淺入深,由簡到繁,以符合學生的邏輯思維。對于給定的實際問題,我們首先想到的是最簡單的模型,然后分析模型的局限性及產生的原因,進而尋找策略改進模型,如此形成一種階梯式的建模過程,最終使得建立的模型越來越接近實際問題,達到完善的地步。例如,對于DNA序列分類模型(2000年全國大學生數學建模競賽試題),我們可以先后構建特征密碼子概率分布判別模型、圖論最小生成樹模型以及向量空間直觀判別模型,這三個模型體現了模型逐步升級的過程。

2.2 逐步引導,培養學生建模思維

數學建模需要綜合運用多學科知識,這對于剛剛接觸建模的學生來說是比較困難的,需要逐步引導他們,培養建模思維。我們主要借助于具有階梯性的數學模型、多媒體教學,通過講解和討論穿插的教學模式來引導學生。

仍以DNA序列分類模型為例,對于給定的已知類別的序列和待分類的人工序列(序列較短)及自然序列(序列較長),首先想到的是從已知類別中提取特征,用特征對未知序列進行分類。通過討論,大部分學生很自然的想到選取序列中ATGC四個堿基的含量作為特征,但是這個特征很粗,結果發現很多序列用這個特征無法分類。接下來學生想到用密碼子,對64個密碼子進行分析提取特征,結果顯示此種特征對人工序列得到較好的分類效果,但不適用于自然序列。隨后基于上面的結果,進一步應用圖論中的最小生成樹模型解決問題,發現分類效果較好。此外,在討論中,有學生也提到了應用“與已知類別特征相近的物質歸到一類”的思想,運用二維向量夾角余弦進行分類,結果表明分類效果優于前兩種方法。在學習模型的過程中,我們邊講解邊引導學生思考問題,討論問題,并結合多媒體演示,環環相扣,這樣的學習方式往往引人入勝,充分調動了學生學習的積極性,培養了學生的建模思維。

2.3 教研結合,培養學生動手能力與創新能力

理論用于指導實踐,沒有實踐的理論是空洞的。在學習完別人建立的模型之后,我們要求學生自己動手解決實際問題,建立模型,正所謂的“依葫蘆畫瓢”。我們本著寓研于教,教研結合的思想,將科研中遇到的一些實際問題融入教學中,充分發揮學生的想象力與創造力。我們精選具有生物信息學專業特點、體現學科前沿的兩個實際問題作為建模試題,讓學生三人一組以論文形式完成。如我們選取了給藥方案(較簡單)和人類癌癥miRNA預測(較復雜)兩個實際問題作為建模試題。較簡單的問題讓學生利用實驗課的時間進行完成,較復雜的問題以作業形式讓學生利用課余時間完成,并將兩次建模的成績作為學生本門課程的最后成績。

這種考核方式不僅培養了學生動手能力與創新能力,而且讓他們體會到之前所學習的專業基礎課的意義所在。此外,學生們對科研問題創造性的思維往往超乎我們的想象,為我們生物信息專業的發展注入新的力量,也為學生后續從事相關領域的研究工作打下堅實的基礎。

3. 小結

筆者根據自己在醫學院校生物信息學專業數學建模課程的教學實踐,提出了幾點可行性的措施。本著寓研于教,教研結合的思想,通過精選體現學科特點的模型,采取講解和討論穿插的教學模式逐步培養學生的建模思維,利用建模試題培養學生實際動手能力與創新能力,取得了較好的教學效果。隨著生物信息學以及相關學科的不斷發展,生物信息專業的數學建模課程將更加富有挑戰性,我們將根據科學發展以及學生的反饋意見不斷修訂教學內容,豐富教學方法,提高生物信息學專業數學建模課程的教學質量,真正培養學生分析問題、解決問題的能力。

參考文獻:

[1]李霞,李亦學,廖飛.生物信息學[M],北京:人民衛生出版社,2010.

主站蜘蛛池模板: 西畴县| 木里| 迭部县| 南阳市| 长武县| 丹棱县| 祁门县| 黄浦区| 扶余县| 景宁| 汾阳市| 桦南县| 开封县| 广德县| 阿勒泰市| 龙山县| 莎车县| 平乡县| 湛江市| 阜新| 阿克| 大英县| 社旗县| 岳西县| 寿宁县| 永和县| 永年县| 海晏县| 双辽市| 嘉定区| 娄烦县| 黄大仙区| 土默特左旗| 南城县| 涞源县| 项城市| 通城县| 台前县| 巴彦县| 台江县| 云阳县|