English  |  正體中文  |  简体中文  |  全文筆數/總筆數 : 4334/7631
造訪人次 : 3187861      線上人數 : 67
RC Version 3.2 © Powered By DSPACE, MIT. Enhanced by NTU Library IR team.
搜尋範圍 進階搜尋

請使用永久網址來引用或連結此文件: http://ir.hust.edu.tw/dspace/handle/310993100/1763

題名: 結合輸出錯誤校正碼與支持向量機對蛋白質結構作分類預測
作者: 黃淳德
貢獻者: 修平技術學院電機工程系
關鍵詞: 生物資訊;N字元編碼法;階層式的學習架構;錯誤校正輸出碼;支持向量機
日期: 2006-10-24
上傳時間: 2009-10-28T03:50:49Z
摘要: 生物資訊在二十世紀末,人類基因體計畫完成之後,已變成一個相當熱門的話題。因為它可以加速醫療與製藥的新觀念,加速生物技術的發展,同時帶動許多相關的產業。蛋白質是生命的基本元件,截至今日,已經有數以萬計的蛋白質被發現,而這個數目仍然在增加中。蛋白質的結構決定蛋白質的功能,因此正確而有效的區別蛋白質的結構將有助於瞭解它的功能,而這也是生物資訊學在蛋白質結構分類上的一個相當重要的課題。目前有一些蛋白質結構分類的資料庫已經被建構出來,但是他們都是利用人工或半自動的方法在處理分類的問題。在我們的研究中,首先我們將建立一個階層式的學習架構來進行機器學習,我們之所以以階層的方式來建構學習架構,是因為蛋白質結構的分類資料庫也是以相同的概念築構的。我們也將使用蛋白質結構資料庫作為學習的展示,同時我們的學習架構是可以由不同的學習機制所形成。其次,我們會嘗試去找出一個比較好的編碼方法,以便形成一組更能代表蛋白質序列的特徵值,以作為機器學習的訓練資料。我們在訓練的過程中也使用一般常用的百分比、轉換性、分佈性作為學習資訊。除此之外,N字元編碼法也是要被引進的方法,我們更發展了一套改良自N字元的全域的編碼法,這對於機器學習將有正面的幫助。在研究中,我們將會將錯誤校正輸出碼的概念結合支持向量機,以發展出一套複合式的學習方法,這個方法將有助於生物資訊的領域。我們相信用,這些改良的方法,對於蛋白質結構分類資料庫的蛋白質分類預測,可以達成較高的效率與較高的準確性,使得實驗室作業的時間得以縮短。;計畫編號:NSC94-2213-E164-008;研究期間:200508~200607
顯示於類別:[電機工程系(含碩士班)] 研究計畫

文件中的檔案:

檔案 描述 大小格式瀏覽次數
NSC94-2213-E164-008.pdf193KbAdobe PDF255檢視/開啟

在HUSTIR中所有的資料項目都受到原著作權保護.

 


DSpace Software Copyright © 2002-2004  MIT &  Hewlett-Packard  /   Enhanced by   NTU Library IR team Copyright ©   - 回饋