本書系統地介紹了進化算法在生物多序列比對中的應用,根據內容的分類,分為“多序列比對基礎篇”“多序列比對模擬篇”和“多序列比對參數篇”三個模塊。首先介紹生物多序列比對的基礎知識,包括多序列比對的基本概念、原理、方法、常用數據庫、常用工具和應用等內容,并介紹進化算法和化理論的基礎知識,以及遺傳算法、粒子群優化算法和量子粒子群優化算法的優化過程及收斂性分析,為進行多序列比對的模擬提供理論基礎;然后詳細介紹各進化算法模擬多序列比對的過程與結果;后對于多序列比對重要的目標函數參數進行建模與分析。本書具有系統性強、可讀性強、可操作性強等特點。
介紹生物多序列比對的基礎知識,包括多序列比對的基本概念、原理、方法、常用數據庫、常用工具和應用等內容,并介紹進化算法和化理論的基礎知識,以及遺傳算法、粒子群優化算法和量子粒子群優化算法的優化過程及收斂性分析,為進行多序列比對的模擬提供理論基礎;然后詳細介紹各進化算法模擬多序列比對的過程與結果;后對于多序列比對重要的目標函數參數進行建模與分析。本書具有系統性強、可讀性強、可操作性強等特點。
作 者 簡 介龍海俠 1980年生,2007年獲江南大學計算機軟件與理論碩士學位,2010年獲江南大學輕工信息技術與工程博士學位,現就職于海南師范大學信息科學技術學院,副教授。研究方向:群體智能算法、進化算法、生物信息。碩士期間從事群體智能算法和進化算法的研究及其在聚類、圖像分割上的應用研究;博士期間從事生物信息的研究,重點研究多序列比對和培養基的優化;近5年從事深度學習算法和生物信息的研究。已出版教材1部、專著1部,30余篇,主持省級課題2項,作為及時完成人獲得省級獎勵2項。
李滿枝 1979年生,2004年6月獲西北工業大學計算數學專業理學碩士學位,現就職于海南師范大學數學與統計學院,副教授。主要研究方向:生物信息學、計算機數值模擬、算法構造等。碩士期間從事基于蒙特卡羅方法的計算機模擬,近5年從事生物信息中的蛋白質功能預測研究。已在國內外核心期刊及學術會議上發表多篇論文,出版專著1部,并作為主要成員參與省級和自然科學項目多項,現主持海南省自然科學基金“生物多序列比對的遺傳算法模擬及改進”。 王洪濤 1978年生,2008年6月獲海南師范大學應用數學專業理學碩士學位,現就職于海南師范大學數學與統計學院,副教授。主要研究方向:計算機數值模擬、算法構造、數學建模等。在國內外核心期刊及學術會議上發表多篇論文,出版專著1部,并作為主要成員參與海南省自然科學基金項目多項,目前是海南省自然科學基金“生物多序列比對的遺傳算法模擬及改進”的第二參與人。
付海艷 1978年生,2002年獲山東大學人工智能與模式識別碩士學位,2009年獲山東大學系統理論博士學位,現就職于海南師范大學信息科學技術學院,教授。研究方向:評價理論與方法、決策理論與方法、不確定信息處理。碩士期間從事基于模糊集理論的評價方法和決策方法的研究,博士期間從事基于粗糙集理論和模糊集理論的不確定信息處理,近5年從事數據挖掘算法的研究。已出版教材2部、專著1部,30余篇,主持課題1項、省級課題6項,作為及時完成人獲得省級獎勵2項。
上篇 多序列比對基礎篇
第1章 生物多序列比對 3
1.1 生物信息學 3
1.1.1 生物信息學的起源 3
1.1.2 生物信息學的概念 4
1.1.3 生物信息學的主要研究內容 4
1.2 序列比對的概念及其發展歷史 8
1.2.1 序列比對的提出與基本概念 8
1.2.2 序列比對的目的和意義 8
1.2.3 國內外研究現狀 10
1.2.4 多序列比對面臨的挑戰 10
1.3 多序列比對的基本原理 11
1.3.1 多序列比對的相關概念 11
1.3.2 序列比對的分類 12
1.3.3 多序列比對的數學定義 13
1.3.4 多序列比對的打分方法 14
1.4 多序列比對方法 22
1.4.1 比對方法 22
1.4.2 多序列比對算法 23
1.5 多序列比對常用數據庫 33
1.5.1 綜合性數據庫 34
1.5.2 基準數據庫 36
1.6 多序列比對常用工具 40
1.6.1 搜索工具 40
1.6.2 常用的在線多序列比對工具 42
1.7 多序列比對的應用 45
1.8 其他說明 46
1.8.1 多序列比對算法存在的問題 46
1.8.2 多序列比對算法的運算指標 47
1.8.3 多序列比對算法的展望 48
1.9 本章小結 48
參考文獻 49
第2章 進化算法和化理論 53
2.1 進化算法 53
2.1.1 遺傳算法 53
2.1.2 遺傳規劃 54
2.1.3 進化策略 56
2.1.4 進化規劃 57
2.1.5 粒子群優化算法 58
2.1.6 量子粒子群優化算法 61
2.2 化理論 63
2.2.1 化問題 64
2.2.2 局部優化算法 66
2.2.3 全局優化算法 67
2.2.4 化問題的求解 67
2.3 本章小結 69
參考文獻 69
第3章 遺傳算法、粒子群優化算法和量子粒子群優化算法 73
3.1 遺傳算法 73
3.1.1 遺傳算法的基本思想 73
3.1.2 遺傳算法中的基本術語 74
3.1.3 遺傳算法的步驟及流程圖 75
3.1.4 遺傳算法的構成要素 76
3.1.5 遺傳算法的優缺點 82
3.1.6 遺傳算法的應用現狀 84
3.1.7 遺傳算法的改進 86
3.2 粒子群優化算法 87
3.2.1 基本粒子群優化算法 87
3.2.2 帶慣性權重w的粒子群優化算法 89
3.2.3 帶收縮因子 的粒子群優化算法 91
3.3 量子粒子群優化算法 92
3.3.1 勢阱模型的建立 92
3.3.2 粒子的基本進化方程 95
3.3.3 QPSO算法的流程 96
3.3.4 QPSO算法的收斂性分析 97
3.4 QPSO算法的改進——基于選擇操作的QPSO算法 103
3.4.1 引言 103
3.4.2 采用錦標賽選擇操作的QPSO算法(QPSO-TS) 105
3.4.3 采用輪盤賭選擇操作的QPSO算法(QPSO-RS) 106
3.4.4 算法的收斂性分析 107
3.5 本章小結 110
參考文獻 110
中篇 多序列比對模擬篇
第4章 遺傳算法在多序列比對中的應用 115
4.1 基本遺傳算法模擬多序列比對 115
4.1.1 引言 115
4.1.2 多序列比對問題及數學描述 117
4.1.3 算法設計 117
4.1.4 實驗算例與分析 120
4.1.5 結論 123
4.2 改進遺傳算法之初始種群優化 124
4.2.1 引言 124
4.2.2 優化原理 125
4.2.3 幾種初始化方法的構造 127
4.2.4 加入MAFFT種子的初始化 130
4.2.5 實驗算例與結果 130
4.2.6 結論 135
4.3 改進遺傳算法之交叉算子優化 136
4.3.1 引言 136
4.3.2 交叉算子設計 137
4.3.3 實驗算例與結果 140
4.3.4 結論 143
4.4 本章小結 144
參考文獻 144
第5章 QPSO算法在多序列比對中的應用 149
5.1 多序列比對的含義 149
5.2 基于二進制QPSO算法的序列比對 151
5.2.1 二進制的PSO算法(BPSO) 151
5.2.2 二進制的QPSO算法(BQPSO) 152
5.2.3 基于BPSO或BQPSO的多序列比對 156
5.3 本章小結 163
參考文獻 165
第6章 基于隱馬爾可夫模型和QPSO算法的多序列比對 167
6.1 引言 167
6.2 隱馬爾可夫模型 168
6.2.1 隱馬爾可夫模型的基本原理 168
6.2.2 隱馬爾可夫模型的基本問題與算法 169
6.3 基于剖面HMM和QPSO的多序列比對 172
6.3.1 融合多樣性的QPSO算法 174
6.3.2 評估訓練算法的質量 179
6.3.3 模型的聯配問題 179
6.3.4 評估比對序列的質量 181
6.4 本章小結 191
參考文獻 191
第7章 多序列比對的并行計算 193
7.1 長序列首尾分段并行比對算法 193
7.1.1 引言 193
7.1.2 構造原理 195
7.1.3 數值模擬結果 196
7.1.4 結論 198
7.2 本章小結 198
參考文獻 199
下篇 多序列比對參數篇
第8章 多序列比對的參數研究 203
8.1 基于SP目標函數的多序列比對參數研究 203
8.1.1 引言 203
8.1.2 基本定義 204
8.1.3 公式推導 206
8.1.4 實驗結果與分析 210
8.1.5 結論 217
8.2 在線工具MAFFT參數研究 218
8.2.1 引言 218
8.2.2 基本定義 220
8.2.3 實驗結果與分析 222
8.2.4 結論 229
8.3 本章小結 230
參考文獻 231
附錄 相關的源代碼 235
附錄A 基本遺傳算法總程序 235
附錄B 生成初始種群bio_var 239
附錄C 生成初始種群rand_var 243
附錄D 選擇算子selection 245
附錄E 橫向多行交叉算子hhor_crossover4to2 248
附錄F 縱向交叉算子ver_crossover4to2 253
附錄G 變異算子mutation 259
附錄H 適應度函數:SP函數 262
附錄I 多序列比對參數研究的相關程序 264
附錄J HMM和QPSO算法用于多序列比對的程序 266