同源
哺乳動物的前肢是同源構造的例子。
生物學中的同源
這裡相同的祖先既可以指演化論意義上的祖先,即兩個結構由一個共同的祖先演化而來(在這個意義上,蝙蝠的翅膀與人類的手臂是同源的),也可以指發育意義上的祖先,即兩個結構由胚胎時期的同一組織發育而來(在這個意義上,人類女性的卵巢與男性的睪丸同源)。
同源這一概念需與相似區分開來。比如說,昆蟲的翅膀、蝙蝠的翅膀和鳥類的翅膀是相似的,但卻不同源,這種現象被稱為非同源相似(或同形質,Homoplasy)。這些相似的結構由不同的渠道演化而來,這種演化過程叫做趨同演化Convergency)。
遺傳學中的同源
在遺傳學中,同源這一概念主要是指序列同源,表明兩個或多個蛋白質或DNA序列具有相同的祖先。同源的序列也很可能有相似的功能。兩個序列或者同源,或者不同源,不存在“同源度”這樣的概念。序列中同源的部分也被稱為保守的(conserved)。
蛋白質和DNA的同源性常常通過它們序列的相似性來判定,在生物信息學中尤其是如此。例如,如果兩個基因有著幾乎一樣的DNA序列,那么它們很可能同源,但也有例外:它們可能沒有共同的祖先,而為了適應綁定(bind to)某特殊的蛋白質的需要而演化成了一樣的形式(如轉錄因子)。這樣的序列是相似的,但卻不同源。
非專業人士偶爾會使用諸如“同源百分比”(percent homology)這樣的術語,這是不對的。“相似百分比”(percent similarity)這樣的術語的確存在,但只能用於衡量生物分子序列的相似性,而不能度量它們的同源性。不過,若有若干條序列只有一部分被認為同源(are presumed to share descent),我們可稱它們部分同源。
許多算法能夠將蛋白質序列聚類為若干族,每族裡的序列同源。
直系同源與旁系同源
同源序列可分為兩種:直系同源(orthology)和旁系同源(paralogy)。直系同源的序列因物種形成(speciation)而被區分開(separated):若一個基因原先存在於某個物種,而該物種分化為了兩個物種,那么新物種中的基因是直系同源的;旁系同源的序列因基因繁殖(gene duplication)而被區分開(separated):若生物體中的某個基因被複製了,那么兩個副本序列就是旁系同源的。直系同源的一對序列稱為直系同源體(orthologs),旁系同源的一對序列稱為旁系同源體(paralogs)。
直系同源體通常有相同或相似的功能,但對旁系同源體則不一定:由於缺乏原始的自然選擇的力量,繁殖出的基因副本可以自由的變異並獲得新的功能。
肌紅蛋白(myoglobin)和血紅蛋白(hemoglobin)被認為是古老的旁系同源體(ancient paralogs)。類似的,已知的四種血紅蛋白(血紅蛋白A,血紅蛋白A2,血紅蛋白S,和胎兒血紅蛋白)均互為旁系同源體。它們均能夠運輸氧氣
,但在功能上又有細微的分化:胎兒血紅蛋白(血紅蛋白F)比成年血紅蛋白對氧氣有更高的親和力。
另一個例子是齧齒動物(如老鼠)體內的胰島素基因。齧齒動物有一對旁系同源的胰島素基因,尚不清楚它們的功能是否分化。
旁系同源體常見於同一物種,但也不是絕對如此:人類的血紅蛋白和非洲黑猩猩的肌紅蛋白就是旁系同源體。這是使用生物信息學方法預測基因功能的一大困難:即使不同物種的基因同源,我們也不能立刻推斷它們具有相同或相似的功能,因為它們可能為具有不同功能的旁系同源體。
同源染色體對
二倍體細胞中的同源染色體對是一對匹配的染色體。它們分別來源於生物體的雙親。除開性染色體,同源染色體對中的兩條染色體有相當長的部分相似,通常也具有相同的基因序列。兩條性染色體的相似部分較其他染色體少。我們推測染色體是旁系同源體。