首先,要不斷地豐富EST資料庫。dbEST是目前最大的一個公共功能性序列資料庫,至1996年夏天,它已收集到40萬種EST序列。其中大多數序列是在默爾克(Merck)公司資助下由華盛頓大學的序列測定項目提供的。這個數目並不代表人類基因組中可表達基因的數目(6000到l00000個基因克隆),因為一個全長的CDNA可能產生幾個不重疊的EST片段。美國人類基因組科學公司據稱已得到了超過850000個EST片段的庫,與人類基因組的全部基因數已相差不多了。現在,國際資料庫中所貯存的EST的數量正以每日1000多個的速度增加著。
下一步就是將EST片段在人的基因組中定位。即將這些EST片段與某些疾病的易感位點聯繫起來,許多國家正在尋求合作,通過對這些EST片段進行染色體定位,繪製一個真正的"轉錄圖譜"。這樣,一旦確定了與某個疾病有關聯的位點,轉錄圖就可以告訴你在這個區域有哪些基因。是否所有的基因都能以EST片段的形式在染色體上得以定位呢?不是的。我們前面就已經知道EST片段是由mRNA經過反轉錄而來,不包括RNA的結構基因。此外,由於某些低水平表達的基因在構建CDNA文庫時可能不包括於其中,因而EST中也不能代表這些低水平表達的基因。這樣,RNA的結構基因以及低水平表達的基因就不能以EST的方式被定位到轉錄圖上。這個懸而未決的問題將隨著整個基因組序列的完成而得以解決。
有了一張總的轉錄圖,我們就可以了解某基因在不同的時間、不同組織的表達情況;可以了解不同組織中不同基因的表達;還可以了解正常條件下與異常狀況下基因表達的差異。因為一個EST本身就是某一特定具編碼功能的基因的部分序列,提供了克隆、分析功能基因的一個起點。它本身可作為基因診斷和基因克隆的一種工具,可用於發現一些新的細胞因子、新的受體和其他具有商業用途的蛋白質。關於EST的序列是否應公布於眾,EST序列能否申請專利問題的爭論也近乎白熱化。但無論如何,轉錄圖將同其他三張圖一起成為奠定ZI世紀醫學的基石,為破譯"基因"這部天書,認識和了解生命的真諦帶來一個質的飛躍。