8/23/2011

UniGene

人類基因組計畫的首要任務是對人類基因組進行全序列測定,整個基因組估計有30億個堿基對,其中大約3%可以編碼蛋白質,其餘部分的生物學功能還不清楚。轉錄圖譜可以把基因組中能夠編碼蛋白質的部分集中起來,因此是一種重要的資料資源。

UniGene試圖通過電腦程式對GeneBank中的序列資料進行適當處理,剔除冗餘部分,將同一基因的序列,包括EST序列片段搜集到一起,以便研究基因的轉錄圖譜。UniGene除了包括人的基因外,也包括小鼠、大鼠等其它模式生物的基因。資料庫的標題行(TITLE)給出基因的名稱和簡單說明,表達部位行(EXPRESS)指出該基因在什 麼組織中表達以及在基因圖譜中的位置等。此外,列出該基因在核酸序列資料庫GenBank或EMBL和蛋白質序列資料庫SWISS-PROT中的編號的超連結。
UniGene可以通過NCBI或SRS系統訪問,部分條目包括已知基因序列,而有些條目則僅有新測得的EST序列片段。這就意味著,這些EST序列所對應的基因尚未搞清,可以用來發現新基因。且有定點陣圖和表達資訊以及同其它資源的交叉參考,並以cluster形式在Unigene網頁下載,完整的資料可以從FTP網站repository/UniGene目錄下下載。在描繪基因圖譜及大規模基因表達分析等研究中,UniGene也可以幫助實驗設計者選擇試劑。

No comments: