
1、要分析一個重組事件,首先需要一些基礎軟件的支持,其中最重要的是mega。
2、打開一個.meg格式的文件:左擊鼠標open按鈕。
3、點擊頁面頂端options按鈕,進入General頁面選擇一系列參數:選擇你的序列是環狀還
是線性,檢測所需要的方法,建議選擇默認的選項(RDP,GENECONVandMAXCHI)你選
擇的方式越多,消耗時間越長。如果你分析的是小型數據(小于50個序列),你還可以
選擇CHIMAERA,BOOTSCAN和SISCAN。一般不使用LARD方法,除非在驗證重組時間
或檢測小于20個序列的數據時。再看右邊的選項,在你第一次分析數據時,應該選上
dintangleoverlappingevents選項,如果分析時卡住了再取消分析,把這個選項刪掉就
可以了。其他選項選擇默認就可以了
4、一旦所有選項都調試好之后,左擊主界面上的X-over按鈕開始進行重組分析。如果你認
為耗費的時間超出了你的預期,你可以點擊stop按鈕,如果你不想分析其中的某個序列,
可以點擊Sequencedisplay界面中右側序列的名字,左擊一下名字變灰,為mask這個序
列,即對這個序列不進行重組分析,但依然作為參考序列在做樹中顯示出來;左擊兩下
名字變白,disable這個序列,即完全除去這個序列。這樣的處理可以提高分析重組的能
力,集中精力分析你需要的序列。
5、分析完畢后出現四個界面,順時針方向依次為Sequencedisplay,Therecombination
informationdisplay.,Schematicquencedisplay以及Plotdisplay。下面分四個部分具
體講解。
uenceDisplay:
左擊序列中的部位可以顯示不同顏色代表的含義
鼠標懸空在某個核苷酸上會顯示出該核苷酸處于何序列的具體位置。右擊鼠
標可以保存不同形式你想要的序列。
Saveentirealignment.:保存整個比對結果,可以保存成多種形式。
Savealignmentwithrecombinantquencesremoved:保存沒有重組序列的比對
結果。即在plotdisplay板塊中為一個完整的長條的序列。
Savealignmentwithrecombinantcolumnsremoved.:將去除所有與重組相關的
序列,如果一個比對結果中與重組相關的序列太多,很可能結果是一個空白
或接近于空白。
Savealignmentwithrecombinantregionsremoved.:所有與重組相關的核苷酸
將被取代為—或.
Savealignmnetwithrecombinantregionsperated.:重組序列將被分割成兩部
分,一部分與重組無關,一部分是重組部分。可以分別與其他序列進行比對。
Splitalignmentintocommonmosaics.:具有同一重組鑲嵌體的序列和其余的非
重組序列被分裂為兩個單獨的比對結果。
Saveonlyenabledquences.:只有被enable的序列才會保存。這個選項有助
于手動將同一組的序列保存成新的比對結果。
Saveonlydisabledquences.:只有mask和disable的序列被保存下來
如果你想單獨分析某一組序列,右擊鼠標選擇lectgroups,點擊你想選擇的
序列,變為藍色即為選中,未選中的為黑色。
如果你想專門看某個序列,右鍵點擊goto,然后在schematicquencedisplay
中會顯示這個序列。
5、TheRecombinationInformationDisplay
這些信息包括用于檢測的方法,重組事件的編號,可能的斷點,序列的名字,可能的突變
位點,與該重組毒株密切相關的,可能父母代的序列名字(主要和次要的父母)和次要父
母代毒株比主要父母代毒株與重組序列的關系更密切的概率,以及P值的大小。如果出
現以下情況,該界面還會出現warning標示(紅色):
(1)在比對序列中只有一個可能為父母代毒株的序列
(2)有可能(約30%或更大的可能)誤認為重組序列(即實際上父母代的序列中的某個才是真正的重組毒株)
如果是這樣會在后面顯示出實際上可能為重組毒株的父母代毒株的名字。
(3)無法識別出一個或全部兩個突變位點。
(4)一個或兩個突變位點是錯位的。
(5)重組信號微弱
(6)如果復合信號可能是一個分析錯誤的人工制品。
“confirmationtable”部分表明了用不同方法檢測出發生該重組事件的毒株數和關于目前
檢測到的重組事件的符合程度
Confirmationtable下面是一個總結性的柱狀圖,對于99%的用戶來說前三條柱狀圖代表的是有
用的信息。柱狀圖下面的分數大于60分代表這該毒株幾乎確定為重組毒株。大于40小于60的
分數代表軟件可能犯了錯誤,但也可能沒有。小于40表示該毒株很可能不是重組毒株。
6、Schematicquencedisplay
每一個長條都代表一個重組序列。不同的顏色可以代表不同的意思:
1.每一個最可能為重組事件供體的序列被賦予獨一無二的顏色。
2.用于檢測重組序列的方法。
3.他們相關的P值
4.它們與推測的父母代序列之間的關聯性大小。
可以通過cyclethroughdisplayoptions”button選項改變顏色。而這些顏色代表的意思可以通過左
擊擊灰色部分看到。
ematicquencedisplay
Currentview
Cyclethrough
displayoptions
Savesub-
alignment
Recombinant
region
Background
quence
右擊鼠標灰色部分可以將該圖拷貝到剪貼板或保存成.emf文件。
該圖表可以轉換三種模式(1)“ShowalleventsforquenceX”(quenceX是你的鼠標
距離最近的序列)(2)“Showonlybesteventsforallquences,”and(3)“Showalleventsfor
allquences.”就是有的重組事件可能用所有方法都可以檢測到,而有的重組事件只有一
到兩種方法可以檢測到。如果你選擇(2)的話只有最優的重組事件會顯示出來(即P
值最低)。你可以通過鍵盤上的pgDn和PgUp瀏覽重組事件。
在序列彩色條上右擊鼠標會出現一系列的選項,你可以通過“接受或不接受該重組事件”
選項來人為修改你認為RDP出現的錯誤,也可以將父母代供體和重組毒株相互調換,但
必須慎重,因為這個調換是不可恢復的,如果你要取消調換只能重新分析。而且,盡管
RDP可能出現錯誤,但它至少是一個客觀的判斷方法,沒有人的主觀性。所以,除非你
有充足的理由,否則不要隨便調換。
在你瀏覽這些重組序列的時候,應該時刻accept你認為正確的重組序列,這樣有利于你
記錄自己的進度,也有利于修改RDP的錯誤,因為一旦RDP在這里出現錯誤,那么它
在后面出現錯誤的幾率也會增大。所以,在accept之后就選擇選項欄的Re-Identify
recombinantquencesforallunacceptedevents,或者點擊下面的“Re-scan”按鈕重新進行
分析。
檢測RDP的誤差可以通過選擇showallevidences選項來觀察不同方法檢測到的重組事
件的breakpoints是否不同,如果不同的話就值得你人工去觀察到底哪個是正確的。如果
你認為兩個重組事件來源于一個祖代毒株,可以選擇通過Mergeevents選項將其合并為
一個重組事件
tDisplay
雙擊這個區域的任何位置都會在上方的quencedisplaypanel顯示出相應的序列。鼠標
tion8fordetailsonwhatisplotted.
Key
Plotdisplay
Presstoabortacheck
Presstolectmethod
P-valuecutoff
XandYcoordinates
ofthemoupointer
移動到任何位置都會顯示出X軸和Y軸的數值。
5.5TheTreeDisplays
如果你按下“tree”按鈕,一系列表示該重組毒株與其他毒株關系的樹將會以兩種不同的方式展示
如果單擊屏幕頂部在命令面板的“tree”按鈕兩棵樹將會并排顯示。而如果你按下
recombinationinformationdisplay上方的“Tree”按鈕則會在該區域顯示一株進化樹。
點擊右上角的“cyclethroughtrees”按鈕即可以用該序列的不同部分進行做樹分析。包
括:(1)根據重組序列的不同部分分別作樹(2)只有已確認的重組區域做樹(即用minor
parent部分)(3)只用已確認的非重組區域做樹(即majorparent部分)(4)忽略重組
的所有區域做樹。
在同一個頁面顯示兩棵樹可以追蹤一個序列在不同區域做樹后的變化,左擊
樹上的某個序列可以標記這個序列在樹上的位置。在樹的部位右擊會出現一系列
的選項,比如“清除顏色”“自動選擇顏色”“自主選擇顏色”等,可以把樹上
的序列分別弄上不同的顏色。你還可以選擇不同方法做樹,包括:neighbour
joining,leastsquares,maximumlikelihood,andBayesiantrees.
“Mark[quencename]asalsohavingevidenceofthivent”和“Mark[quencename]as
nothavingevidenceofthivent.”選項可以使你在樹上手動修改你認為RDP所犯的錯誤,
就是如果你認為這個序列不屬于這個重組事件你可以把它從該事件中剔除,或這個序列
本應屬于該重組事件,但RDP把他排除在外了,你可以認為把它加進去。
“Goto[quencename]”選項可以指引你在schematicquencedisplay板塊看到這個序
列。
”Recheckplotwith[quencename]asrecombinant/minorparent/majorparent”選項可以
使你看到如果你替換了重組序列/次要母本/主要母本(即樹中的紅色、藍色和綠色序列)
其中的一個序列后,進化樹會變成什么樣子。
TheMatrixDisplay
點擊主面板上的Matrix選項,就會顯示出矩陣圖像,有好多種矩陣的顯示方法供你選擇。
右擊鼠標或者點擊主面板上的下拉三角都可以選擇。
如果你確定一個重組事件真的發生了,這時你就要仔細檢查RDP有沒有準確判斷出重組
發生的位點,和有沒有夸大或過小分組的現象,你就要用其他RDP提供的附加應用進行
驗證。
可使用的方法簡介:
RDPmethod,GENECONV,Bootscanning,MaxChi,Cimaera,3SEQandSiScan.是7種基本驗證
程序,LARD,PHYLPRO,distanceplotsandTOPAL.是四種附加驗證程序。
RDP:
8.1GENECONV
Recordsignificantevidence
Moveaslidingwindowacross
Selectthreequences
Information-rich
Calculatesignificancewhere:
Repeatwiththenext
)(1-p)
Figure8.
ofrecombination
sub-quenceandcalculate
pairwiidentities
Multiplequencealignment
anddiscardall
non-informativesites
sub-quence
Checkforevidenceofrecombination
Gisthetotalnumberofofpossiblequencetriplets
ListheLengthofthequence
Nisthelengthoftheputativelyrecombinantregion
mistheproportionofnucleotidesincommonbetweentheputative
recombinantandparentalquencesintherecombiantregion
pistheproportionofnucleotidesincommonbetweentheputative
recombinantandparentalquencesintheentirequence.
threequences
(P=
N!
m!(N-m)!
pN
X
N-m
X
L
N
Σ
m=M
N
GX
AAGGCGATAGCAGGTAGGCTTATATTACGGCAT
AACGCGATTGCAGGAAGGCATATGTTATGGCAT
AAGGCGATAGCAGGTGGCCTTACATTATGGCAT
AAGGCGATTCCTGGAAGCCTTACGTAATGGCAT
AAGGTGATAGCAGGTAGCCTTACATAATCGCAT
AAGGCGATAGCAGGTAGGCTTACGTTATCGCAT
GAGATGTTATC
GTCTACTCGAT
CTGAAGATGTT
A
23043
Positioninalignment
1.0
0.5
0.0
P
ai
r
wi
s
e
i
d
e
n
t
i
t
y
1.07X10-6
Positionsofinformativesites
Potentialrecombinantregion
Majorparent:recombinantplot
Minorparent:recombinantplot
Minorparent:majorparentplot
P-Value
mple
pairwiidentityplot.
B
lookforregionsinthepairwi
fromthepolymorphic
Selectthenext
scoresbypermutationtestingand/
Recordsignificant
Figure9.
Using“fragmentscores”
alignmentwherequences
haveunusuallyhighsimilarity
Multiplequencealignment
Discardmonomorphicsites
Select2quences
sitealignment
AAGGCGATAGCAGGTAGGCTTATATTACGGCAT
AACGCGATTGCAGGAAGGCATATGTTATGGCAT
AAGGCGATAGCAGGTGGCCTTACATTATGGCAT
AAGGCGATTCCTGGAAGCCTTACGTAATGGCAT
AAGGTGATAGCAGGTAGCCTTACATAATCGCAT
AAGGCGATAGCAGGTAGGCTTACGTTATCGCAT
twoquences
GCAGATAGTTATCG
CCTGAAAGATGTTG
GCAGATAGTCGTTC
GTAGATACTCAATC
GCAGATGCTCATTG
GCTCTAACTCGATG
GCAGATAGTTATCG
CCTGAAAGATGTTG
Where:
Iisthenumberofidenticalsitesinafragment
Disthenumberonnon-identicalsitesinafragment
N
T
isthetotalnumberofpolymorphicsitesintheoriginalalignment
N
D
isTotalnumberofnon-identicalsitesinthequencepair
GistheG-scalevalue.
DxN
T
xG
N
D
Fragmentscore=I-
Calculatesignificanceoffragment
orcalculationofKarlin-Altshul
BLAST-likeP-values
fragments
Positioninalignment
Positioninalignment
Potentialrecombinantregion
Majorparent:recombinantHSAP
Minorparent:recombinantHSAP
Minorparent:majorparentHSAP
GlobalP-Valuecutoff
1763
3.3
1.6
0.0
-
L
o
g
(
K
A
P
-
V
al
u
e
)
LocalP-Valuecutoff
1763
3.7
1.8
0.0
-
L
o
g
(
K
A
P
-
V
al
u
e
)
Potentialrecombinantregion
GlobalP-Valuecutoff
LocalP-Valuecutoff
Highscoringalignedpair(HSAP)
exampleplotofhighscoringalignedpairs(HSAPsorfragments).CAn
exampleplotinwhichGENECONVisudtochecktheRDPderivedresult
inFig8B.
A
B
C
8.2Bootscanning
8.3
注意事項:RDP4只是一種檢測手段,也會出現很多的錯誤,不能完全依賴RDP4來判斷
重組。我們可以從以下幾方面入手來減少RDP4發生錯誤的概率:
1、盡量多收集與你最感興趣的序列同源性大于50%的序列,盡可能搜集全。
Recordsignificantevidence
centralpartitionacrossthepair-
fromthepolymorphic
recombinationbreakpoints
quencesorproceed
GAGATGTTATC
Whenallthreepairwiscansarecomplete
Repeatwiththenext
Figure11.
ofrecombination
Moveaslidingwindowwitha
wialignmentandcalculatea
2x2?2ofthedifferencebetween
theproportionsofsitesoccupied
bythesameanddifferentbas
oneithersideofthepartition
Multiplequencealignment
Select3quencesand
discardmonomorphicsites
Select2quences
sitealignment
Checkforevidenceof
Repeatwiththenext2
tothenextstep
AAGGCGATAGCAGGTAGGCTTATATTACGGCAT
AACGCGATTGCAGGAAGGCATATGTTATGGCAT
AAGGCGATAGCAGGTGGCCTTACATTATGGCAT
AAGGCGATTCCTGGAAGCCTTACGTAATGGCAT
AAGGTGATAGCAGGTAGCCTTACATAATCGCAT
AAGGCGATAGCAGGTAGGCTTACGTTATCGCAT
GAGATGTTATC
GTCTACTCGAT
CTGAAGATGTT
CTGAAGATGTT
checksignificanceofpeaksusing?2
P-valueand/orapermutationtestand
matchpeakstofindrecombinantregions
threequences
Positioninalignment
Positionsofinformativesites
Potentialrecombinantregion
Majorparent:recombinantplot
Minorparent:majorparentplot
UncorrectedP-Valuecutoff
MCcorrectedP-Valuecutoff
1763
6.9
3.4
0.0
-
L
o
g
(
P[
C
hi
2]
)
Minorparent:recombinantplot
23043
Positioninalignment
4.1
2.0
0.0
-
L
o
g
(
P[
C
hi
2
]
)
Potentialrecombinantregion
MCcorrectedP-Valuecutoff
UncorrectedP-Valuecutoff
ChisquareP-valueplot
A
B
C
alysisprocedurewhentheMaxChi
“scantriplets”e“scanentiredatatsimultaneously”
ttingisudtheanalysisprocedureisthesameexceptthatthereisonly
oneanalysiscyclewiththepolymorphicsitealignmentbeingproducedfrom
theentirealignment(insteadofitbeingproducedfromthecurrentlylected
triplet)BAnexampleofChisquaredP-valueplotsudtoconfirmtheRDP
mpleplotinwhichMaxChiisudtocheck
theGENECONVderivedresultinFig9B.
本文發布于:2023-03-09 14:10:25,感謝您對本站的認可!
本文鏈接:http://www.newhan.cn/zhishi/a/1678342225133132.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:重組分.doc
本文 PDF 下載地址:重組分.pdf
| 留言與評論(共有 0 條評論) |