本公開內(nèi)容提供了工程化dna聚合酶多肽及其組合物、以及編碼工程化dna聚合酶多肽的多核苷酸。本公開內(nèi)容還提供了使用工程化dna聚合酶或其組合物用于診斷、分子生物學和其他目的的方法。
背景技術:
0、背景
1、dna聚合酶是一類使用脫氧核糖核苷酸底物合成互補dna鏈的酶(ec?2.7.7.7)。每種生物體中存在顯示不同的性質(zhì)的多種類型的dna聚合酶,以及在不同生物體中存在不同的dna聚合酶。dna聚合酶在dna復制和修復中具有重要作用,這些功能對于維持遺傳完整性至關重要。除了它們的生物學作用之外,dna聚合酶是用于dna操縱的基本工具,dna操縱包括dna克隆、測序、標記、誘變、檢測和診斷以及其他。盡管所有dna聚合酶都具有合成脫氧核糖核苷酸鏈的能力,但不同的聚合酶具有不同的性質(zhì),包括穩(wěn)定性(例如,熱和/或化學穩(wěn)定性)、持續(xù)合成能力、保真度、核苷酸選擇性、敏感性和模板選擇性(例如,dna、rna等)的差異。
2、雖然許多不同的dna聚合酶是可用的,但希望具有顯示某些屬性的dna聚合酶,例如適用于不同用途(諸如用作分子生物學和診斷學中的工具)的某些水平的穩(wěn)定性、持續(xù)合成能力、保真度、核苷酸選擇性、敏感性和模板選擇性。例如,一些dna聚合酶不能有效地使用rna作為模板,因此需要使用單獨的酶(逆轉錄酶)來合成與rna模板互補的dna,然后可以被dna聚合酶識別。與dna聚合酶一起使用另一種酶的要求在用于檢測靶rna的診斷中插入了另外的步驟和復雜性。
技術實現(xiàn)思路
0、概述
1、本公開內(nèi)容提供了工程化dna聚合酶多肽及其組合物,以及編碼工程化dna聚合酶多肽的多核苷酸,其中工程化dna聚合酶具有dna聚合酶和逆轉錄酶活性,即能夠使用dna和rna作為模板。本公開內(nèi)容還提供了使用工程化dna聚合酶多肽及其組合物用于診斷和其他目的的方法。
2、本公開內(nèi)容的工程化dna聚合酶基于parageobacillus?genomosp?1(seq?id?no:540)的全長野生型dna聚合酶的大片段(seq?id?no:2),其中大片段包括dna聚合酶結構域,但缺少5’-核酸外切酶結構域。
3、在一個方面,本公開內(nèi)容提供了工程化dna聚合酶或其功能片段,所述工程化dna聚合酶或其功能片段包含與對應于seq?id?no:2、10、80、224或366的氨基酸殘基12至604的參考序列或與對應于seq?id?no:2、10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2、10、80、224或366的氨基酸殘基12至604的參考序列或相對于對應于seq?idno:2、10、80、224或366的參考序列包含一個或更多個取代。
4、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:2的氨基酸殘基12至604的參考序列或與對應于seq?id?no:2的氨基酸殘基12至604的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的氨基酸殘基12至604的參考序列或相對于對應于seq?idno:2的參考序列包含一個或更多個取代。
5、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的氨基酸殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的氨基酸殘基12至604的參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
6、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的氨基酸殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的氨基酸殘基12至604的參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
7、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代:21、24、25、25、34、36、52、58、66、68、81、84、92、101、105、114、115、124、133、133、134、136、144、152、154、168、183、184、191、192、210、212、221、226、230、241、252、253、276、287、290、294、295、300、304、322、325、372、373、374、393、427、432、452、454、456、462、470、483、486、495、505、509、541、541、545、547、551、552、573、575、578、584、585或593或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
8、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代:36、52、101、124、134、136、154、212、241、253、294、300、372、393、452、454、456、470、483、505、509、547、573或584或其組合,其中所述氨基酸位置是相對于對應于seq?idno:2的參考序列。
9、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置36、241、372或470或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
10、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代或取代集:509、300、452、36/241/372/470、124/192/210/372/427/456/552、124、52、483、372、393、212、52/66、133、454、154、593、462、541、21、573、505、152、294、545、101/241/470、584、304、295、578、456/470、253、290、192/241/372/456或252,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
11、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含表5.1、6.1、7.1、8.1和9.1中列出的工程化dna聚合酶變體的至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
12、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含表5.1、6.1、7.1、8.1和9.1中列出的工程化dna聚合酶變體的至少一個取代或取代集,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
13、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
14、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seqid?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
15、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或相對于對應于seq?id?no:10、80、224或366的參考序列包含一個或更多個取代。
16、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號seq?idno.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或相對于對應于seq?id?no:4-488的參考序列包含一個或更多個取代。
17、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代:21、24、25、25、34、36、52、58、66、68、81、84、92、101、105、114、115、124、133、133、134、136、144、152、154、168、183、184、191、192、210、212、221、226、230、241、252、253、276、287、290、294、295、300、304、322、325、372、373、374、393、427、432、452、454、456、462、470、483、486、495、505、509、541、541、545、547、551、552、573、575、578、584、585或593或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
18、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代:36、52、101、124、134、136、154、212、241、253、294、300、372、393、452、454、456、470、483、505、509、547、573或584或其組合,其中所述氨基酸位置是相對于對應于seq?idno:10、80、224或366的參考序列。
19、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置36、241、372或470或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
20、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10的殘基12至604的參考序列或與對應于seq?id?no:10的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?idno:10的殘基12至604的參考序列或相對于對應于seq?id?no:10的參考序列包含一個或更多個取代。
21、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10-218中偶數(shù)編號seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:10-218中偶數(shù)編號seq?idno.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10的殘基12至604的參考序列或相對于對應于seq?id?no:10的參考序列包含一個或更多個取代。
22、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代集:52/101/124/212/294/372/393/452/483/509、52/124/300/393/452、154/212/294/300/372/393/452/483/509、52/101/154/294/300/452/509/593、52/154/212/294/300/393/452、212/300/393/452/509、52/101/212/294/300/393/452/483/509/593、52/124/294/300/452/509、124/300/393/452/483/509/593、101/124/212/452/483/509、52/393/452/509/593、212/300/452/509/593、52/452/509/593、154/212/300/372/452/509/593、52/124/212/294/393/452/593、124/452/509、152/253/287/505/541/573/584、154/212/300/452、152/253/287/304/454/545/573/584、52/124/154/294/300/372/452/509、294/300/372/452/509/593、52/212/452、124/294/393/452、52/300/509/593、152/253/287/454/541/584、52/101/452/509、52/154/212/300/372/393/509、21/253/287/454/584、52/393/452、52/124/154/294/509、101/124/212/300/393、124/294/300/372/452/509/593、52/124/154/294/483/593、52/372/393/452/509/593、154/300/393/452/593、52/101/294/372/393/452/509、21/152/253/287/304/454/505、52/300/393、101/124/154/294/452/509、154/212/372/393/509/593、21/253/287/454/505/541、287/454/505/584、52/124/294/300/372/452、287/505/541/573、253/505/584、84/253/287/456/573、52/372/509/593、509/593、154/212/300/372/509、52/154/294/509/593、152/295/505/545/573、253/541/584、253/295/304/454/462/573/584、253/454/505/573/584、154/212/300、287/454/545/573、21/152/287/304/454、152/253/295/304/541/573、152/253/287/304/454、152/454/573、124/294/372/509/593、152/253/295/454、154/300/452、287/304/505、152/253/454/505、253/454/505、21/253/454/505/545、152/253/287/505、505/541/584或152/253/454/584,其中所述氨基酸位置是相對于對應于seq?id?no:10的參考序列。
23、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:80的殘基12至604的參考序列或與對應于seq?id?no:80的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?idno:80的殘基12至604的參考序列或相對于對應于seq?id?no:80的參考序列包含一個或更多個取代。
24、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:220-258中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:220-258中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:80的殘基12至604的參考序列或相對于對應于seq?id?no:80的參考序列包含一個或更多個取代。
25、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代或取代集:300/454/456/541/584、21/300/454/545/584、253/300/454/456/584、154/253/300/454/456/505/573、21/154/300/454/456/573、152/300/454/456/505/584/593、154/253/300/456/505/545/573/584、253/300/454/456/505/573、154/253/300/454/456/541/573/584、154/300/454/505、21/253/300/454/456/545/573/593、168/300/454/456/545/573、253/300/454/505/573、154/300/505/545/584、154/253/300/456/541/573/584、21/154/300/454/456/505/545、154/253/300/454/505、21/154/253/300/454/573、300/454/505/541/584、300/454/505/541/573、154/253/300/454、154/300/454/573、300/454/456/545/573、253/300/454/456、154/253/300/454/545/573、21/152/253/300/454/456/541/573、154/253/300/454/456/573、152/300/454、154/253/300/454/505/541/593、21/154/300/454/573/584、154/300/456/573/593、152/253/300/454/545/573、21/300/456/495/505/541/584、154/300/454/541/584、253/300/505/541/573/584、253/300/584、253/300/454/456/545、21/253/300/573、300/454/545、454/456/541/545/573/584、152/253/454/505/545/573、21/300/454/456/495、300/573、154/300/454/545、154/253/300/545/584、21/300/505、21/152/253/300/454/456/545、154/253/300/456/541/573、154/300/454、253/300/454/541、253/454/456/541/584、21/300/573、300/454/456、300/454、154/253/300/454/456、154/456/505/593、454/456/505、253/454/456/584、154/253/300、253/456/505/584、454/456、154/454、584、432/505/573、456/584、21/505/545/584、21/154/545/573、454/584或154/253/505或505,其中所述氨基酸位置是相對于對應于seq?id?no:80的參考序列。
26、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:224的殘基12至604的參考序列或與對應于seq?id?no:224的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seqid?no:224的殘基12至604的參考序列或相對于對應于seq?id?no:224的參考序列包含一個或更多個取代。
27、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:360-400中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:360-400中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:224的殘基12至604的參考序列或相對于對應于seq?id?no:224的參考序列包含一個或更多個取代。
28、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代集:144/154/505/547/573/584、154/191/325/505/573/584、144/154/373/374/505/573/584、134/136/154/505/547/573/584、81/144/154/505/547/573/584、154/505/573/584、144/154/191/230/322/505/573/584、68/144/154/505/573/584、144/154/226/230/505/573/584、144/154/374/486/505/573/584、81/114/144/154/505/573/584、144/154/276/505/573/584、134/144/154/505/573/584、144/154/505/573/584、81/144/154/183/505/547/573/584、68/81/133/134/144/154/505/547/573/584、144/154/374/505/573/584、92/133/144/154/505/573/584、144/154/373/505/573/584、114/144/154/505/573/584、154/505/551/573/584/585或81/154/505/547/573/584,其中所述氨基酸位置是相對于對應于seq?id?no:224的參考序列。
29、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:366的殘基12至604的參考序列或與對應于seq?id?no:366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seqid?no:366的殘基12至604的參考序列或相對于對應于seq?id?no:366的參考序列包含一個或更多個取代。
30、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:402-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:402-488中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:366的殘基12至604的參考序列或相對于對應于seq?id?no:366的參考序列包含一個或更多個取代。
31、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代或取代集:24/58/432、58/432/575、58/115/432/575、24/115/432/575、24/25/221/432、25/58/432/575、24/25/58/432/575、221/432/575、432/575、24/221/432、24/115/221/432、24/115/221/432/575、432、24/34/432、24/432/575、184/221/432/575、24/432、24/25/58/115/432/575、25/221/432、25/58/115/432、221/575、221/432、24/58/115/221/575、24/25/221/432/575、24/25/58/221/432、34/58/105/432、24/25/115/432、24/221/575、115/432、58/221、58/575、25/432/575、25/432、24/221/432/575、24/115/432、24/25/105/432、25/34/432、25/105/221/432、24/25/432、24/58/575或24/25/105/432/575,其中所述氨基酸位置是相對于對應于seq?id?no:366的參考序列。
32、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含表5.1、6.1、7.1、8.1和9.1中列出的工程化dna聚合酶變體的至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2、10、80、224或366的參考序列。
33、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含表5.1、6.1、7.1、8.1和9.1中列出的工程化dna聚合酶變體的至少一個取代或取代集,其中所述氨基酸位置是相對于對應于seq?id?no:2、10、80、224或366的參考序列。
34、在一些實施方案中,工程化dna聚合酶包含與含有表5.1、6.1、7.1、8.1和9.1中列出的工程化dna聚合酶變體的取代或取代集的參考氨基酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
35、在一些實施方案中,工程化dna聚合酶包含含有seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的氨基酸序列或包含seq?id?no:4-488中偶數(shù)編號的seq?idno.的氨基酸序列,任選地其中所述多肽在多肽序列中具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸序列中具有1個、2個、3個、4個、多達5個取代。在一些實施方案中,取代包括保守取代。
36、在一些實施方案中,工程化dna聚合酶包含含有seq?id?no:10、80、224或366的殘基12至604的氨基酸序列或包含seq?id?no:10、80、224或366的氨基酸序列,任選地其中所述氨基酸序列在氨基酸序列中具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。在一些實施方案中,所述氨基酸序列在氨基酸序列中具有1個、2個、3個、4個、多達5個取代。在一些實施方案中,取代包括保守取代。
37、在一些實施方案中,工程化dna聚合酶具有dna聚合酶活性,包括逆轉錄酶活性,并且與參考dna聚合酶或參考工程化dna聚合酶相比展示出一種或更多種改進的性質(zhì)。在一些實施方案中,工程化dna聚合酶與參考dna聚合酶相比具有選自以下的改進的性質(zhì):i)增加的活性,ii)增加的穩(wěn)定性,iii)增加的熱穩(wěn)定性,iv)增加的持續(xù)合成能力,v)增加的保真度,vi)增加的對輸入靶rna或dna的敏感性,vii)增加的等溫擴增反應中的產(chǎn)物產(chǎn)率,viii)增加的耐鹽性,和ix)增加的對抑制劑的抗性,或i)、ii)、iii)、iv)、v)、vii)、vii)、viii)和ix)的任何組合。在一些實施方案中,參考dna聚合酶具有對應于seq?id?no:2、10、80、224或366的殘基12至604的氨基酸序列或?qū)趕eq?id?no:2、10、80、224或366的氨基酸序列。在一些實施方案中,參考dna聚合酶具有對應于seq?id?no:2的殘基12至604的氨基酸序列或?qū)趕eq?id?no:2的氨基酸序列。
38、在一些另外的實施方案中,工程化dna聚合酶是純化的。在一些實施方案中,工程化dna聚合酶在溶液中提供或者被固定在底物上,諸如被固定在固體底物或膜或顆粒上。
39、在另一方面,本公開內(nèi)容提供了一種重組多核苷酸,其包含編碼本文公開的任何工程化dna聚合酶的多核苷酸序列。
40、在一些實施方案中,重組多核苷酸包含與對應于seq?id?no:1、9、79、223或365的核苷酸殘基34至1812的參考多核苷酸序列或與對應于seq?id?no:1、9、79、224或365的參考多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的多核苷酸序列,其中重組多核苷酸編碼工程化dna聚合酶。
41、在一些實施方案中,重組多核苷酸包含與對應于seq?id?no:3-487中奇數(shù)編號的seq?id?no.的核苷酸殘基34至1812的參考多核苷酸序列或與對應于seq?id?no:3-487中奇數(shù)編號的seq?id?no.的參考多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的多核苷酸序列,其中所述重組多核苷酸編碼工程化dna聚合酶。
42、在一些實施方案中,編碼工程化dna聚合酶的重組多核苷酸的多核苷酸序列是針對在生物體或其細胞類型,例如細菌細胞、真菌細胞、昆蟲細胞或哺乳動物細胞中表達進行密碼子優(yōu)化的。
43、在一些實施方案中,重組多核苷酸包含含有seq?id?no:9、79、223或365的核苷酸殘基34至1812的多核苷酸序列或包含含有seq?id?no:9、79、223或365的多核苷酸序列。
44、在一些實施方案中,重組多核苷酸包含含有seq?id?no:3-487中奇數(shù)編號的seqid?no.的核苷酸殘基34至1812的多核苷酸序列或包含含有seq?id?no:3-487中奇數(shù)編號的seq?id?no.的多核苷酸序列。
45、在另一方面,本公開內(nèi)容提供了包含本文提供的編碼工程化dna聚合酶的重組多核苷酸的表達載體。在一些實施方案中,表達載體的重組多核苷酸可操作地連接至控制序列。在一些實施方案中,控制序列包括啟動子,特別是異源啟動子。
46、在另一方面,本公開內(nèi)容還提供了用本文提供的表達載體或重組多核苷酸轉化的宿主細胞。在一些實施方案中,宿主細胞是原核細胞或真核細胞。在一些實施方案中,宿主細胞是細菌細胞、真菌細胞、昆蟲細胞或哺乳動物細胞。在一些實施方案中,宿主細胞是細菌細胞,諸如大腸桿菌。
47、在另外的方面,本公開內(nèi)容提供了一種產(chǎn)生工程化dna聚合酶多肽的方法,該方法包括將本文描述的宿主細胞在諸如產(chǎn)生至少一種工程化dna聚合酶的合適的培養(yǎng)條件下培養(yǎng)。在一些實施方案中,該方法還包括從培養(yǎng)基和/或宿主細胞回收或分離工程化dna聚合酶。在一些實施方案中,該方法還包括純化工程化dna聚合酶。
48、在另外的方面,本公開內(nèi)容提供了包含至少一種本文公開的工程化dna聚合酶的組合物,特別是用于進行體外聚合酶反應的組合物。在一些實施方案中,組合物包含以下中的一種或更多種:緩沖液、dna聚合酶底物,例如,一種或更多種核苷酸底物(例如,dntp或其類似物)和/或寡核苷酸引物底物。在一些實施方案中,組合物包含至少一種dna或rna模板,例如樣品中的靶dna或rna。
49、在另一方面,本公開內(nèi)容提供了工程化dna聚合酶在制備靶核酸(整體或部分)的互補dna拷貝的方法中的用途。在一些實施方案中,制備靶dna或rna(整體或部分)的互補dna的方法包括在存在適當?shù)孜锏那闆r下,在適合于dna聚合酶介導的產(chǎn)生與靶dna或rna互補的dna的條件下,使靶dna或rna與本文描述的工程化dna聚合酶接觸。
50、在一些實施方案中,工程化dna聚合酶用于檢測靶核酸,該方法包括在存在適當?shù)孜锏那闆r下,在適于dna聚合酶介導的產(chǎn)生與靶核酸(整體或部分)互補的dna的條件下,使懷疑含有靶核酸的樣品與本公開內(nèi)容的工程化dna聚合酶接觸,并檢測互補dna的存在。在一些實施方案中,靶核酸是dna或rna。在一些實施方案中,樣品是生物樣品或環(huán)境樣品。在一些實施方案中,檢測互補dna通過擴增互補dna進行,諸如通過等溫擴增或聚合酶鏈式反應。
51、在另外的方面,本公開內(nèi)容還提供了包含本文公開的至少一種工程化dna聚合酶的試劑盒。在一些實施方案中,試劑盒還包含緩沖液、核苷酸底物和/或寡核苷酸引物底物中的一種或更多種。在一些實施方案中,試劑盒還可以包含核酸模板,諸如dna或rna模板。在一些實施方案中,試劑盒可以包含第二dna聚合酶,例如熱穩(wěn)定dna聚合酶。
52、詳述
53、本公開內(nèi)容提供了工程化dna聚合酶多肽及其組合物、以及編碼工程化dna聚合酶多肽的重組多核苷酸。本公開內(nèi)容還提供了使用工程化dna聚合酶多肽及其組合物用于診斷、分子生物學和其他目的的方法。在一些實施方案中,本文描述的工程化dna聚合酶多肽可以使用dna作為模板或rna作為模板(即,逆轉錄酶活性),該工程化dna聚合酶多肽具有一種或更多種改進的性質(zhì),包括改進的聚合活性、改進的復制保真度、改進的持續(xù)合成能力(特別是在涉及低濃度的靶dna或rna輸入的條件下)、增加的對抑制劑的抗性和增加的耐鹽性以及其他。
54、在一些實施方案中,本公開內(nèi)容的工程化dna聚合酶在使用來自樣品的少量dna或rna,包括無細胞dna或rna、循環(huán)腫瘤dna或rna、從循環(huán)腫瘤細胞分離的dna或rna、循環(huán)胎兒dna或rna、從病毒感染的細胞分離的dna或rna、細針抽吸物、通過facs(熒光激活細胞分選)分離的單細胞和環(huán)境樣品(例如,水、下水道洗脫液、空氣等)的診斷和研究應用中特別有用。然而,本公開內(nèi)容使用的樣品不旨在限于任何特定的樣品類型,因為任何合適的樣品,包括具有低靶dna或rna濃度的那些,都可與本文的工程化dna聚合酶一起使用。
55、縮寫和定義
56、除非另外定義,否則本文使用的所有技術和科學術語通常具有與本發(fā)明所屬領域普通技術人員通常理解的相同的含義。通常,本文使用的命名法和下文描述的細胞培養(yǎng)、分子遺傳學、微生物學、有機化學、分析化學和核酸化學中的實驗程序是本領域中熟知的并且普遍地采用的那些。這樣的技術是熟知的,并且在本領域技術人員熟知的許多教科書和參考著作中進行了描述。對于化學合成和化學分析使用了標準技術或其修改形式。
57、此外,本文提供的標題不應被解釋為對本發(fā)明的各個方面或?qū)嵤┓桨傅南拗?,而應參考整個申請來看待。因此,下文即將定義的術語通過參考本技術作為整體而被更充分地描述。
58、此外,如本文使用的,單數(shù)“一(a)”、“一(an)”和“該(the)”包括復數(shù)指代,除非上下文另外明確指示。
59、如本文使用的,術語“包含(comprising)”及其同根詞以其包含性含義被使用(即,等同于術語“包括(including)”及其相應的同根詞)。
60、應進一步理解,在實施方案的描述使用術語“包含(comprising)”及其同源詞的情況下,實施方案也可以使用語言“基本上由...組成”或“由...組成”來描述。
61、數(shù)值范圍包括限定該范圍的數(shù)字。因此,本文公開的每個數(shù)值范圍意圖包括落在這樣的較寬數(shù)值范圍內(nèi)的每一較窄數(shù)值范圍,如同這樣的較窄數(shù)值范圍在本文被全部清楚地寫出。還意圖本文公開的每個最大的(或最小的)數(shù)值限制包含每個較低(或較高)的數(shù)值限制,如同此類較低(或較高)數(shù)值限制在本文被清楚地寫出。
62、如本文使用的,術語“約”意指特定值的可接受誤差。在一些實例中,“約”意指在給定值范圍的0.05%、0.5%、1.0%或2.0%內(nèi)。在一些實例中,“約”意指在給定值的1、2、3或4個標準差內(nèi)。
63、“ec”數(shù)字指nomenclature?committee?of?the?international?union?ofbiochemistry?and?molecular?biology(生物化學和分子生物學國際聯(lián)合命名委員會)(nc-iubmb)的酶命名法。該iubmb生化分類是基于酶催化的化學反應的酶數(shù)字分類系統(tǒng)。
64、“atcc”指american?type?culture?collection(美國典型培養(yǎng)物保藏中心),其生物保藏收集包括基因和菌株。
65、“ncbi”指national?center?for?biological?information(美國國家生物技術信息中心)和在其中提供的序列數(shù)據(jù)庫。
66、“蛋白”、“多肽”和“肽”可以互換使用,以表示通過酰胺鍵共價連接的至少兩個氨基酸的聚合物,而不論長度或翻譯后修飾(例如,糖基化或磷酸化)。
67、“氨基酸”通過其通常已知的三字母符號或通過iupac-iub生物化學命名委員會推薦的單字母符號在本文被提及。用于遺傳編碼的氨基酸的縮寫是常規(guī)的,并且如下:丙氨酸(ala或a)、精氨酸(arg或r)、天冬酰胺(asn或n)、天冬氨酸(asp或d)、半胱氨酸(cys或c)、谷氨酸(glu或e)、谷氨酰胺(gln或q)、甘氨酸(gly或g)、組氨酸(his或h)、異亮氨酸(ile或i)、亮氨酸(leu或l)、賴氨酸(lys或k)、甲硫氨酸(met或m)、苯丙氨酸(phe或f)、脯氨酸(pro或p)、絲氨酸(ser或s)、蘇氨酸(thr或t)、色氨酸(trp或w)、酪氨酸(tyr或y)和纈氨酸(val或v)。當使用三字母縮寫時,除非前面具體地有“l(fā)”或“d”,或者從使用縮寫的上下文清楚看出,否則氨基酸可以是關于α-碳(cα)的l-構型或d-構型。例如,“ala”表示丙氨酸而不指定關于α-碳的構型,而“d-ala”和“l(fā)-ala”分別表示d-丙氨酸和l-丙氨酸。當使用單字母縮寫時,大寫字母表示關于α-碳的l-構型的氨基酸,并且小寫字母表示關于α-碳的d-構型的氨基酸。例如,“a”表示l-丙氨酸并且“a”表示d-丙氨酸。當多肽序列以一串單字母或三字母縮寫(或其混合)呈現(xiàn)時,根據(jù)常規(guī)慣例將序列呈現(xiàn)為氨基(n)至羧基(c)方向。
68、“融合蛋白”、“融合多肽”、“嵌合蛋白”和“嵌合體”是指通過連接最初編碼單獨蛋白的兩個或更多個多核苷酸而產(chǎn)生的雜合蛋白。在一些實施方案中,融合蛋白通過重組技術(例如,本領域已知的分子生物學技術)產(chǎn)生。
69、“聚合酶”是指使核苷三磷酸聚合以形成多核苷酸的一類酶(例如,ec?2.7.7.7)。在本文中,聚合酶使用模板核酸鏈來合成互補核酸鏈。在一些實施方案中,模板鏈和合成的核酸鏈可以獨立地是dna或rna,這取決于聚合酶的底物和模板特異性。本領域已知的聚合酶包括但不限于dna聚合酶(例如,大腸桿菌dna?poli、水生棲熱菌(t.aquaticus)dna聚合酶(taq)、bst聚合酶)、dna依賴性rna聚合酶,以及逆轉錄酶。如本文使用的,聚合酶是含有足夠的氨基酸來發(fā)揮聚合酶的期望酶功能的多肽或蛋白。在一些實施方案中,聚合酶不包含天然酶中發(fā)現(xiàn)的所有氨基酸,而僅包含足以允許聚合酶發(fā)揮期望催化活性的氨基酸,包括但不限于發(fā)揮5’-3’聚合、5’-3’核酸外切酶和3’-5’核酸外切酶活性的氨基酸。在一些實施方案中,聚合酶限于聚合酶結構域并且不包括核酸外切酶功能。
70、“dna聚合酶活性”、“合成活性”和“聚合酶活性”在本文中可互換使用,并且是指酶通過摻入脫氧核苷三磷酸或其類似物來合成新dna鏈的能力。在一些實施方案中,dna聚合酶可以使用dna和/或rna作為模板。
71、“逆轉錄酶活性”是指dna聚合酶通過使用rna作為模板摻入脫氧核苷三磷酸或其類似物來合成新dna鏈的能力。
72、“多核苷酸”、“核酸”或“寡核苷酸”在本文中用于表示包含至少兩個核苷酸的聚合物,其中核苷酸是脫氧核糖核苷酸或核糖核苷酸或脫氧核糖核苷酸和核糖核苷酸的混合物。在一些實施方案中,用于遺傳編碼核苷的縮寫是常規(guī)的并且是如下:腺苷(a);鳥苷(g);胞苷(c);胸苷(t);和尿苷(u)。除非具體描述,否則縮寫的核苷可以是核糖核苷或2'-脫氧核糖核苷。核苷可以基于單獨地或基于總體地指定為核糖核苷或2'-脫氧核糖核苷。當多核苷酸、核酸或寡核苷酸序列被呈現(xiàn)為一串單字母縮寫時,根據(jù)通常的慣例,序列在5’至3’方向上呈現(xiàn),并且不指示磷酸。術語“dna”是指脫氧核糖核酸。術語“rna”是指核糖核酸。多核苷酸或核酸可以是單鏈或雙鏈的,或者可以包括單鏈區(qū)和雙鏈區(qū)兩者。
73、在一些實施方案中,“多核苷酸”、“核酸”和“寡核苷酸”包括多核苷酸或核酸或寡核苷酸類似物,其包括經(jīng)由不同于標準磷酸二酯連鍵的連鍵,諸如氨基磷酸酯、硫代磷酸酯、酰胺、帶正電荷的連鍵等的非標準連鍵連接在一起的核苷;具有修飾的和/或合成的核堿基,例如肌苷、黃嘌呤、次黃嘌呤等的核苷;和/或具有修飾的糖殘基的核苷,諸如2’-o-烷基(例如,2’-o-甲基、2’-o-乙基等)、2’-鹵代(例如,2’-f、2’-br等)、2,3-二脫氧、2’-鹵代-2’-脫氧、β-d-核糖lna;α-l-核糖-lna(鎖核酸)等以及其他。
74、“雙鏈體”和“ds”是指雙鏈核酸(例如,dna)分子,其由兩個單鏈多核苷酸組成,這兩個單鏈多核苷酸的序列互補(a與t配對,c與g配對),以反向平行的5’至3’方向排列,并通過核堿基(例如,腺嘌呤[a]、鳥嘌呤[g]、胞嘧啶[c]和胸腺嘧啶[t]或核堿基類似物)之間的氫鍵保持在一起。
75、當關于細胞、多核苷酸或多肽使用時,“工程化”、“重組”、“非天然存在的”和“變體”是指如下材料或與材料的天然或自然形式對應的材料:已經(jīng)以自然界中本來不存在的方式被修飾或與其相同但從合成材料產(chǎn)生或衍生和/或通過使用重組技術操作產(chǎn)生或衍生。
76、“野生型”和“天然存在的”是指在自然界中發(fā)現(xiàn)的形式。例如,野生型多肽或多核苷酸序列為生物體中存在的序列,其可從天然來源分離且未通過人為操作被有意識地修飾。
77、“編碼序列”指編碼蛋白的氨基酸序列的核酸的部分(例如,基因)。
78、“序列同一性百分比(%)”是指多核苷酸和多肽之間的比較,并且通過在比較窗上比較兩條最佳比對的序列來確定,其中為了兩個序列的最佳比對,多核苷酸或多肽序列在比較窗中的部分與參考序列相比可以包含添加或缺失(即,空位)。百分比可以通過如下計算:確定兩個序列中出現(xiàn)相同的核酸堿基或氨基酸殘基的位置的數(shù)目,以產(chǎn)生匹配位置的數(shù)目,將匹配位置的數(shù)目除以比較窗中位置的總數(shù)目,并將結果乘以100以產(chǎn)生序列同一性的百分比??蛇x擇地,百分比可以通過如下計算:確定兩個序列中出現(xiàn)相同的核酸堿基或氨基酸殘基或一個核酸堿基或氨基酸殘基與空位對齊的位置的數(shù)目,以產(chǎn)生匹配位置的數(shù)目,將匹配位置的數(shù)目除以比較窗中位置的總數(shù),并將結果乘以100以產(chǎn)生序列同一性的百分比。本領域技術人員理解,存在許多可用于比對兩個序列的已建立的算法。如本領域已知的,用于比較的序列的最佳比對可以通過以下進行,例如,通過smith和waterman的局部同源算法(smith和waterman,adv.appl.math.,1981,2:482)、通過needleman和wunsch的同源比對算法(needleman和wunsch,j.mol.biol.,1970,48:443)、通過pearson和lipman的相似性搜索方法(pearson和lipman,proc.natl.acad.sci.usa.,1988,85:2444)、通過這些算法的計算機化實施(例如,gcg?wisconsin軟件包中的gap、bestfit、fasta和tfasta),或通過目視檢查。適合用于確定序列同一性百分比和序列相似性的算法的實例包括但不限于blast和blast?2.0算法(參見,例如,altschul等人,j.mol.,1990,215:403-410;和altschul等,nucleic?acids?res.,1977,3389-3402)。用于進行blast分析的軟件可通過美國國家生物技術信息中心(national?center?for?biotechnology?information)網(wǎng)站公開獲得。這個算法包括首先通過鑒定查詢序列中長度“w”的短字(short?words)來鑒定高評分序列對(hsp),所述長度w的短字在與數(shù)據(jù)庫序列中的相同長度的字比對時,匹配或滿足某一正值的閾值評分“t”。t被稱為鄰近字評分閾值(參見,altschul等,同上)。這些最初的鄰近字擊中(word?hit)用作啟動檢索的種子以找到更長的包含它們的hsp。然后,字擊中沿著每個序列的兩個方向延伸直到累積比對評分不能增加的程度。對于核苷酸序列,累積評分使用參數(shù)“m”(對于匹配殘基對的獎勵評分;永遠>0)和“n”(對于錯配殘基的懲罰評分;永遠<0)來計算。對于氨基酸序列,評分矩陣用于計算累積評分。當以下情況時,字擊中在每個方向上的延伸停止:累積比對評分從其達到的最大值下降了量“x”;由于累積一個或更多個負評分的殘基比對,累積評分達到零或以下;或到達任一序列的末端。blast算法參數(shù)w、t和x決定對齊的靈敏度和速度。blastn程序(對于核苷酸序列)使用以下作為缺省值:字長(w)為11、期望值(e)為10、m=5、n=-4、以及兩個鏈的比較。對于氨基酸序列,blastp程序使用以下作為默認值:3的字長(w),10的期望值(e)和blosum62評分矩陣(參見例如,henikoff和henikoff,proc.natl.acad.sci.usa,1989,89:10915)。序列比對和序列同一性%的示例性確定可以使用所提供的默認參數(shù),采用gcg?wisconsin軟件包(accelrys,madison?wi)中的bestfit或gap程序。
79、“參考序列”指用作序列比較的基礎的指定序列。參考序列可以是更大序列的子集,例如,全長基因或多肽序列的區(qū)段(segment)。通常,參考序列為至少20個核苷酸或氨基酸殘基的長度、至少25個殘基的長度、至少50個殘基的長度、至少100個殘基的長度或者核酸或多肽的全長。由于兩個多核苷酸或多肽可以各自(1)包含兩個序列之間相似的序列(即完整序列的一部分),和(2)還可以包含兩個序列之間不同的序列,因此兩個(或更多個)多核苷酸或多肽之間的序列比較通常通過比較兩個多核苷酸或多肽在“比較窗”上的序列來鑒定和比較序列相似性的局部區(qū)域來進行。在一些實施方案中,“參考序列”可以基于一級氨基酸序列(primary?amino?acid?sequence),其中參考序列是可以在一級序列中具有一個或更多個變化的序列。例如,短語“對應于seq?id?no:2、在對應于x470的殘基處具有絲氨酸的參考序列”(或“對應于seq?id?no:2、在對應于位置470的殘基處具有絲氨酸的參考序列”)是指其中在seq?id?no:2中的位置x470處的對應殘基(例如,異亮氨酸)已經(jīng)被改變?yōu)榻z氨酸的參考序列。
80、“比較窗口”是指連續(xù)核苷酸位置或氨基酸殘基的概念區(qū)段,其中序列可以與參考序列進行比較。在一些實施方案中,比較窗口是至少15個至20個連續(xù)的核苷酸或氨基酸,并且其中與參考序列(其不包含添加或缺失)相比,比較窗口中的序列部分可以包含20%或更少的添加或缺失(即,空位),用于兩個序列的最佳比對。在一些實施方案中,比較窗口可以長于15-20個連續(xù)殘基,并且任選地包括30個、40個、50個、100個或更長的窗口。
81、當在對給定氨基酸或多核苷酸序列進行編號的情況中使用時,“對應于”、“參考”和“相對于”是指當給定氨基酸或多核苷酸序列與參考序列相比較時對指定參考序列的殘基進行編號。換言之,給定聚合物的殘基編號或殘基位置關于參考序列被指定,而不是通過給定氨基酸或多核苷酸序列內(nèi)殘基的實際數(shù)字位置被指定。例如,給定的氨基酸序列,諸如工程化dna聚合酶的氨基酸序列可以通過引入空位以與參考序列對齊從而優(yōu)化兩個序列之間的殘基匹配。在這些情況中,盡管存在空位,對給定氨基酸或多核苷酸序列中的殘基關于與其比對的參考序列進行編號。在一些實施方案中,序列被加標簽(例如,使用組氨酸標簽)。
82、“突變”是指核酸序列的改變。在一些實施方案中,突變導致編碼的多肽序列的改變(即,與不具有突變的原始序列相比)。在一些實施方案中,突變包含取代,使得產(chǎn)生不同的氨基酸。在一些替代實施方案中,突變包括添加,使得氨基酸被添加(例如,插入)到原始多肽序列中。在一些另外的實施方案中,突變包括缺失,使得氨基酸從原始多肽序列中缺失。給定序列中可能存在任何數(shù)量的突變。
83、“氨基酸差異”和“殘基差異”是指多肽序列的一個位置的氨基酸殘基相對于參考序列中對應位置的氨基酸殘基的差異。本文中氨基酸差異的位置通常被稱為“xn”,其中n是指殘基差異所基于的參考序列中的對應位置。例如,“與seq?id?no:2相比在位置x470處的殘基差異”(或“與seq?id?no:2相比在位置470處的殘基差異”)是指在對應于seq?id?no:2的位置470的多肽位置處的氨基酸殘基的差異。因此,如果seq?id?no:2的參考多肽在位置470處具有異亮氨酸,則“與seq?id?no:2相比在位置x470處的殘基差異”是指在對應于seqid?no:2的位置470的多肽的位置處除了異亮氨酸之外的任何殘基的氨基酸取代。在本文的一些情況下,在一個位置處的特定氨基酸殘基差異被指示為“xny”,其中“xn”指定(如上文描述的)參考多肽的對應殘基和位置,并且“y”是在工程化多肽中發(fā)現(xiàn)的氨基酸(即,與參考多肽中不同的殘基)的單字母標識符。在一些情況下(例如,實施例中的表格中),本公開內(nèi)容還提供由常規(guī)符號“anb”表示的特定氨基酸差異,其中a是參考序列中的殘基的單字母標識符,“n”是在參考序列中的殘基位置的編號,并且b是工程化多肽的序列中殘基取代的單字母標識符。在一些實施方案中,氨基酸差異(例如,取代)由縮寫“nb”表示,而沒有參考序列中殘基的標識符。在一些實施方案中,短語“氨基酸殘基nb”表示工程化多肽中存在的氨基酸殘基,其在參考序列的上下文中可以是或可以不是取代。
84、在一些情況下,本公開內(nèi)容的多肽可以包含相對于參考序列的一個或更多個氨基酸殘基差異,所述氨基酸殘基差異由相對于參考序列存在殘基差異的指定位置的列表指示。在一些實施方案中,當多于一個氨基酸可以在多肽的特定殘基位置中使用時,可以使用的多種氨基酸殘基由“/”分開(例如,x21m/x21v、x21m/v或21m/v)。本公開內(nèi)容包括包含一個或更多個氨基酸差異的工程化多肽序列,所述一個或更多個氨基酸差異包括保守氨基酸取代和非保守氨基酸取代中的一種/或兩者,以及序列中氨基酸的插入和缺失。
85、“氨基酸取代集”和“取代集”是指多肽序列內(nèi)的一組氨基酸取代。在一些實施方案中,取代集包含2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個或更多個氨基酸取代。在一些實施方案中,取代集是指在實施例中任一表格中列出的任一變體dna聚合酶多肽中存在的氨基酸取代的集合。在這些取代集中,各個取代用分號(“;”;例如,s36t;a241q;k372e;i470s或縮寫為36t;241q;372e;470s)或斜杠(“/”;例如,s36t/a241q/k372e/i470s或縮寫為36t/241q/372e/470s)分隔。在一些實施方案中,“取代”包括氨基酸的缺失,并且可以用“-”符號表示。
86、“保守氨基酸取代”指用具有相似側鏈的不同殘基來取代殘基,并且因此通常包括用相同或相似的氨基酸定義類別中的氨基酸取代多肽中的氨基酸。例如但不限于,具有脂肪族側鏈的氨基酸可以被另一種脂肪族氨基酸(例如,丙氨酸、纈氨酸、亮氨酸和異亮氨酸)取代;具有羥基側鏈的氨基酸被另一種具有羥基側鏈的氨基酸(例如,絲氨酸和蘇氨酸)取代;具有芳族側鏈的氨基酸被另一種具有芳族側鏈的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和組氨酸)取代;具有堿性側鏈的氨基酸被另一種具有堿性側鏈的氨基酸(例如,賴氨酸和精氨酸)取代;具有酸性側鏈的氨基酸被另一種具有酸性側鏈的氨基酸(例如,天冬氨酸或谷氨酸)取代;和疏水性氨基酸或親水性氨基酸分別被另一種疏水性氨基酸或親水性氨基酸取代。
87、“非保守取代”指用具有顯著不同的側鏈特性的氨基酸取代多肽中的氨基酸。非保守取代可以利用限定的組之間的,而不是其內(nèi)部的氨基酸,并且影響:(a)取代的區(qū)域中的肽主鏈的結構(例如,脯氨酸取代甘氨酸);(b)電荷或疏水性;和/或(c)側鏈的本體。例如但不限于,示例性非保守取代包括用堿性氨基酸或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳族氨基酸;和用疏水性氨基酸取代親水性氨基酸。
88、“缺失”指通過從參考多肽去除一個或更多個氨基酸的多肽修飾。缺失可以包括去除1個或更多個氨基酸、2個或更多個氨基酸、5個或更多個氨基酸、10個或更多個氨基酸、15個或更多個氨基酸或者20個或更多個氨基酸、多達組成參考酶的氨基酸總數(shù)的10%或者多達組成參考酶的氨基酸總數(shù)的20%,同時保留酶活性和/或保留工程化聚合酶的改進的特性。缺失可以涉及多肽的內(nèi)部部分和/或末端部分。在多種實施方案中,缺失可以包括連續(xù)的區(qū)段或可以是不連續(xù)的。缺失用“-”表示,并且可能存在于取代集中。
89、“插入”指通過向參考多肽添加一個或更多個氨基酸的多肽修飾。插入可以處于多肽的內(nèi)部部分或者到羧基或氨基末端。如本文使用的插入包括如本領域已知的融合蛋白。插入可以是氨基酸的連續(xù)區(qū)段,或被天然存在的多肽中的一個或更多個氨基酸分開。
90、“功能片段”和“生物活性片段”在本文可互換使用,以指如下多肽:所述多肽具有氨基末端缺失和/或羧基末端缺失和/或內(nèi)部缺失,但其中剩余的氨基酸序列與和它進行比較的序列(例如,本發(fā)明的全長工程化dna聚合酶)中的對應位置相同,并且保留全長多肽的基本上全部活性。
91、“分離的多肽”指如下多肽:所述多肽與天然伴隨其的其他污染物(例如蛋白、脂質(zhì)和多核苷酸)分開。該術語包括已從它們天然存在的環(huán)境或表達系統(tǒng)(例如,宿主細胞或體外合成)中取出或純化的多肽。重組dna聚合酶多肽可以存在于細胞內(nèi)、存在于細胞培養(yǎng)基中,或以各種形式(諸如裂解物或分離的制品)制備。因此,在一些實施方案中,本文提供的重組dna聚合酶多肽是分離的多肽。
92、“基本上純的多肽”或“純的多肽”指如下組合物,在所述組合物中多肽物類為存在的優(yōu)勢物類(即,在摩爾或重量基礎上,它比在該組合物中的任何其他單獨的大分子物類更豐富),并且當目標物類構成存在的大分子物類的按摩爾或%重量計至少約50%時,通常為基本上純化的組合物。通常,基本上純的dna聚合酶組合物構成組合物中存在的所有大分子物質(zhì)的按摩爾或%重量計約60%或更多、約70%或更多、約80%或更多、約90%或更多、約95%或更多和約98%或更多。在一些實施方案中,將目標物類純化至基本的均一性(即,通過常規(guī)檢測方法不能在組合物中檢測出污染物物類),其中該組合物基本上由單一大分子物類組成。溶劑物質(zhì)、小分子(<500道爾頓)和元素離子物質(zhì)不被認為是大分子物質(zhì)。在一些實施方案中,分離的重組dna聚合酶多肽是基本上純的多肽組合物。
93、如本文使用的,“改進的酶性質(zhì)”是指與參考dna聚合酶多肽(諸如seq?id?no:2的dna聚合酶多肽序列)或另一種工程化dna聚合酶多肽相比,在任何酶性質(zhì)上表現(xiàn)出改進的工程化dna聚合酶多肽。改進的性質(zhì)包括但不限于這樣的性質(zhì),如增加的蛋白質(zhì)表達、增加的熱活性、增加的熱穩(wěn)定性、增加的穩(wěn)定性、增加的酶活性、增加的底物特異性和/或親和力、增加的比活性、增加的對底物和/或終產(chǎn)物抑制的抗性、增加的化學穩(wěn)定性、改進的耐鹽性、改進的溶劑穩(wěn)定性、增加的溶解度、增加的保真度、增加的持續(xù)合成能力、增加的抑制劑抗性或耐受性以及改變的溫度分布。
94、“增加的酶活性”和“增強的催化活性”是指工程化dna聚合酶多肽的改進的特性,其可以被表示為與參考dna聚合酶(例如,野生型dna聚合酶和/或另一種工程化dna聚合酶)相比,比活性(例如,產(chǎn)生的產(chǎn)物/時間/重量蛋白)的增加和/或底物向產(chǎn)物轉化的轉化百分比(例如,在指定的時間段使用指定量的dna聚合酶,起始量的底物向產(chǎn)物轉化的轉化百分比)的增加。在實施例中提供了確定酶活性的示例性方法??梢杂绊懪c酶活性相關的任何性質(zhì),包括典型的酶性質(zhì)km、vmax或kcat,它們的變化可以導致增加的酶活性。在一些實施方案中,工程化dna聚合酶可以是從對應的野生型酶的酶活性的約1.1、1.2、1.3、1.4或1.5倍,到多達比天然存在的dna聚合酶或衍生所述工程化dna聚合酶多肽的另一工程化dna聚合酶的酶活性高2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶活性。在一些特定實施方案中,工程化dna聚合酶與參考dna聚合酶的酶促活性相比表現(xiàn)出1.5倍至10倍、1.5倍至25倍、1.5倍至50倍、1.5倍至100倍或更大的范圍內(nèi)的改進的酶促活性。
95、“雜交嚴格性”是指核酸雜交中的雜交條件,諸如洗滌條件(參見,例如,sambrook等人,molecular?cloning:a?laboratory?manual,第3版,cold?spring?harborlaboratory?press,2001)。通常,雜交反應在較低嚴格性的條件下進行,隨后是不同的但較高嚴格性的洗滌。術語“中度嚴格雜交”是指允許靶dna結合以下互補核酸的條件,所述互補核酸與靶dna具有約60%同一性,優(yōu)選地約75%同一性,約85%同一性,與靶多核苷酸具有大于約90%同一性。示例性中度嚴格條件為等同于在42℃于50%甲酰胺、5×denhart溶液、5×sspe、0.2%?sds中雜交,隨后是在42℃于0.2×sspe、0.2%?sds中洗滌的條件。“高嚴格度雜交”通常指與如對指定的多核苷酸序列在溶液條件下確定的熱解鏈溫度tm相差約10℃或更小的條件。在一些實施方案中,高嚴格性條件是指僅允許在0.018m?nacl中在65℃形成穩(wěn)定雜交體的那些核酸序列的雜交的條件(即,如果雜交體在0.018m?nacl中在65℃是不穩(wěn)定的,它在如本文預期的高嚴格性條件下將是不穩(wěn)定的)。例如,可以通過在等同于在42℃于50%甲酰胺、5×denhart溶液、5×sspe、0.2%?sds的條件雜交,隨后在65℃于0.1×sspe和0.1%?sds中洗滌來提供高嚴格性條件。另一種高嚴格性條件包括在等同于在65℃于含有0.1%(w:v)sds的5x?ssc中雜交并且在65℃于含有0.1%?sds的0.1×ssc中洗滌的條件雜交。其他高嚴格性雜交條件以及中度嚴格條件在上文引用的參考文獻中被描述。
96、“密碼子優(yōu)化”是指編碼蛋白的多核苷酸的密碼子向特定生物體中優(yōu)先地使用的密碼子的改變,使得所編碼的蛋白在該生物體中更有效表達。盡管遺傳密碼是簡并的,因為大多數(shù)氨基酸由被稱為“同義(synonym)”或“同義(synonymous)”密碼子的數(shù)個密碼子代表,但熟知的是特定生物體的密碼子使用是非隨機的,并且偏向于特定的密碼子三聯(lián)體。盡管遺傳密碼是簡并的,即大多數(shù)氨基酸由被稱為“同義”(“synonyms”)或“同義”(“synonymous”)密碼子的若干密碼子表示,但熟知的是,特定生物體的密碼子使用是非隨機的和對于特定的密碼子三聯(lián)體是有偏倚的。在一些實施方案中,編碼dna聚合酶的多核苷酸是密碼子優(yōu)化的,用于從選擇用于表達的宿主生物體的最佳產(chǎn)生。
97、本文中“控制序列”是指包括對本公開內(nèi)容的多核苷酸和/或多肽的表達是必要的或有利的所有組分。如本文使用的,“控制序列”包括對本發(fā)明的多核苷酸和/或多肽的表達是必需或有利的所有組分。這樣的控制序列包括,但不限于,前導序列、多腺苷酸化序列、前肽序列、啟動子序列、信號肽序列、起始序列和轉錄終止子。在一些實施方案中,在最低限度上,控制序列包括啟動子以及轉錄和翻譯終止信號。在一些實施方案中,控制序列設有接頭,以用于引入促進控制序列與編碼多肽的核酸序列的編碼區(qū)的連接的特定限制性位點的目的。
98、“可操作地連接(operably?linked)”或“可操作地連接(operatively?linked)”指其中控制序列被適當?shù)胤胖迷?即,處于功能關系)相對于感興趣的多核苷酸的一定位置處,以使得控制序列指導或調(diào)節(jié)感興趣的多核苷酸和/或編碼的多肽的表達的配置。
99、“啟動子”或“啟動子序列”是指被宿主細胞識別用于表達感興趣的多核苷酸(諸如編碼序列)的核酸序列。啟動子序列包含介導感興趣的多核苷酸的表達的轉錄控制序列。啟動子可以是在選擇的宿主細胞中顯示出轉錄活性的任何核酸序列,包括突變體、截短的和雜合的啟動子,并且可以從編碼與宿主細胞同源或異源的細胞外或細胞內(nèi)多肽的基因獲得。
100、“合適的反應條件”或“合適的條件”是指在酶促轉化反應溶液中的那些條件(例如,酶載量、底物載量、溫度、ph、緩沖液、助溶劑等的范圍),在所述條件下本公開內(nèi)容的dna聚合酶多肽能夠?qū)⒌孜镛D化為期望的產(chǎn)物化合物。本文提供了示例性的“合適的反應條件”(參見實施例)。
101、在酶促轉化過程的上下文中,“產(chǎn)物”是指由dna聚合酶多肽對底物的作用產(chǎn)生的化合物或分子。
102、“培養(yǎng)”是指使用任何合適的培養(yǎng)基(例如,液體、凝膠或固體)在合適的條件下細胞的群體的生長。用于培養(yǎng)的細胞可以是原核細胞或真核細胞,諸如細菌、真菌、昆蟲或哺乳動物細胞。
103、“載體”是用于將感興趣的多核苷酸序列引入細胞中的重組構建體。在一些實施方案中,載體是被可操作地連接至能夠?qū)崿F(xiàn)多核苷酸或多核苷酸序列中編碼的多肽在合適宿主中的表達的合適的控制序列的表達載體。在一些實施方案中,“表達載體”具有可操作地連接至多核苷酸序列(例如,轉基因)以驅(qū)動在宿主細胞中表達的啟動子序列,并且在一些實施方案中,還包含轉錄終止子序列。
104、“表達”包括多肽產(chǎn)生中涉及的任何步驟,包括但不限于轉錄、轉錄后修飾、翻譯和翻譯后修飾。在一些實施方案中,該術語還涵蓋多肽從細胞的分泌。
105、“產(chǎn)生”是指由細胞表達或產(chǎn)生蛋白質(zhì)和/或其他化合物。意在該術語涵蓋參與多肽產(chǎn)生的任何步驟,包括但不限于,轉錄、轉錄后修飾、翻譯和翻譯后修飾。在一些實施方案中,該術語還涵蓋多肽從細胞的分泌。
106、“異源的”或“重組的”是指衍生自不同來源且本質(zhì)上不相關的兩個或更多個核酸或多肽序列(例如,啟動子序列、信號肽、終止子序列等)之間的關系。
107、“宿主細胞”和“宿主菌株”是指包含本文提供的多核苷酸(例如,編碼至少一種dna聚合酶變體的多核苷酸序列)的表達載體的合適宿主。在一些實施方案中,宿主細胞是已經(jīng)用使用如本領域已知的重組dna技術構建的載體轉化或轉染的原核細胞或真核細胞。
108、“類似物”是指與參考多肽具有大于70%序列同一性但小于100%序列同一性(例如,大于75%、78%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性)的多肽。在一些實施方案中,類似物包含非天然存在的氨基酸殘基以及天然存在的氨基酸,所述非天然存在的氨基酸殘基包括但不限于高精氨酸、鳥氨酸和正纈氨酸。在一些實施方案中,類似物還包括一個或更多個d-氨基酸殘基以及兩個或更多個氨基酸殘基之間的非肽連接。
109、“無細胞dna”或“cfdna”是指在血流中自由循環(huán)并且不被細胞包含或不與細胞締合的dna。在一些實施方案中,無細胞dna包含最初從正常體細胞或種系細胞、癌細胞、胎兒細胞、微生物細胞或病毒衍生和釋放的dna。“無細胞rna”或“cfrna”是指在血流中自由循環(huán)且不被細胞包含或不與細胞締合的rna。在一些實施方案中,無細胞rna包含最初從正常體細胞或種系細胞、癌細胞、胎兒細胞、微生物細胞或病毒衍生和釋放的rna。無細胞dna和無細胞rna包括包含在外泌體中的那些。
110、“擴增”是指核酸復制。在一些實施方案中,該術語是指特定模板核酸的復制。
111、“等溫擴增”是指不受熱循環(huán)約束(諸如在pcr中)限制的核酸擴增,。
112、“聚合酶鏈式反應”和“pcr”是指在存在核酸引物的情況下通過用聚合酶重復的變性、退火和引物延伸循環(huán)來產(chǎn)生感興趣的核酸模板的多個拷貝的方法,諸如“pcr:methodsand?protocols”methods?in?molecular?biology,”springer?protocols(2017)和“quantitative?real-time?pcr:methods?and?protocols,”methods?in?molecularbiology,springer?protocols(2014)(通過引用并入本文)中描述的。一連串的變性、退火和延伸構成了“循環(huán)”??梢灾貜妥冃浴⒁锿嘶鸷途酆厦秆由斓牟襟E(即,使用多個循環(huán)),以擴增核酸模板。在一些實施方案中,退火和延伸過程在一步中發(fā)生,有時稱為2步pcr。因此,如本文使用的,術語“pcr”包括該方法的許多變形,包括qpcr、熱啟動pcr、降落pcr(touchdown?pcr)、不對稱pcr、多重pcr、長或長范圍pcr、組裝pcr和反向pcr以及其他。
113、當在提及采用dna聚合酶的方法中使用時,“靶”是指用于制備互補dna的核酸區(qū)域。“靶”是從使用dna聚合酶的方法中存在的其他核酸中分選出來的。在一些實施方案中,“區(qū)段”是靶序列內(nèi)的核酸區(qū)域。
114、當在dna聚合酶的上下文中使用時,“靶dna”是指作為制備互補dna拷貝的對象的dna(全部或其一部分)。靶dna可以是dna序列整體或其一部分,諸如dna序列的區(qū)段。
115、“靶rna”是指作為制備互補dna拷貝的對象的全部或其一部分的rna。靶rna可以是rna序列整體或其一部分,諸如rna序列的區(qū)段。
116、“樣品模板”是指源自被用于分析靶核酸的存在的樣品的核酸。相比之下,“背景模板”是指樣品模板以外的核酸,其可能存在或可能不存在于樣品中。背景模板可能無意中被包含在樣品中,它可能是由遺留(carryover)引起的,或者可能是由于從其純化靶核酸的核酸污染物的存在而引起。例如,在一些實施方案中,來自待檢測生物體以外的生物體的核酸可以作為背景存在于測試樣品中。然而,并不意圖本發(fā)明限于任何特定的核酸樣品或模板。
117、“可擴增核酸”用于指可通過任何擴增方法擴增的核酸,包括但不限于pcr和等溫擴增。在大多數(shù)實施方案中,可擴增核酸包含樣品模板。
118、“擴增產(chǎn)物”是指在核酸擴增方法(例如,等溫擴增或pcr,或如上下文所示)的兩個或更多個循環(huán)后獲得的所得化合物(即產(chǎn)物)。
119、“擴增試劑”是指擴增所需的除了引物、核酸模板和擴增酶之外的那些試劑(例如,脫氧核糖核苷酸三磷酸、緩沖液等)。通常,擴增試劑與其他反應組分一起被放置并包含在反應容器(例如試管、微孔等)中。并不意圖本發(fā)明限于任何特定的擴增試劑,因為任何合適的試劑可用于本發(fā)明。
120、“引物”是指當置于誘導與核酸鏈互補的引物延伸產(chǎn)物的合成的條件下(即在核苷酸和誘導劑諸如dna聚合酶的存在的情況下,并在合適的溫度和ph)時,能夠充當核酸合成的起始點的寡核苷酸(即,一連串的核苷酸),無論所述寡核苷酸是天然存在的還是合成產(chǎn)生的、重組產(chǎn)生的或通過擴增產(chǎn)生的。在一些實施方案中,引物是單鏈的,但在一些實施方案中,引物是雙鏈的。在一些實施方案中,引物是具有足夠的長度的引物以在存在核酸聚合酶的情況下引發(fā)延伸產(chǎn)物的合成。如本領域技術人員已知的,確切的引物長度取決于許多因素。
121、當關于聚合酶使用時,“保真度”意圖是指相對于模板鏈,在合成的dna鏈中模板指導地摻入互補堿基的準確性。通常,保真度基于在新合成的核酸鏈中摻入不正確堿基的頻率來測量。摻入不正確的堿基可能導致點突變、插入或缺失。保真度可以根據(jù)本領域已知的任何方法來計算(參見例如tindall和kunkel,biochem.,1988,27:6008-6013;和barnes,gene,1992,112:29-35)。聚合酶或聚合酶變體可以表現(xiàn)出高保真度或低保真度。如本文使用的,“高保真度”是指具有超過預定值的準確堿基摻入頻率的聚合酶。如本文使用的,術語“低保真度”是指具有低于預定值的準確堿基摻入頻率的聚合酶。在一些實施方案中,預定值是期望的準確堿基摻入頻率或已知聚合酶(即參考聚合酶)的保真度。
122、“改變的保真度”是指聚合酶變體的保真度不同于衍生聚合酶變體的親本聚合酶或參考聚合酶的保真度。在一些實施方案中,改變的保真度高于親本聚合酶或參考聚合酶的保真度,而在一些其他實施方案中,改變的保真度低于親本聚合酶或參考聚合酶的保真度。改變的保真度可以通過使用本領域已知的任何合適的測定對親本聚合酶和變體聚合酶進行測定并比較它們的活性來確定。
123、“持續(xù)合成能力”是指核酸修飾酶,諸如dna聚合酶,保持與模板或底物結合并進行多次修飾反應的能力。持續(xù)合成能力通常由每個結合事件發(fā)生的催化事件的數(shù)量來測量。
124、“改變的持續(xù)合成能力”是指聚合酶或其變體的持續(xù)合成能力不同于衍生變體的親本聚合酶或參考聚合酶的持續(xù)合成能力。在一些實施方案中,改變的持續(xù)合成能力高于親本酶或參考酶的持續(xù)合成能力,而在一些其他實施方案中,改變的持續(xù)合成能力低于親本酶或參考酶的持續(xù)合成能力。改變的持續(xù)合成能力可以通過使用本領域已知的任何合適的測定對親本聚合酶/參考聚合酶和變體聚合酶進行測定并比較它們的活性來確定。
125、“受試者”包括哺乳動物,諸如人類、非人類靈長目動物、家畜、寵物和實驗動物(例如,嚙齒動物和兔形目動物)。意圖該術語包括雌性以及雄性。
126、“患者”意指正在評估疾病、治療疾病或正在經(jīng)歷疾病的任何受試者。在一些實施方案中,用于與dna聚合酶反應的“樣品”獲自患者。
127、如本文使用的,“樣品”是指用于與核酸聚合酶反應的材料或物質(zhì),例如,諸如用于檢測靶核酸的存在或用于制備靶核酸的dna拷貝以用于測序或產(chǎn)生cdna文庫。在一些實施方案中,樣品是“生物樣品”,其是指生物組織或流體的樣品。這樣的樣品通常來自人類,但包括從非人靈長類動物、家養(yǎng)哺乳動物(例如,貓、狗、奶牛、綿羊等)或嚙齒動物(例如,小鼠和大鼠)分離的組織,并且包括組織切片,諸如活檢和尸檢樣品、出于組織學目的采集的冷凍切片、血液、血漿、血清、痰、糞便、淚液、黏液、毛發(fā)、皮膚等?!吧飿悠贰边€指來自生物體的細胞或細胞群或一定量的組織或流體。在一些實施方案中,生物樣品已經(jīng)從動物中取出,但是術語“生物樣品”也可以指體內(nèi)分析(即沒有從動物,包括細胞培養(yǎng)物中取出)的細胞或組織。通常,“生物樣品”將包含來自動物或生物體的細胞,但該術語也可以指非細胞生物材料,諸如血液、唾液、淋巴或尿液的非細胞級分。多種類型的生物樣品可以與本公開內(nèi)容中的酶、組合物和方法一起使用,包括但不限于組織活檢、血液樣品、口腔刮擦(buccalscrape)、唾液樣品或乳頭溢液。如本文使用的,“組織活檢”是指從動物(優(yōu)選地人類)取出的一定量的組織用于診斷分析。在患有癌癥的患者中,可以從腫瘤中取出組織,允許對腫瘤內(nèi)的細胞進行分析?!敖M織活檢”可以指任何類型的活檢,諸如針活檢、細針活檢、手術活檢等。在一些實施方案中,樣品可以來自環(huán)境源,例如但不限于水(例如,海洋、河流、垃圾/下水道等)、土壤、空氣、通風口或表面(例如,地板、機器、柜臺等)。
128、工程化dna聚合酶多肽
129、在一個方面,本公開內(nèi)容提供了識別dna和rna作為模板的dna聚合酶變體,并且其中所述dna聚合酶已被工程化以具有一種或更多種改進的性質(zhì),包括與參考dna聚合酶相比,增強的活性、增強的保真度、增強的持續(xù)合成能力、增強的穩(wěn)定性、在低模板dna或rna濃度下增強的敏感性、增加的對抑制劑的抗性和增加的耐鹽性以及其他。如上所述,本文的工程化dna聚合酶基于parageobacillus?genomosp.1的野生型dna聚合酶的大片段,其中大片段包括dna聚合酶結構域,但缺少5’核酸外切酶結構域。編碼parageobacillus?genomosp.1的dna聚合酶的大片段(即,對應于seq?id?no:540的全長野生型序列的殘基285至876)的多核苷酸被用作產(chǎn)生和鑒定具有期望的性質(zhì)的dna聚合酶變體的起點。
130、本文描述的工程化dna聚合酶變體可用于進行聚合酶反應,包括在各種方法中,諸如在測序(例如,ngs測序)、等溫擴增、dna文庫制備和診斷方法(諸如用于檢測靶核酸)中,制備靶dna或rna模板(整體或部分)互補dna。這些工程化dna聚合酶變體可以用于溶液中,以及用于固定的實施方案中。在一些實施方案中,工程化dna聚合酶可以被制備并用作非融合多肽或用作融合多肽。
131、在一些實施方案中,工程化dna聚合酶或其功能片段包含與對應于seq?id?no:2、10、80、224或366的殘基12至604的參考序列或與對應于seq?id?no:2、10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2、10、80、224或366的殘基12至604的參考序列或相對于對應于seq?id?no:2、10、80、224或366的參考序列包含一個或更多個取代。
132、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:2的氨基酸殘基12至604的參考序列或與對應于seq?id?no:2的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seqid?no:2的氨基酸殘基12至604的參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
133、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的氨基酸殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的氨基酸殘基12至604的參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
134、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的氨基酸殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的氨基酸殘基12至604參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
135、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代:21、24、25、25、34、36、52、58、66、68、81、84、92、101、105、114、115、124、133、133、134、136、144、152、154、168、183、184、191、192、210、212、221、226、230、241、252、253、276、287、290、294、295、300、304、322、325、372、373、374、393、427、432、452、454、456、462、470、483、486、495、505、509、541、541、545、547、551、552、573、575、578、584、585或593或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
136、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代21m/v、24m、25l/m、34d、36t、52g、58k、66t、68g、81r、84q、92g、101a、105s、114s、115y、124l、133a、133r、134r/t、136p、144r、152r、154w、168g、183p、184t、191e/r、192e、210a、212v、221m、226k、230g/q、241e/q、252t、253r、276g、287r、290g、294r、295k、300a/g/r、304l、322c、325w、372e、373a、374e、393l、427a、432k/l、452r/s、454g、456t、462r、470s、483k、486r、495f、505h、509r、541g/r、541t、545k、547a/h/v、551k、552l、573r/v、575v、578f、584v、585r或593s或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
137、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代e21m/v、l24m、p25l/m、e34d、s36t、e52g、a58k、a66t、e68g、s81r、l84q、e92g、g101a、i105s、e114s、l115y、i124l、q133a/r、s134r/t、e136p、t144r、s152r、e154w、e168g、r183p、a184t、h191e/r、d192e、s210a、l212v、v221m、e226k、e230g/q、a241e/q、q252t、e253r、r276g、d287r、e290g、p294r、q295k、e300a/g/r、h304l、v322c、r325w、k372e、p373a、d374e、i393l、r427a、q432k/l、n452r/s、n454g、p456t、e462r、i470s、q483k、k486r、l495f、t505h、f509r、d541g/r/t、r545k、k547a/h/v、r551k、m552l、q573r/v、i575v、e578f、i584v、q585r或d593s或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
138、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置36、241、372或470或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代36t、241e/q、372e或470s或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置36處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置241處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置372處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置470處包含至少一個取代。
139、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置52、101、124、212、294、372、393、452、483或509或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代52g、101a、124l、212v、294r、372k、393l、452r、483k或509r或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置52處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置101處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置124處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置212處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置294處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置372處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置393處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置452處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置483處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置509處包含至少一個取代。
140、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置253、300、454、505或573或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代253r、300r、454g、505h或573v或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置253處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置300處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置454處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置505處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置573處包含至少一個取代。
141、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置134、136、154、505、547、573或584或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代134r、136p、154w、505h、547h、573v或583v或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置134處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置136處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置154處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置505處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置547處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置573處包含至少一個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置584處包含至少一個取代。
142、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置36、52、101、124、134、136、154、212、241、253、294、300、372、393、452、454、456、470、483、505、509、547、573或584或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代36t、52g、101a、124l、134r/t、136p、154w、212v、241e/q、253r、294r、300a/g/r、372e/k、393l、452r/s、454g、456t、470s、483k、505h、509r、547a/h/v、573r/v或584v或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
143、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代或取代集:509、300、452、36/241/372/470、124/192/210/372/427/456/552、124、52、483、372、393、212、52/66、133、454、154、593、462、541、21、573、505、152、294、545、101/241/470、584、304、295、578、456/470、253、290、192/241/372/456或252,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
144、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或取代集509r、300r、452r、36t/241q/372e/470s、124l/192e/210a/372e/427a/456t/552l、124l、52g、483k、372e、452s、300a、393l、300g、212v、52g/66t、133r、454g、154w、593s、462r、541r、21m、573v、505h、152r、294r、545k、101a/241q/470s、584v、304l、295k、578f、541t、456t/470s、253r、290g、192e/241e/372e/456t或252t,其中所述氨基酸位置是相對于對應于seqid?no:2的參考序列。
145、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或取代集f509r、e300r、n452r、s36t/a241q/k372e/i470s、i124l/d192e/s210a/k372e/p427a/p456t/m552l、i124l、e52g、q483k、k372e、n452s、e300a、i393l、e300g、i212v、e52g/a66t、q133r、n454g、e154w、d593s、e462r、d541r、e21m、q573v、t505h、s152r、p294r、r545k、g101a/a241q/i470s、i584v、h304l、q295k、e578f、d541t、p456t/i470s、e253r、e290g、d192e/a241e/k372e/p456t或q252t,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
146、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代集:36/52/101/124/212/241/294/393/452/470/483/509、36/241/372/470、36/154/212/241/294/300/393/452/470/483/509、36/52/101/154/241/294/300/372/452/470/509/593、36/52/154/212/241/294/300/372/393/452/470、36/212/241/300/372/393/452/470/509、36/52/101/212/241/294/300/372/393/452/470/483/509/593、36/52/124/241/294/300/372/452/470/509、36/124/241/300/372/393/452/470/483/509/593、36/101/124/212/241/372/452/470/483/509、36/52/393/241/372/452/470/509/593、36/212/241/300/372/452/470/509/593、36/52/241/372/452/470/509/593、36/154/212/241/300/452/470/509/593、36/52/124/212/241/294/372/393/452/470/593、36/124/241/372/452/470/509、36/152/241/253/287/372/470/505/541/573/584、36/154/212/241/300/372/452/470、36/152/241/253/287/304/372/454/470/545/573/584、36/52/124/154/241/294/300/452/470/509、36/241/294/300/452/470/509/593、36/52/212/241/372/452/470、36/124/241/294/372/393/452/470、36/52/241/300/372/470/509/593、36/152/241/253/287/372/454/470/541/584、36/52/101/241/372/452/470/509、36/52/154/212/241/300/393/470/509、21/36/241/253/287/372/454/470/584、36/52/393/241/372/452/470、36/52/124/154/241/294/372/470/509、36/101/124/212/241/300/372/393/470、36/124/241/294/300/452/470/509/593、36/52/124/154/241/294/372/470/483/593、36/52/241/393/452/470/509/593?、36/154/241/300/372/393/452/470/593?、?36/52/101/241/294/393/452/470/509?、21/36/152/241/253/287/304/372/454/470/505?、?36/52/241/300/372/393/470?、36/101/124/154/241/294/372/452/470/509、?36/154/212/241/393/470/509/593、21/36/241/253/287/372/454/470/505/541?、?36/241/287/372/454/470/505/584、36/52/124/241/294/300/452/470、36/241/287/372/470/505/541/573、36/241/253/372/470/505/584、36/84/241/253/287/372/456/470/573、36/52/241/470/509/593、36/241/372/470/509/593、36/154/212/241/300/470/509?、?36/52/154/241/294/372/470/509/593?、36/152/241/295/372/470/505/545/573?、?36/241/253/372/470/541/584?、36/241/253/295/304/372/454/462/470/573/584、36/241/253/372/454/470/505/573/584、36/154/212/241/300/372/470、36/241/287/372/454/470/545/573、21/36/152/241/287/304/372/454/470、36/152/241/253/295/304/372/470/541/573、36/152/241/253/287/304/372/470/454、36/152/241/372/454/470/573、36/124/241/294/470/509/593、36/152/241/253/295/372/454/470、36/154/241/300/372/452/470、36/241/287/304/372/470/505、36/152/241/253/372/454/470/505、36/241/253/372/454/470/505、21/36/241/253/372/454/470/505/545、36/152/241/253/287/372/470/505、36/241/372/470/505/541/584或36/152/241/253/372/454/470/584,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
147、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集36t/52g/101a/124l/212v/241q/294r/393l/452r/470s/483k/509r、36t/241q/372e/470s、36t/154w/212v/241q/294r/300g/393l/452r/470s/483k/509r?、36t/52g/101a/154w/241q/294r/300r/372e/452s/470s/509r/593s?、36t/52g/154w/212v/241q/294r/300g/372e/393l/452r/470s?、36t/212v/241q/300r/372e/393l/452r/470s/509r?、36t/52g/101a/212v/241q/294r/300r/372e/393l/452r/470s/483k/509r/593s?、36t/52g/124l/241q/294r/300r/372e/452s/470s/509r?、36t/124l/241q/300r/372e/393l/452r/470s/483k/509r/593s?、36t/101a/124l/212v/241q/372e/452r/470s/483k/509r?、36t/52g/393l/241q/372e/452r/470s/509r/593s?、36t/212v/241q/300r/372e/452r/470s/509r/593s?、36t/52g/241q/372e/452r/470s/509r/593s?、36t/154w/212v/241q/300r/452r/470s/509r/593s?、36t/52g/124l/212v/241q/294r/372e/393l/452r/470s/593s?、36t/124l/241q/372e/452r/470s/509r?、36t/152r/241q/253r/287r/372e/470s/505h/541r/573v/584v?、36t/154w/212v/241q/300r/372e/452r/470s?、36t/152r/241q/253r/287r/304l/372e/454g/470s/545k/573v/584v?、36t/52g/124l/154w/241q/294r/300a/452r/470s/509r?、36t/241q/294r/300r/452s/470s/509r/593s、36t/52g/212v/241q/372e/452r/470s、36t/124l/241q/294r/372e/393l/452r/470s、36t/52g/241q/300r/372e/470s/509r/593s、36t/152r/241q/253r/287r/372e/454g/470s/541r/584v?、36t/52g/101a/241q/372e/452s/470s/509r?、36t/52g/154w/212v/241q/300r/393l/470s/509r?、21m/36t/241q/253r/287r/372e/454g/470s/584v、36t/52g/393l/241q/372e/452r/470s、36t/52g/124l/154w/241q/294r/372e/470s/509r?、36t/101a/124l/212v/241q/300r/372e/393l/470s?、36t/124l/241q/294r/300g/452s/470s/509r/593s?、36t/52g/124l/154w/241q/294r/372e/470s/483k/593s?、36t/52g/241q/393l/452s/470s/509r/593s?、36t/154w/241q/300r/372e/393l/452s/470s/593s?、36t/52g/101a/241q/294r/393l/452s/470s/509r?、21m/36t/152r/241q/253r/287r/304l/372e/454g/470s/505h?、36t/52g/241q/300r/372e/393l/470s?、36t/101a/124l/154w/241q/294r/372e/452s/470s/509r?、36t/154w/212v/241q/393l/470s/509r/593s?、21m/36t/241q/253r/287r/372e/454g/470s/505h/541g?、36t/241q/287r/372e/454g/470s/505h/584v、36t/52g/124l/241q/294r/300r/452s/470s、36t/241q/287r/372e/470s/505h/541r/573v、36t/241q/253r/372e/470s/505h/584v、36t/84q/241q/253r/287r/372e/456t/470s/573v、36t/52g/241q/470s/509r/593s、36t/241q/372e/470s/509r/593s、?36t/154w/212v/241q/300r/470s/509r、36t/52g/154w/241q/294r/372e/470s/509r/593s?、36t/152r/241q/295k/372e/470s/505h/545k/573v、36t/241q/253r/372e/470s/541r/584v、36t/241q/253r/295k/304l/372e/454g/462r/470s/573v/584v、36t/241q/253r/372e/454g/470s/505h/573v/584v、36t/154w/212v/241q/300r/372e/470s、36t/241q/287r/372e/454g/470s/545k/573v?、21m/36t/152r/241q/287r/304l/372e/454g/470s?、36t/152r/241q/253r/295k/304l/372e/470s/541r/573v?、36t/152r/241q/253r/287r/304l/372e/470s/454g、36t/152r/241q/372e/454g/470s/573v、36t/124l/241q/294r/470s/509r/593s、36t/152r/241q/253r/295k/372e/454g/470s、36t/154w/241q/300r/372e/452s/470s、36t/241q/287r/304l/372e/470s/505h、36t/152r/241q/253r/372e/454g/470s/505h、36t/241q/253r/372e/454g/470s/505h、21m/36t/241q/253r/372e/454g/470s/505h/545k、36t/152r/241q/253r/287r/372e/470s/505h、36t/241q/372e/470s/505h/541r/584v或36t/152r/241q/253r/372e/454g/470s/584v,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
148、在一些實施方案中,工程化dna聚合酶的氨基酸序列相對于對應于seq?id?no:2的參考序列包含表6.1中提供的至少一個取代或取代集。
149、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代集:36/52/101/124/212/241/294/300/393/452/454/456/470s/483/509/541/584、21/36/52/101/124/212/241/294/300/393/452/454/470/483/509/545/584?、36/52/101/124/212/241/253/294/300/393/452/454/456/470/483/509/584?、36/52/101/124/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573?、21/36/52/101/124/154/212/241/294/300/393/452/454/456/470/483/509/573?、36/52/101/124/152/212/241/294/300/393/452/454/456/470/483/505/509/584/593?、36/52/101/124/154/212/241/253/294/300/393/452/456/470/483/505/509/545/573/584?、36/52/101/124/212/241/253/294/300/393/452/454/456/470/483/505/509/573?、36/52/101/124/154/212/241/253/294/300/393/452/454/456/470/483/509/541/573/584?、36/52/101/124/154/212/241/294/300/393/452/454/470/483/505/509?、21/36/52/101/124/212/241/253/294/300/393/452/454/456/470/483/509/545/573/593?、36/52/101/124/168/212/241/294/300/393/452/454/456/470/483/509/545/573?、36/52/101/124/212/241/253/294/300/393/452/454/470/483/505/509/573?、36/52/101/124/154/212/241/294/300/393/452/470/483/505/509/545/584?、36/52/101/124/154/212/241/253/294/300/393/452/456/470/483/509/541/573/584?、21/36/52/101/124/154/212/241/294/300/393/452/454/456/470/483/505/509/545?、36/52/101/124/154/212/241/253/294/300/393/452/454/470/483/505/509?、21/36/52/101/124/154/212/241/253/294/300/393/452/454/470/483/509/573?、36/52/101/124/212/241/294/300/393/452/454/470/483/505/509/541/584?、36/52/101/124/212/241/294/300/393/452/454/470/483/505/509/541/573?、36/52/101/124/154/212/241/253/294/300/393/452/454/470/483/509?、36/52/101/124/154/212/241/294/300/393/452/454/470/483/509/573?、36/52/101/124/212/241/294/300/393/452/454/456/470/483/509/545/573?、36/52/101/124/212/241/253/294/300/393/452/454/456/470/483/509?、36/52/101/124/154/212/241/253/294/300/393/452/454/470/483/509/545/573?、21/36/52/101/124/152/212/241/253/294/300/393/452/454/456/470/483/509/541/573?、36/52/101/124/154/212/241/253/294/300/393/452/454/456/470/483/509/573?、36/52/101/124/152/212/241/294/300/393/452/454/470/483/509?、36/52/101/124/154/212/241/253/294/300/393/452/454/470/483/505/509/541/593?、21/36/52/101/124/154/212/241/294/300/393/452/454/470/483/509/573/584?、36/52/101/124/154/212/241/294/300/393/452/456/470/483/509/573/593?、36/52/101/124/152/212/241/253/294/300/393/452/454/470/483/509/545/573?、21/36/52/101/124/212/241/294/300/393/452/456/470/483/495f/505/509/541/584?、36/52/101/124/154/212/241/294/300/393/452/454/470/483/509/541/584?、36/52/101/124/212/241/253/294/300/393/452/470/483/505/509/541/573/584?、36/52/101/124/212/241/253/294/300/393/452/470/483/509/584?、36/52/101/124/212/241/253/294/300/393/452/454/456/470/483/509/545?、21/36/52/101/124/212/241/253/294/300/393/452/470/483/509/573?、36/52/101/124/212/241/294/300/393/452/454/470/483/509/545?、36/52/101/124/212/241/294/393/452/454/456/470/483/509/541/545/573/584?、36/52/101/124/152/212/241/253/294/393/452/454/470/483/505/509/545/573?、21/36/52/101/124/212/241/294/300/393/452/454/456/470/483/495/509?、36/52/101/124/212/241/294/300/393/452/470/483/509/573?、36/52/101/124/154/212/241/294/300/393/452/454/470/483/509/545?、36/52/101/124/154/212/241/253/294/300/393/452/470/483/509/545/584?、21/36/52/101/124/212/241/294/300/393/452/470/483/505/509?、21/36/52/101/124/152/212/241/253/294/300/393/452/454/456/470/483/509/545?、36/52/101/124/154/212/241/253/294/300/393/452/456/470/483/509/541/573?、36/52/101/124/154/212/241/294/300/393/452/454/470/483/509?、36/52/101/124/212/241/253/294/300/393/452/454/470/483/509/541?、36/52/101/124/212/241/253/294/393/452/454/456/470/483/509/541/584?、21/36/52/101/124/212/241/294/300/393/452/470/483/509/573?、36/52/101/124/212/241/294/300/393/452/454/456/470/483/509?、36/52/101/124/212/241/294/300/393/452/454/470/483/509?、36/52/101/124/154/212/241/253/294/300/393/452/454/456/470/483/509?、36/52/101/124/154/212/241/294/393/452/456/470/483/505/509/593?、36/52/101/124/212/241/294/393/452/454/456/470/483/505/509?、36/52/101/124/212/241/253/294/393/452/454/456/470/483/509/584?、36/52/101/124/154/212/241/253/294/300/393/452/470/483/509?、36/52/101/124/212/241/253/294/393/452/456/470/483/505/509/584?、36/52/101/124/212/241/294/393/452/454/456/470/483/509?、36/52/101/124/154/212/241/294/393/452/454/470/483/509?、36/52/101/124/212/241/294/393/452/470/483/509/584?、36/52/101/124/212/241/294/393/452/456/470/483/509/584?、21/36/52/101/124/212/241/294/393/452/470/483/505/509/545/584?、21/36/52/101/124/154/212/241/294/393/452/470/483/509/545/573?、36/52/101/124/212/241/294/393/452/454/470/483/509/584?或36/52/101/124/154/212/241/253/294/393/452/470/483/505/509,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
150、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/509r/541r/584v、21m/36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r/545k/584v、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r/584v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、21m/36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/509r/573v、36t/52g/101a/124l/152r/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/584v/593s、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/456t/470s/483k/505h/509r/545k/573v/584v、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r/541g/573v/584v、36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/470s/483k/505h/509r、21m/36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r/545k/573v/593s、36t/52g/101a/124l/168g/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/509r/545k/573v、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/505h/509r/573v、36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/470s/483k/505h/509r/545k/584v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/456t/470s/483k/509r/541r/573v/584v、21m/36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/545k、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/505h/509r、21m/36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/509r/573v、36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/470s/483k/505h/509r/541r/584v、36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/470s/483k/505h/509r/541r/573v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/509r、36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r/573v、36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/509r/545k/573v、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/509r/545k/573v、21m/36t/52g/101a/124l/s152r/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r/541r/573v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r/573v、36t/52g/101a/124l/s152r/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/505h/509r/541r/593s、21m/36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r/573v/584v、36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/456t/470s/483k/509r/573v/593s、36t/52g/101a/124l/s152r/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/509r/545k/573v、21m/36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/456t/470s/483k/l495f/505h/509r/541r/584v、36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r/541g/584v、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/470s/483k/505h/509r/541r/573v/584v、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/470s/483k/509r/584v、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r/545k、21m/36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/470s/483k/509r/573v、36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r/545k、36t/52g/101a/124l/212v/241q/294r/393l/452r/454g/456t/470s/483k/509r/541g/545k/573v/584v、36t/52g/101a/124l/s152r/212v/241q/253r/294r/393l/452r/454g/470s/483k/505h/509r/545k/573v、21m/36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/l495f/509r、36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/470s/483k/509r/573v、36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r/545k、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/470s/483k/509r/545k/584v、21m/36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/470s/483k/505h/509r、21m/36t/52g/101a/124l/s152r/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r/545k、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/456t/470s/483k/509r/541r/573v、36t/52g/101a/124l/154w/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r、36t/52g/101a/124l/212v/241q/253r/294r/300r/393l/452r/454g/470s/483k/509r/541r、36t/52g/101a/124l/212v/241q/253r/294r/393l/452r/454g/456t/470s/483k/509r/541g/584v、21m/36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/470s/483k/509r/573v、36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/456t/470s/483k/509r?、36t/52g/101a/124l/212v/241q/294r/300r/393l/452r/454g/470s/483k/509r?、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/509r、36t/52g/101a/124l/154w/212v/241q/294r/393l/452r/456t/470s/483k/505h/509r/593s、36t/52g/101a/124l/212v/241q/294r/393l/452r/454g/456t/470s/483k/505h/509r、36t/52g/101a/124l/212v/241q/253r/294r/393l/452r/454g/456t/470s/483k/509r/584v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/470s/483k/509r、36t/52g/101a/124l/212v/241q/253r/294r/393l/452r/456t/470s/483k/505h/509r/584v、36t/52g/101a/124l/212v/241q/294r/393l/452r/454g/456t/470s/483k/509r?、36t/52g/101a/124l/154w/212v/241q/294r/393l/452r/454g/470s/483k/509r?、36t/52g/101a/124l/212v/241q/294r/393l/452r/470s/483k/509r/584v?、36t/52g/101a/124l/212v/241q/294r/393l/452r/470s/483k/509r/584v?、36t/52g/101a/124l/212v/241q/294r/393l/452r/456t/470s/483k/509r/584v?、21m/36t/52g/101a/124l/212v/241q/294r/393l/452r/470s/483k/505h/509r/545k/584v、21v/36t/52g/101a/124l/154w/212v/241q/294r/393l/452r/470s/483k/509r/545k/573v、36t/52g/101a/124l/212v/241q/294r/393l/452r/454g/470s/483k/509r/584v或36t/52g/101a/124l/154w/212v/241q/253r/294r/393l/452r/470s/483k/505h/509r,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
151、在一些實施方案中,工程化dna聚合酶的氨基酸序列相對于對應于seq?id?no:2的參考序列包含表7.1中提供的至少一個取代或取代集。
152、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代集:36/52/101/124/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573、36/52/101/124/154/191/212/241/253/294/300/325/393/452/454/456/470/483/505/509/573、36/52/101/124/144/154/212/241/253/294/300/373/374/393/452/454/456/470/483/505/509/573、36/52/101/124/134/136/154/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573、36/52/81/101/124/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573、36/52/101/124/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/144/154/191/212/230/241/253/294/300/322/393/452/454/456/470/483/505/509/573、36/52/68/101/124/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/144/154/212/226/230/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/144/154/212/241/253/294/300/374/393/452/454/456/470/483/325/505/509/573、36/52/81/101/114s/124/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/144/154/212/241/253/276/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/134/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/81/101/124/144/154/183/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573、36/52/68/81/101/124/133/134/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573、36/52/101/124/144/154/212/241/253/294/300/374/393/452/454/456/470/483/505/509/573、36/52/92/101/124/133/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/144/154/212/241/253/294/300/373/393/452/454/456/470/483/505/509/573、36/52/101/114/124/144/154/212/241/253/294/300/393/452/454/456/470/483/505/509/573、36/52/101/124/154/212/241/253/294/300/393/452/454/456/470/483/505/509/551/573/585或36/52/81/101/124/154/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
153、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集36t/52g/101a/124l/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/101a/124l/154w/191e/212v/241q/253r/294r/300r/325w/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/144r/154w/212v/241q/253r/294r/300r/373a/374e/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/s134r/136p/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/81r/101a/124l/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/144r/154w/191r/212v/230g/241q/253r/294r/300r/322c/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/68g/101a/124l/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/144r/154w/212v/226k/230q/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/144r/154w/212v/241q/253r/294r/300r/374e/393l/452r/454g/456t/470s/483k/486r/505h/509r/573v、36t/52g/81r/101a/114s/124l/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/144r/154w/212v/241q/253r/276g/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/s134t/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/81r/101a/124l/144r/154w/183p/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547a/573v、36t/52g/68g/81r/101a/124l/133a/s134r/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/101a/124l/144r/154w/212v/241q/253r/294r/300r/374e/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/92g/101a/124l/133a/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/144r/154w/212v/241q/253r/294r/300r/373a/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/114s/124l/144r/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/573v、36t/52g/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/551k/573r/585r或36t/52g/81r/101a/124l/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547v/573v,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
154、在一些實施方案中,工程化dna聚合酶的氨基酸序列相對于對應于seq?id?no:2的參考序列包含表8.1中提供的至少一個取代或取代集。
155、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代集:24/36/52/58/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、36/52/58/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、36/52/58/101/115/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、24/36/52/101/115/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、24/25/36/52/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、25/36/52/58/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、24/25/36/52/58/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、36/52/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、24/36/52/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/36/52/101/115/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/36/52/101/115/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/34/36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、36/52/101/124/134/136/154/184/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、24/36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/25/36/52/58/101/115/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、25/36/52/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、25/36/52/58/101/115/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、36/52/101/124/134/136/154/212/221/241/253/294/300/393/452/454/456/470/483/505/509/547/573/575、36/52/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/36/52/58/101/115/124/134/136/154/212/221/241/253/294/300/393/452/454/456/470/483/505/509/547/573/575、24/25/36/52/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、24/25/36/52/58/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、34/36/52/58/101/105/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/25/36/52/101/115/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/36/52/101/124/134/136/154/212/221/241/253/294/300/393/452/454/456/470/483/505/509/547/573/575、36/52/101/115/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、36/52/58/101/124/134/136/154/212/221/241/253/294/300/393/452/454/456/470/483/505/509/547/573、36/52/58/101/124/134/136/154/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573/575、25/36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、25/36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/36/52/101/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575、24/36/52/101/115/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/25/36/52/101/105/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、25/34/36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、25/36/52/101/105/124/134/136/154/212/221/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/25/36/52/101/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573、24/36/52/58/101/124/134/136/154/212/241/253/294/300/393/452/454/456/470/483/505/509/547/573/575或24/25/36/52/101/105/124/134/136/154/212/241/253/294/300/393/432/452/454/456/470/483/505/509/547/573/575,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
156、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集24m/36t/52g/58k/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/58k/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、36t/52g/58k/101a/115y/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/36t/52g/101a/115y/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/25l/36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、25l/36t/52g/58k/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/25m/36t/52g/58k/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/36t/52g/101a/115y/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/25m/36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/36t/52g/101a/115y/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/34d/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、36t/52g/101a/124l/134r/136p/154w/184t/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/25l/36t/52g/58k/101a/115y/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、25l/36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、25m/36t/52g/58k/101a/115y/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/36t/52g/58k/101a/115y/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/25m/36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/25m/36t/52g/58k/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、34d/36t/52g/58k/101a/105s/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/25m/36t/52g/101a/115y/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、36t/52g/101a/115y/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/58k/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v、36t/52g/58k/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、25l/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、25l/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/36t/52g/101a/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v、24m/36t/52g/101a/115y/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/25m/36t/52g/101a/105s/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、25m/34d/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/25l/36t/52g/101a/105s/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、25m/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、25m/36t/52g/101a/105s/124l/134r/136p/154w/212v/221m/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/25l/36t/52g/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v、24m/36t/52g/58k/101a/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v或24m/25m/36t/52g/101a/105s/124l/134r/136p/154w/212v/241q/253r/294r/300r/393l/432l/452r/454g/456t/470s/483k/505h/509r/547h/573v/575v,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
157、在一些實施方案中,工程化dna聚合酶的氨基酸序列相對于對應于seq?id?no:2的參考序列包含表9.1中提供的至少一個取代或取代集。
158、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或?qū)趕eq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。在一些實施方案中,工程化dna聚合酶包括以下限制條件:排除具有對應于seq?id?no:2的殘基12至604的氨基酸序列的dna聚合酶。
159、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seqid?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
160、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或相對于對應于seq?id?no:10、80、224或366的參考序列包含一個或更多個取代。
161、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seqid?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或相對于對應于seq?id?no:10、80、224或366的參考序列包含一個或更多個取代。
162、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代:21、24、25、25、34、36、52、58、66、68、81、84、92、101、105、114、115、124、133、133、134、136、144、152、154、168、183、184、191、192、210、212、221、226、230、241、252、253、276、287、290、294、295、300、304、322、325、372、373、374、393、427、432、452、454、456、462、470、483、486、495、505、509、541、541、545、547、551、552、573、575、578、584、585或593或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
163、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或氨基酸殘基21m/v、24m、25l/m、34d、36t、52g、58k、66t、68g、81r、84q、92g、101a、105s、114s、115y、124l、133a、133r、134r/t、136p、144r、152r、154w、168g、183p、184t、191e/r、192e、210a、212v、221m、226k、230g/q、241e/q、252t、253r、276g、287r、290g、294r、295k、300a/g/r、304l、322c、325w、372e/k、373a、374e、393l、427a、432k/l、452r/s、454g、456t、462r、470s、483k、486r、495f、505h、509r、541g/r/t、545k、547a/h/v、551k、552l、573r/v、575v、578f、584v/i、585r或593s或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
164、在一些實施方案中,工程化dna聚合酶的氨基酸序列在氨基酸位置36、241、372或470或其組合處包含至少一個取代,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或氨基酸殘基36t、241q、372k/e或470s或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
165、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下氨基酸位置處包含至少一個取代:36、52、101、124、134、136、154、212、241、253、294、300、372、393、452、454、456、470、483、505、509、547、573或584或其組合,其中所述氨基酸位置是相對于對應于seq?idno:10、80、224或366的參考序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或氨基酸殘基36t、52g、101a、124l、134r、136p、154w、212v、241q、253r、294r、300r、372k/e、393l、452r、454g、456t、470s、483k、505h、509r、547h、573v或584v/i或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
166、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10的殘基12至604的參考序列或與對應于seq?id?no:10的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?idno:10的殘基12至604的參考序列或相對于對應于seq?id?no:10的參考序列包含一個或更多個取代。
167、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:10-218中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:10-218中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10的殘基12至604的參考序列或相對于對應于seq?id?no:10的參考序列包含一個或更多個取代。
168、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代集:52/101/124/212/294/372/393/452/483/509、52/124/300/393/452、154/212/294/300/372/393/452/483/509、52/101/154/294/300/452/509/593、52/154/212/294/300/393/452、212/300/393/452/509、52/101/212/294/300/393/452/483/509/593、52/124/294/300/452/509、124/300/393/452/483/509/593、101/124/212/452/483/509、52/393/452/509/593、212/300/452/509/593、52/452/509/593、154/212/300/372/452/509/593、52/124/212/294/393/452/593、124/452/509、152/253/287/505/541/573/584、154/212/300/452、152/253/287/304/454/545/573/584、52/124/154/294/300/372/452/509、294/300/372/452/509/593、52/212/452、124/294/393/452、52/300/509/593、152/253/287/454/541/584、52/101/452/509、52/154/212/300/372/393/509、21/253/287/454/584、52/393/452、52/124/154/294/509、101/124/212/300/393、124/294/300/372/452/509/593、52/124/154/294/483/593、52/372/393/452/509/593、154/300/393/452/593、52/101/294/372/393/452/509、21/152/253/287/304/454/505、52/300/393、101/124/154/294/452/509、154/212/372/393/509/593、21/253/287/454/505/541、287/454/505/584、52/124/294/300/372/452、287/505/541/573、253/505/584、84/253/287/456/573、52/372/509/593、509/593、154/212/300/372/509、52/154/294/509/593、152/295/505/545/573、253/541/584、253/295/304/454/462/573/584、253/454/505/573/584、154/212/300、287/454/545/573、21/152/287/304/454、152/253/295/304/541/573、152/253/287/304/454、152/454/573、124/294/372/509/593、152/253/295/454、154/300/452、287/304/505、152/253/454/505、253/454/505、21/253/454/505/545、152/253/287/505、505/541/584或152/253/454/584,其中所述氨基酸位置是相對于對應于seq?id?no:10的參考序列。
169、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集52g/101a/124l/212v/294r/372k/393l/452r/483k/509r、52g/124l/300a/393l/452r、154w/212v/294r/300g/372k/393l/452r/483k/509r、52g/101a/154w/294r/300r/452s/509r/593s、52g/154w/212v/294r/300g/393l/452r、212v/300r/393l/452r/509r、52g/101a/212v/294r/300r/393l/452r/483k/509r/593s、52g/124l/294r/300r/452s/509r、124l/300r/393l/452r/483k/509r/593s、101a/124l/212v/452r/483k/509r、52g/393l/452r/509r/593s、212v/300r/452r/509r/593s、52g/452r/509r/593s?、?154w/212v/300r/372k/452r/509r/593s?、52g/124l/212v/294r/393l/452r/593s?、?124l/452r/509r?、152r/253r/287r/505h/541r/573v/584v?、?154w/212v/300r/452r?、152r/253r/287r/304l/454g/545k/573v/584v、52g/124l/154w/294r/300a/372k/452r/509r、294r/300r/372k/452s/509r/593s、52g/212v/452r、124l/294r/393l/452r、52g/300r/509r/593s、152r/253r/287r/454g/541r/584v、52g/101a/452s/509r、52g/154w/212v/300r/372k/393l/509r、21m/253r/287r/454g/584v、52g/393l/452r、52g/124l/154w/294r/509r?、?101a/124l/212v/300r/393l?、124l/294r/300g/372k/452s/509r/593s、?52g/124l/154w/294r/483k/593s、52g/372k/393l/452s/509r/593s?、?154w/300r/393l/452s/593s?、52g/101a/294r/372k/393l/452s/509r、21m/152r/253r/287r/304l/454g/505h、52g/300r/393l、101a/124l/154w/294r/452s/509r、154w/212v/372k/393l/509r/593s、21m/253r/287r/454g/505h/541g、287r/454g/505h/584v、52g/124l/294r/300r/372k/452s、287r/505h/541r/573v、253r/505h/584v、84q/253r/287r/456t/573v、52g/372k/509r/593s、509r/593s、154w/212v/300r/372k/509r、52g/154w/294r/509r/593s、152r/295k/505h/545k/573v、253r/541r/584v、253r/295k/304l/454g/462r/573v/584v、253r/454g/505h/573v/584v、154w/212v/300r、287r/454g/545k/573v、21m/152r/287r/304l/454g、152r/253r/295k/304l/541r/573v、152r/253r/287r/304l/454g、152r/454g/573v、124l/294r/372k/509r/593s、152r/253r/295k/454g、154w/300r/452s、287r/304l/505h、152r/253r/454g/505h、253r/454g/505h、21m/253r/454g/505h/545k、152r/253r/287r/505h、505h/541r/584v或152r/253r/454g/584v,其中所述氨基酸位置是相對于對應于seq?id?no:10的參考序列。
170、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集e52g/g101a/i124l/i212v/p294r/e372k/i393l/n452r/q483k/f509r?、e52g/i124l/e300a/i393l/n452r?、e154w/i212v/p294r/e300g/e372k/i393l/n452r/q483k/f509r?、e52g/g101a/e154w/p294r/e300r/n452s/f509r/d593s?、e52g/e154w/i212v/p294r/e300g/i393l/n452r、i212v/e300r/i393l/n452r/f509r、e52g/g101a/i212v/p294r/e300r/i393l/n452r/q483k/f509r/d593s、e52g/i124l/p294r/e300r/n452s/f509r、i124l/e300r/i393l/n452r/q483k/f509r/d593s、g101a/i124l/i212v/n452r/q483k/f509r、e52g/i393l/n452r/f509r/d593s、i212v/e300r/n452r/f509r/d593s?、?e52g/n452r/f509r/d593s?、e154w/i212v/e300r/e372k/n452r/f509r/d593s?、e52g/i124l/i212v/p294r/i393l/n452r/d593s、?i124l/n452r/f509r?、s152r/e253r/d287r/t505h/d541r/q573v/i584v、e154w/i212v/e300r/n452r、s152r/e253r/d287r/h304l/n454g/r545k/q573v/i584v?、e52g/i124l/e154w/p294r/e300a/e372k/n452r/f509r?、p294r/e300r/e372k/n452s/f509r/d593s、e52g/i212v/n452r、i124l/p294r/i393l/n452r、e52g/e300r/f509r/d593s、s152r/e253r/d287r/n454g/d541r/i584v、e52g/g101a/n452s/f509r、e52g/e154w/i212v/e300r/e372k/i393l/f509r、e21m/e253r/d287r/n454g/i584v、e52g/i393l/n452r、e52g/i124l/e154w/p294r/f509r、g101a/i124l/i212v/e300r/i393l、i124l/p294r/e300g/e372k/n452s/f509r/d593s、e52g/i124l/e154w/p294r/q483k/d593s、e52g/e372k/i393l/n452s/f509r/d593s、e154w/e300r/i393l/n452s/d593s、e52g/g101a/p294r/e372k/i393l/n452s/f509r、e21m/s152r/e253r/d287r/h304l/n454g/t505h、e52g/e300r/i393l、g101a/i124l/e154w/p294r/n452s/f509r、e154w/i212v/e372k/i393l/f509r/d593s、e21m/e253r/d287r/n454g/t505h/d541g、?d287r/n454g/t505h/i584v、e52g/i124l/p294r/e300r/e372k/n452s?、d287r/t505h/d541r/q573v?、e253r/t505h/i584v、l84q/e253r/d287r/p456t/q573v、e52g/e372k/f509r/d593s、f509r/d593s、e154w/i212v/e300r/e372k/f509r、e52g/e154w/p294r/f509r/d593s、s152r/q295k/t505h/r545k/q573v、e253r/d541r/i584v、e253r/q295k/h304l/n454g/e462r/q573v/i584v、e253r/n454g/t505h/q573v/i584v、e154w/i212v/e300r、d287r/n454g/r545k/q573v、e21m/s152r/d287r/h304l/n454g、s152r/e253r/q295k/h304l/d541r/q573v、s152r/e253r/d287r/h304l/n454g、s152r/n454g/q573v、i124l/p294r/e372k/f509r/d593s、s152r/e253r/q295k/n454g、e154w/e300r/n452s、d287r/h304l/t505h、s152r/e253r/n454g/t505h、e253r/n454g/t505h、e21m/e253r/n454g/t505h/r545k、s152r/e253r/d287r/t505h、t505h/d541r/i584v或s152r/e253r/n454g/i584,其中所述氨基酸位置是相對于對應于seq?id?no:10的參考序列。
171、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:80的殘基12至604的參考序列或與對應于seq?id?no:80的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?idno:80的殘基12至604的參考序列或相對于對應于seq?id?no:80的參考序列包含一個或更多個取代。
172、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:220-258中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或?qū)趕eq?id?no:220-258中偶數(shù)編號的seqid?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:80的殘基12至604的參考序列或相對于對應于seq?id?no:80的參考序列包含一個或更多個取代。
173、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代或取代集:300/454/456/541/584、21/300/454/545/584、253/300/454/456/584、154/253/300/454/456/505/573、21/154/300/454/456/573、152/300/454/456/505/584/593、154/253/300/456/505/545/573/584、253/300/454/456/505/573、154/253/300/454/456/541/573/584、154/300/454/505、21/253/300/454/456/545/573/593、168/300/454/456/545/573、253/300/454/505/573、154/300/505/545/584、154/253/300/456/541/573/584、21/154/300/454/456/505/545、154/253/300/454/505、21/154/253/300/454/573、300/454/505/541/584、300/454/505/541/573、154/253/300/454、154/300/454/573、300/454/456/545/573、253/300/454/456、154/253/300/454/545/573、21/152/253/300/454/456/541/573、154/253/300/454/456/573、152/300/454、154/253/300/454/505/541/593、21/154/300/454/573/584、154/300/456/573/593、152/253/300/454/545/573、21/300/456/495/505/541/584、154/300/454/541/584、253/300/505/541/573/584、253/300/584、253/300/454/456/545、21/253/300/573、300/454/545、454/456/541/545/573/584、152/253/454/505/545/573、21/300/454/456/495、300/573、154/300/454/545、154/253/300/545/584、21/300/505、21/152/253/300/454/456/545、154/253/300/456/541/573、154/300/454、253/300/454/541、253/454/456/541/584、21/300/573、300/454/456、300/454、154/253/300/454/456、154/456/505/593、454/456/505、253/454/456/584、154/253/300、253/456/505/584、454/456、154/454、584、432/505/573、456/584、21/505/545/584、21/154/545/573、454/584、154/253/505或505,其中所述氨基酸位置是相對于對應于seq?id?no:80的參考序列。
174、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或取代集300r/454g/456t/541r/584v、21m/300r/454g/545k/584v、253r/300r/454g/456t/584v、154w/253r/300r/454g/456t/505h/573v、21m/154w/300r/454g/456t/573v、152r/300r/454g/456t/505h/584v/593s、154w/253r/300r/456t/505h/545k/573v/584v、253r/300r/454g/456t/505h/573v、154w/253r/300r/454g/456t/541g/573v/584v、154w/300r/454g/505h?、?21m/253r/300r/454g/456t/545k/573v/593s?、168g/300r/454g/456t/545k/573v、?253r/300r/454g/505h/573v?、154w/300r/505h/545k/584v?、?154w/253r/300r/456t/541r/573v/584v?、21m/154w/300r/454g/456t/505h/545k?、?154w/253r/300r/454g/505h、21m/154w/253r/300r/454g/573v?、?300r/454g/505h/541r/584v?、300r/454g/505h/541r/573v、154w/253r/300r/454g、154w/300r/454g/573v、300r/454g/456t/545k/573v、253r/300r/454g/456t、154w/253r/300r/454g/545k/573v、21m/152r/253r/300r/454g/456t/541r/573v、154w/253r/300r/454g/456t/573v、152r/300r/454g?、?154w/253r/300r/454g/505h/541r/593s?、21m/154w/300r/454g/573v/584v?、?154w/300r/456t/573v/593s、152r/253r/300r/454g/545k/573v、?21m/300r/456t/495f/505h/541r/584v、154w/300r/454g/541g/584v、253r/300r/505h/541r/573v/584v、253r/300r/584v、253r/300r/454g/456t/545k、21m/253r/300r/573v、300r/454g/545k、454g/456t/541g/545k/573v/584v?、152r/253r/454g/505h/545k/573v?、21m/300r/454g/456t/495f、?300r/573v、?154w/300r/454g/545k、154w/253r/300r/545k/584v、21m/300r/505h、21m/152r/253r/300r/454g/456t/545k、154w/253r/300r/456t/541r/573v、154w/300r/454g、253r/300r/454g/541r、253r/454g/456t/541g/584v、21m/300r/573v、300r/454g/456t、300r/454g、154w/253r/300r/454g/456t、154w/456t/505h/593s、454g/456t/505h、253r/454g/456t/584v、154w/253r/300r、253r/456t/505h/584v、454g/456t、154w/454g、584v、432k/505h/573v、456t/584v、21m/505h/545k/584v、21v/154w/545k/573v、454g/584v、154w/253r/505h或505h,其中所述氨基酸位置是相對于對應于seq?id?no:80的參考序列。
175、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或取代集e300r/n454g/p456t/d541r/i584v、e21m/e300r/n454g/r545k/i584v、e253r/e300r/n454g/p456t/i584v、e154w/e253r/e300r/n454g/p456t/t505h/q573v、e21m/e154w/e300r/n454g/p456t/q573v?、s152r/e300r/n454g/p456t/t505h/i584v/d593s?、e154w/e253r/e300r/p456t/t505h/r545k/q573v/i584v?、e253r/e300r/n454g/p456t/t505h/q573v?、e154w/e253r/e300r/n454g/p456t/d541g/q573v/i584v、e154w/e300r/n454g/t505h、e21m/e253r/e300r/n454g/p456t/r545k/q573v/d593s、e168g/e300r/n454g/p456t/r545k/q573v、e253r/e300r/n454g/t505h/q573v、e154w/e300r/t505h/r545k/i584v、e154w/e253r/e300r/p456t/d541r/q573v/i584v、e21m/e154w/e300r/n454g/p456t/t505h/r545k、e154w/e253r/e300r/n454g/t505h、e21m/e154w/e253r/e300r/n454g/q573v、e300r/n454g/t505h/d541r/i584v、e300r/n454g/t505h/d541r/q573v?、?e154w/e253r/e300r/n454g?、e154w/e300r/n454g/q573v?、?e300r/n454g/p456t/r545k/q573v?、e253r/e300r/n454g/p456t、e154w/e253r/e300r/n454g/r545k/q573v、e21m/s152r/e253r/e300r/n454g/p456t/d541r/q573v?、e154w/e253r/e300r/n454g/p456t/q573v?、?s152r/e300r/n454g?、e154w/e253r/e300r/n454g/t505h/d541r/d593s?、e21m/e154w/e300r/n454g/q573v/i584v、e154w/e300r/p456t/q573v/d593s、s152r/e253r/e300r/n454g/r545k/q573v、e21m/e300r/p456t/l495f/t505h/d541r/i584v、e154w/e300r/n454g/d541g/i584v、e253r/e300r/t505h/d541r/q573v/i584v、e253r/e300r/i584v、e253r/e300r/n454g/p456t/r545k、e21m/e253r/e300r/q573v、e300r/n454g/r545k、n454g/p456t/d541g/r545k/q573v/i584v、s152r/e253r/n454g/t505h/r545k/q573v、e21m/e300r/n454g/p456t/l495f、e300r/q573v、e154w/e300r/n454g/r545k、e154w/e253r/e300r/r545k/i584v?、?e21m/e300r/t505h?、e21m/s152r/e253r/e300r/n454g/p456t/r545k?、e154w/e253r/e300r/p456t/d541r/q573v?、e154w/e300r/n454g?、e253r/e300r/n454g/d541r、e253r/n454g/p456t/d541g/i584v、e21m/e300r/q573v、e300r/n454g/p456t、e300r/n454g、e154w/e253r/e300r/n454g/p456t、e154w/p456t/t505h/d593s、n454g/p456t/t505h、e253r/n454g/p456t/i584v、e154w/e253r/e300r、e253r/p456t/t505h/i584v、n454g/p456t、e154w/n454g、i584v、q432k/t505h/q573v、p456t/i584v、e21m/t505h/r545k/i584v、e21v/e154w/r545k/q573v、n454g/i584v、e154w/e253r/t505h或t505h,其中所述氨基酸位置是相對于對應于seq?id?no:80的參考序列。
176、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:224的殘基12至604的參考序列或與對應于seq?id?no:224的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seqid?no:224的殘基12至604的參考序列或相對于對應于seq?id?no:224的參考序列包含一個或更多個取代。
177、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:360-400中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或?qū)趕eq?id?no:360-400中偶數(shù)編號的seqid?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:224的殘基12至604的參考序列或相對于對應于seq?id?no:224的參考序列包含一個或更多個取代。
178、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代集:144/154/505/547/573/584、154/191/325/505/573/584、144/154/373/374/505/573/584、134/136/154/505/547/573/584、81/144/154/505/547/573/584、154/505/573/584、144/154/191/230/322/505/573/584、68/144/154/505/573/584、144/154/226/230/505/573/584、144/154/374/486/505/573/584、81/114/144/154/505/573/584、144/154/276/505/573/584、134/144/154/505/573/584、144/154/505/573/584、81/144/154/183/505/547/573/584、68/81/133/134/144/154/505/547/573/584、144/154/374/505/573/584、92/133/144/154/505/573/584、144/154/373/505/573/584、114/144/154/505/573/584、154/505/551/573/584/585或81/154/505/547/573/584,其中所述氨基酸位置是相對于對應于seq?id?no:224的參考序列。
179、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集144r/154w/505h/547h/573v/584i、154w/191e/325w/505h/573v/584i、144r/154w/373a/374e/505h/573v/584i、134r/136p/154w/505h/547h/573v/584i、81r/144r/154w/505h/547h/573v/584i、154w/505h/573v/584i、144r/154w/191r/230g/322c/505h/573v/584i、68g/144r/154w/505h/573v/584i、144r/154w/226k/230q/505h/573v/584i、144r/154w/374e/486r/505h/573v/584i、81r/114s/144r/154w/505h/573v/584i、?144r/154w/276g/505h/573v/584i、134t/144r/154w/505h/573v/584i?、?144r/154w/505h/573v/584i?、81r/144r/154w/183p/505h/547a/573v/584i?、68g/81r/133a/134r/144r/154w/505h/547h/573v/584i、144r/154w/374e/505h/573v/584i、92g/133a/144r/154w/505h/573v/584i、?144r/154w/373a/505h/573v/584i、114s/144r/154w/505h/573v/584i?、?154w/505h/551k/573r/584i/585r?或81r/154w/505h/547v/573v/584i,其中所述氨基酸位置是相對于對應于seqid?no:224的參考序列。
180、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代集t144r/e154w/t505h/k547h/q573v/v584i、e154w/h191e/r325w/t505h/q573v/v584i、t144r/e154w/p373a/d374e/t505h/q573v/v584i?、s134r/e136p/e154w/t505h/k547h/q573v/v584i?、s81r/t144r/e154w/t505h/k547h/q573v/v584i、e154w/t505h/q573v/v584i、t144r/e154w/h191r/e230g/v322c/t505h/q573v/v584i?、e68g/t144r/e154w/t505h/q573v/v584i?、t144r/e154w/e226k/e230q/t505h/q573v/v584i?、t144r/e154w/d374e/k486r/t505h/q573v/v584i?、s81r/e114s/t144r/e154w/t505h/q573v/v584i?、t144r/e154w/k276g/t505h/q573v/v584i、s134t/t144r/e154w/t505h/q573v/v584i、t144r/e154w/t505h/q573v/v584i?、s81r/t144r/e154w/r183p/t505h/k547a/q573v/v584i?、e68g/s81r/q133a/s134r/t144r/e154w/t505h/k547h/q573v/v584i?、t144r/e154w/d374e/t505h/q573v/v584i?、e92g/q133a/t144r/e154w/t505h/q573v/v584i?、t144r/e154w/p373a/t505h/q573v/v584i、e114s/t144r/e154w/t505h/q573v/v584i、e154w/t505h/r551k/q573r/v584i/q585r或s81r/e154w/t505h/k547v/q573v/v584i,其中所述氨基酸位置是相對于對應于seq?id?no:224的參考序列。
181、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:366的殘基12至604的參考序列或與對應于seq?id?no:366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seqid?no:366的殘基12至604的參考序列或相對于對應于seq?id?no:366的參考序列包含一個或更多個取代。
182、在一些實施方案中,工程化dna聚合酶包含與對應于seq?id?no:402-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或?qū)趕eq?id?no:402-488中偶數(shù)編號的seqid?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:366的殘基12至604的參考序列或相對于對應于seq?id?no:366的參考序列包含一個或更多個取代。
183、在一些實施方案中,工程化dna聚合酶的氨基酸序列在以下一個或更多個氨基酸位置處包含至少一個取代或取代集:24/58/432、58/432/575、58/115/432/575、24/115/432/575、24/25/221/432、25/58/432/575、24/25/58/432/575、221/432/575、432/575、24/221/432、24/115/221/432、24/115/221/432/575、432、24/34/432、24/432/575、184/221/432/575、24/432、24/25/58/115/432/575、25/221/432、25/58/115/432、221/575、221/432、24/58/115/221/575、24/25/221/432/575、24/25/58/221/432、34/58/105/432、24/25/115/432、24/221/575、115/432、58/221、58/575、25/432/575、25/432、24/221/432/575、24/115/432、24/25/105/432、25/34/432、25/105/221/432、24/25/432、24/58/575或24/25/105/432/575,其中所述氨基酸位置是相對于對應于seq?id?no:366的參考序列。
184、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或取代集24m/58k/432l、58k/432l/575v、58k/115y/432l/575v、24m/115y/432l/575v、24m/25l/221m/432l、25l/58k/432l/575v、24m/25m/58k/432l/575v、221m/432l/575v、432l/575v、24m/221m/432l、24m/115y/221m/432l、24m/25m/221m/432l、24m/115y/221m/432l/575v、432l、24m/34d/432l、24m/432l/575v、184t/221m/432l/575v、24m/432l、24m/25l/58k/115y/432l/575v、25l/221m/432l、25m/58k/115y/432l、221m/575v、221m/432l、24m/58k/115y/221m/575v、24m/25m/221m/432l/575v、24m/25m/58k/221m/432l、34d/58k/105s/432l、24m/25m/115y/432l、24m/221m/575v、115y/432l、58k/221m、58k/575v、25l/432l/575v、25l/432l、24m/221m/432l/575v、24m/115y/432l、24m/25m/105s/432l、25m/34d/432l、24m/25l/105s/432l、25m/432l、25m/105s/221m/432l、24m/25l/432l、24m/58k/575v或24m/25m/105s/432l/575v,其中所述氨基酸位置是相對于對應于seq?id?no:3?66的參考序列。
185、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含至少一個取代或取代集l24m/a58k/q432l、a58k/q432l/i575v、a58k/l115y/q432l/i575v、l24m/l115y/q432l/i575v、l24m/p25l/v221m/q432l、p25l/a58k/q432l/i575v、l24m/p25m/a58k/q432l/i575v、v221m/q432l/i575v、q432l/i575v、l24m/v221m/q432l、l24m/l115y/v221m/q432l、l24m/p25m/v221m/q432l、l24m/l115y/v221m/q432l/i575v、q432l、l24m/e34d/q432l、l24m/q432l/i575v、a184t/v221m/q432l/i575v、l24m/q432l、l24m/p25l/a58k/l115y/q432l/i575v、p25l/v221m/q432l、p25m/a58k/l115y/q432l、v221m/i575v、v221m/q432l、l24m/a58k/l115y/v221m/i575v、l24m/p25m/v221m/q432l/i575v、l24m/p25m/a58k/v221m/q432l、e34d/a58k/i105s/q432l、l24m/p25m/l115y/q432l、l24m/v221m/i575v、l115y/q432l、a58k/v221m、a58k/i575v、p25l/q432l/i575v、p25l/q432l、l24m/v221m/q432l/i575v、l24m/l115y/q432l、l24m/p25m/i105s/q432l、p25m/e34d/q432l、l24m/p25l/i105s/q432l、p25m/q432l、p25m/i105s/v221m/q432l、l24m/p25l/q432l、l24m/a58k/i575v或l24m/p25m/i105s/q432l/i575v,其中所述氨基酸位置是相對于對應于seq?id?no:366的參考序列。
186、在一些實施方案中,工程化dna聚合酶的氨基酸序列在表5.1、6.1、7.1、8.1和9.1中提供的氨基酸位置處包含至少一個取代,其中所述取代是相對于對應于seq?id?no:2、10、80、244或366的參考序列,如每個表中提供的。
187、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含表5.1、6.1、7.1、8.1和9.1中提供的至少一個取代,其中所述取代是相對于對應于seq?id?no:2、10、80、244或366的參考序列,如每個表中提供的。
188、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含在表5.1、6.1、7.1、8.1和9.1中提供的一個或更多個氨基酸位置處的至少一個取代或取代集,其中所述取代或取代集是相對于對應于seq?id?no:2、10、80、244或366的參考序列,如每個表中提供的。
189、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含表5.1、6.1、7.1、8.1和9.1中提供的dna聚合酶變體的至少一個取代或取代集,其中所述取代或取代集是相對于對應于seq?id?no:2、10、80、244或366的參考序列,如每個表中提供的。
190、在一些實施方案中,工程化dna聚合酶包含與含有表5.1、6.1、7.1、8.1和9.1中列出的工程化dna聚合酶變體的取代或取代集的參考氨基酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
191、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604或包含seq?id?no:4-488中偶數(shù)編號的seq?id?no.。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代。
192、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486或488的殘基12至604。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代。
193、在一些實施方案中,工程化dna聚合酶的氨基酸序列包含seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486或488。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代。
194、在一些實施方案中,工程化dna聚合酶多肽在氨基酸序列中具有1個、2個、3個、4個或多達5個取代。在一些實施方案中,工程化dna聚合酶多肽在氨基酸序列中具有1個、2個、3個或4個取代。在一些實施方案中,取代包括保守取代。在一些實施方案中,取代包括非保守取代。在一些實施方案中,取代包括保守和非保守取代。在一些實施方案中,由本文公開的變體提供關于非保守和保守取代的指導。
195、在一些實施方案中,工程化dna聚合酶包含含有seq?id?no:10、80、224或366的殘基12至604的氨基酸序列或包含seq?id?no:10、80、224或366的氨基酸序列。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代、插入和/或缺失。在一些實施方案中,工程化dna聚合酶的氨基酸序列任選地具有1個、2個、3個、4個或5個取代。
196、將明顯的是,本文的描述,包括實施例,提供了示出了將特定氨基酸序列特征與工程化dna聚合酶多肽的功能活性關聯(lián)的序列結構信息的表格。該結構-功能相關信息以相對于seq?id?no:2、10、80、224或366的參考工程化dna聚合酶多肽的特定氨基酸殘基差異、以及用于示例性工程化dna聚合酶多肽的經(jīng)實驗確定的相關活性數(shù)據(jù)的形式來提供。這樣的信息提供了關于在制備工程化dna聚合酶變體中實施的取代的指導和信息。
197、在一些實施方案中,本公開內(nèi)容的工程化dna聚合酶具有dna聚合酶活性。在一些實施方案中,本公開內(nèi)容的工程化dna聚合酶具有逆轉錄酶活性。在一些實施方案中,本公開內(nèi)容的工程化dna聚合酶具有使用dna和rna作為模板的dna聚合酶活性。
198、在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有dna聚合酶和/或逆轉錄酶活性以及至少一種或更多種改進的性質(zhì)。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的活性。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的穩(wěn)定性。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的熱穩(wěn)定性。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的持續(xù)合成能力。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的保真度。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的輸入dna或rna(例如,靶)敏感性。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶在等溫擴增反應中具有增加的產(chǎn)物產(chǎn)率。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的耐鹽性。在一些實施方案中,參考dna聚合酶具有對應于seq?idno:2、10、80、224或366的殘基12至604的序列或?qū)趕eq?id?no:2、10、80、224或366的序列。在一些實施方案中,參考dna聚合酶具有對應于seq?id?no:2的殘基12至604的序列或?qū)趕eq?id?no:2的序列。
199、在一些實施方案中,工程化dna聚合酶對抑制劑具有增加的抗性。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶對抑制劑具有增加的抗性。在一些實施方案中,工程化dna聚合酶對乙醇、硫氰酸胍、病毒轉運介質(zhì)(vtm)、肝素、血紅素、rna或基因組dna具有增加的抗性。用于評估增加的抗性的示例性抑制劑濃度包括3%(v/v)乙醇、25mm硫氰酸胍、20%(v/v)vtm(參見,preparation?of?viral?transport?medium,centers?fordisease?control?and?prevention,sop#:dsr-052-05)、6.25單位/ml肝素、10μm血紅素、50ng總rna或100ng人類基因組dna。在一些實施方案中,參考dna聚合酶具有對應于seq?idno:2的殘基12至604的序列或?qū)趕eq?id?no:2的序列。在一些實施方案中,參考dna聚合酶是bst?3.0(new?england?biolabs,目錄號m0374)。在一些實施方案中,參考dna聚合酶是作為lavalamptmdna?master?mix(lgc?biosearch?technologies)商購可獲得的。
200、在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶具有增加的輸入dna或rna(例如,靶)敏感性,其中輸入是5ul體積中約1250拷貝、約1000拷貝、約750拷貝、約500拷貝、約200拷貝、約100拷貝或約75拷貝的靶rna或dna,例如,如實施例中提供的。在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶在等溫擴增反應中具有增加的產(chǎn)物產(chǎn)率,其中輸入靶是5ul體積中約1250拷貝、約1000拷貝、約750拷貝、約500拷貝、約200或約100拷貝的靶rna或dna,如實施例中提供的。
201、在一些實施方案中,與參考dna聚合酶相比,工程化dna聚合酶的改進的性質(zhì)選自i)增加的活性,ii)增加的穩(wěn)定性,iii)增加的熱穩(wěn)定性,iv)增加的持續(xù)合成能力,v)增加的保真度,vi)增加的對輸入靶rna或dna的敏感性,vii)增加的等溫擴增反應中的產(chǎn)物產(chǎn)率,viii)增加的耐鹽性,和ix)增加的對抑制劑的抗性,或i)、ii)、iii)、iv)、v)、vii)、vii)、viii)和ix)的任何組合。在一些實施方案中,參考dna聚合酶具有對應于seq?id?no:2、10、80、224或366的殘基12至604的序列或?qū)趕eq?id?no:2、10、80、224或366的序列。在一些實施方案中,參考dna聚合酶具有對應于seq?id?no:2的殘基12至604的序列或?qū)趕eq?id?no:2的序列。
202、在一些實施方案中,本文描述的dna聚合酶不具有顯著的或可測量的3’-核酸外切酶活性。在一些實施方案中,本文描述的dna聚合酶不具有顯著的或可測量的5’-核酸外切酶活性。在一些實施方案中,本文描述的dna聚合酶不具有顯著的或可測量的3’-核酸外切酶和5’-核酸外切酶活性。
203、盡管本文描述的工程化dna聚合酶涉及缺乏5’-核酸外切酶結構域的大片段,但應理解,在一些實施方案中,工程化dna聚合酶包含5’-核酸外切酶結構域。在一些實施方案中,可以將本文描述的變體的取代或取代集摻入含有dna聚合酶功能和5’-核酸外切酶結構域的全長dna聚合酶中。在一些實施方案中,本文描述的工程化dna聚合酶可以表達為與parageobacillus?genomosp?1的dna聚合酶的5’-核酸外切酶結構域的融合蛋白。在一些實施方案中,工程化dna聚合酶包含對應于由seq?id?no:539的多核苷酸序列編碼的seq?idno:540的殘基1至284的序列或與該序列融合。因此,對于本文描述為“大片段”的每種和每個工程化dna聚合酶,本公開內(nèi)容還包括包含5’-核酸外切酶結構域的工程化dna聚合酶。
204、在一些實施方案中,本公開內(nèi)容還提供了如表10.2中提供的dna聚合酶的大片段。在一些實施方案中,工程化dna聚合酶包含含有以下的氨基酸序列:
205、seq?id?no:490的氨基酸殘基12-603;
206、seq?id?no:492的氨基酸殘基12至605;
207、seq?id?no:494的氨基酸殘基12-603;
208、seq?id?no:496的氨基酸殘基12至603;
209、seq?id?no:498的氨基酸殘基12-600;
210、seq?id?no:500的氨基酸殘基12至603;
211、seq?id?no:502的氨基酸殘基12-603;
212、seq?id?no:504的氨基酸殘基12至605;
213、seq?id?no:506的氨基酸殘基12-606;
214、seq?id?no:508的氨基酸殘基12至503;
215、seq?id?no:510的氨基酸殘基12-607;
216、seq?id?no:512的氨基酸殘基12至604;
217、seq?id?no:514的氨基酸殘基12-605;
218、seq?id?no:516的氨基酸殘基12至600;
219、seq?id?no:518的氨基酸殘基12-605;
220、seq?id?no:520的氨基酸殘基12至601;
221、seq?id?no:522的氨基酸殘基12-599;
222、seq?id?no:524的氨基酸殘基12至599;
223、seq?id?no:526的氨基酸殘基12-605;
224、seq?id?no:528的氨基酸殘基12至600;
225、seq?id?no:530的氨基酸殘基12-600;或者
226、seq?id?no:532的氨基酸殘基12至602。
227、在一些實施方案中,工程化dna聚合酶包含含有seq?id?no:2、490、492、494、496、498、500、503、504、506、508、510、512、514、516、518、520、522、524、526、528、530或532的氨基酸序列。
228、在一些實施方案中,本公開內(nèi)容還提供了表10.2中提供的全長dna聚合酶的分離的dna聚合酶。在一些實施方案中,dna聚合酶包含uniprot?id?no.a0a023cmu9、p52026、a0a167uh07、m8d3y0、a0a0a2sk72、q08ie4、a0a4r1qh44、q45458、a0a0b4sb30、a0a0d1jlc4、a0a0n0i8n0、a0a3r9uck4、a0a084gx94、a0a176jap1、a0a1w1ii73、a0a2s0u8d5、a0a1i5vyy5、d5dmv6、e6u0l1、g8pdr9、k1knj5、l5n8z2或q03rj7的氨基酸序列,其中每個uniprot?id?no.的序列是截至2022年9月12日的序列。
229、在一些實施方案中,工程化dna聚合酶是融合蛋白的形式。在一些實施方案中,本文描述的工程化dna聚合酶可以與多種多肽序列,諸如,例如,但不限于可用于檢測和/或純化的多肽標簽融合。在一些實施方案中,工程化dna聚合酶的融合蛋白包含甘氨酸-組氨酸標簽或組氨酸標簽(his-標簽)。在一些實施方案中,工程化dna聚合酶的融合蛋白包含表位標簽,諸如c-myc、flag、v5或血凝素(ha)。在一些實施方案中,工程化dna聚合酶的融合蛋白包含gst、sumo、strep、mbp或gfp標簽。在一些實施方案中,融合蛋白被融合至工程化dna聚合酶多肽的氨基(n-)末端。在一些實施方案中,融合蛋白被融合至工程化dna聚合酶多肽的羧基(c-)末端。
230、在一些實施方案中,本公開內(nèi)容還提供了本文描述的工程化dna聚合酶多肽的功能片段或生物活性片段。因此,對于工程化dna聚合酶的每一種和每種實施方案,本文提供了工程化dna聚合酶的功能片段或生物活性片段。在一些實施方案中,工程化dna聚合酶的功能片段或生物活性片段包含其所衍生自的dna聚合酶多肽(即親本dna聚合酶)的至少約90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的活性。在一些實施方案中,功能性片段或生物活性片段包含dna聚合酶的親本序列的至少約90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些實施方案中,功能片段被截短少于5、少于10、少于15、少于20、少于25、少于30、少于35、少于40、少于45和少于50個氨基酸。
231、在一些實施方案中,本文的工程化dna聚合酶的功能片段包含工程化dna聚合酶的親本序列的至少70%、75%、80%、81%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%。在一些實施方案中,功能片段被截短少于5、少于10、少于15、少于10、少于25、少于30、少于35、少于40、少于45、少于50、少于55、少于60、少于65或少于70個氨基酸。
232、在一些實施方案中,本文描述的工程化dna聚合酶多肽的功能片段或生物活性片段在本文描述的工程化dna聚合酶的氨基酸序列中包含至少一個突變或突變集。因此,在一些實施方案中,工程化dna聚合酶的功能片段或生物活性片段顯示出與親本dna聚合酶中的突變或突變集相關的增強的或改進的特性。
233、編碼工程化多肽的多核苷酸、表達載體和宿主細胞
234、在另一方面,本公開內(nèi)容提供了編碼本文描述的工程化dna聚合酶多肽的重組多核苷酸。在一些實施方案中,重組多核苷酸可操作地連接至控制基因表達的一個或更多個異源調(diào)節(jié)序列,以產(chǎn)生能夠表達dna聚合酶的重組多核苷酸構建體。在一些實施方案中,包含編碼一種或更多種工程化dna聚合酶多肽的至少一種重組多核苷酸的表達構建體被引入適當?shù)乃拗骷毎幸员磉_對應的一種或更多種dna聚合酶多肽。
235、如對技術人員將是明顯的,蛋白序列的可得性以及對對應于多種氨基酸的密碼子的了解提供能夠編碼主題多肽的所有多核苷酸的描述。遺傳密碼的簡并性(其中相同氨基酸由可選的或同義的密碼子編碼)允許制備極大數(shù)目的核酸,所有這些核酸編碼本公開內(nèi)容的工程化dna聚合酶多肽。因此,本公開內(nèi)容提供了用于產(chǎn)生工程化dna聚合酶多核苷酸的每一種和每種可能的變體的方法和組合物,所述變體編碼本文描述的工程化dna聚合酶多肽,可以通過基于可能的密碼子選擇來選擇組合進行制備,并且對于本文描述的任何dna聚合酶多肽,包括實施例中(例如,表5.1、6.1、表7.1、表8.1、表9.1和表10.2中)和序列表中呈現(xiàn)的氨基酸序列,所有這樣的多核苷酸變體被認為具體地公開。
236、在一些實施方案中,密碼子被優(yōu)選地優(yōu)化,用于利用用于蛋白產(chǎn)生的選擇的宿主細胞。例如,細菌中使用的優(yōu)選的密碼子通常用于在細菌中表達,并且哺乳動物細胞中使用的優(yōu)選的密碼子通常用于在哺乳動物細胞中表達。因此,編碼工程化dna聚合酶多肽的經(jīng)密碼子優(yōu)化的多核苷酸在全長編碼區(qū)域中約40%、50%、60%、70%、80%、90%或大于90%的密碼子位置處包含優(yōu)選的密碼子。
237、因此,在一些實施方案中,本公開內(nèi)容的重組多核苷酸包含編碼本文描述的工程化dna聚合酶的多核苷酸序列。在一些實施方案中,重組多核苷酸的多核苷酸序列是密碼子優(yōu)化的。
238、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶或其功能片段的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:2、10、80、224或366的氨基酸殘基12至604的參考序列或與對應于seq?id?no:2、10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于如本文描述的對應于seq?id?no:2、10、80、224或366的氨基酸殘基12至604的參考序列或相對于如本文描述的對應于seq?id?no:2、10、80、224或366的參考序列包含一個或更多個取代。
239、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:2的氨基酸殘基12至604的參考序列或與對應于seq?id?no:2的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
240、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的氨基酸殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的氨基酸殘基12至604的參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
241、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的氨基酸殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:2的氨基酸殘基12至604的參考序列或相對于對應于seq?id?no:2的參考序列包含一個或更多個取代。
242、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下氨基酸位置處含有至少一個取代的氨基酸序列:21、24、25、25、34、36、52、58、66、68、81、84、92、101、105、114、115、124、133、133、134、136、144、152、154、168、183、184、191、192、210、212、221、226、230、241、252、253、276、287、290、294、295、300、304、322、325、372、373、374、393、427、432、452、454、456、462、470、483、486、495、505、509、541、541、545、547、551、552、573、575、578、584、585或593或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
243、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在氨基酸位置36、241、372或470或其組合處含有至少一個取代的氨基酸序列,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
244、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下氨基酸位置處含有至少一個取代的氨基酸序列:36、52、101、124、134、136、154、212、241、253、294、300、372、393、452、454、456、470、483、505、509、547、573或584或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
245、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下一個或更多個氨基酸位置處含有至少一個取代或取代集的氨基酸序列:509、300、452、36/241/372/470、124/192/210/372/427/456/552、124、52、483、372、393、212、52/66、133、454、154、593、462、541、21、573、505、152、294、545、101/241/470、584、304、295、578、456/470、253、290、192/241/372/456或252,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
246、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在表5.1、6.1、7.1、8.1和9.1中列出的氨基酸位置處含有至少一個取代的氨基酸序列,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
247、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有表5.1、6.1、7.1、8.1和9.1中列出的至少一個取代集的氨基酸序列,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列。
248、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在表5.1、6.1、7.1、8.1和9.1中列出的一個或更多個氨基酸位置處含有至少一個取代或取代集的氨基酸序列,其中所述氨基酸位置是相對于對應于seq?idno:2的參考序列。
249、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有對表5.1、6.1、7.1、8.1和9.1中列出的變體列出的至少一個取代或取代集的氨基酸序列,其中所述氨基酸位置是相對于對應于seq?id?no:2的參考序列的。
250、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
251、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
252、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或與對應于seq?id?no:10、80、224或366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?idno:10、80、224或366的殘基12至604的參考序列或相對于對應于seq?id?no:10、80、224或366的參考序列包含一個或更多個取代。
253、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:4-488中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10、80、224或366的殘基12至604的參考序列或相對于對應于seq?id?no:10、80、224或366的參考序列包含一個或更多個取代。
254、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下氨基酸位置處含有至少一個取代的氨基酸序列:21、24、25、25、34、36、52、58、66、68、81、84、92、101、105、114、115、124、133、133、134、136、144、152、154、168、183、184、191、192、210、212、221、226、230、241、252、253、276、287、290、294、295、300、304、322、325、372、373、374、393、427、432、452、454、456、462、470、483、486、495、505、509、541、541、545、547、551、552、573、575、578、584、585或593或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
255、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在氨基酸位置36、241、372或470或其組合處含有至少一個取代的氨基酸序列,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
256、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下氨基酸位置處含有至少一個取代的氨基酸序列:36、52、101、124、134、136、154、212、241、253、294、300、372、393、452、454、456、470、483、505、509、547、573或584或其組合,其中所述氨基酸位置是相對于對應于seq?id?no:10、80、224或366的參考序列。
257、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:10的殘基12至604的參考序列或與對應于seqid?no:10的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10的殘基12至604的參考序列或相對于對應于seq?id?no:10的參考序列包含一個或更多個取代。
258、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:10-218中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與對應于seq?id?no:10-218中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:10的殘基12至604的參考序列或相對于對應于seq?id?no:10的參考序列包含一個或更多個取代。
259、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下一個或更多個氨基酸位置處含有至少一個取代集的氨基酸序列:52/101/124/212/294/372/393/452/483/509、52/124/300/393/452、154/212/294/300/372/393/452/483/509、52/101/154/294/300/452/509/593、52/154/212/294/300/393/452、212/300/393/452/509、52/101/212/294/300/393/452/483/509/593、52/124/294/300/452/509、124/300/393/452/483/509/593、101/124/212/452/483/509、52/393/452/509/593、212/300/452/509/593、52/452/509/593、154/212/300/372/452/509/593、52/124/212/294/393/452/593、124/452/509、152/253/287/505/541/573/584、154/212/300/452、152/253/287/304/454/545/573/584、52/124/154/294/300/372/452/509、294/300/372/452/509/593、52/212/452、124/294/393/452、52/300/509/593、152/253/287/454/541/584、52/101/452/509、52/154/212/300/372/393/509、21/253/287/454/584、52/393/452、52/124/154/294/509、101/124/212/300/393、124/294/300/372/452/509/593、52/124/154/294/483/593、52/372/393/452/509/593、154/300/393/452/593、52/101/294/372/393/452/509、21/152/253/287/304/454/505、52/300/393、101/124/154/294/452/509、154/212/372/393/509/593、21/253/287/454/505/541、287/454/505/584、52/124/294/300/372/452、287/505/541/573、253/505/584、84/253/287/456/573、52/372/509/593、509/593、154/212/300/372/509、52/154/294/509/593、152/295/505/545/573、253/541/584、253/295/304/454/462/573/584、253/454/505/573/584、154/212/300、287/454/545/573、21/152/287/304/454、152/253/295/304/541/573、152/253/287/304/454、152/454/573、124/294/372/509/593、152/253/295/454、154/300/452、287/304/505、152/253/454/505、253/454/505、21/253/454/505/545、152/253/287/505、505/541/584或152/253/454/584,其中所述氨基酸位置是相對于對應于seq?id?no:10的參考序列。
260、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與對應于seq?id?no:80的殘基12至604的參考序列或與對應于seqid?no:80的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:80的殘基12至604的參考序列或相對于對應于seq?id?no:80的參考序列包含一個或更多個取代。
261、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與相對于對應于seq?id?no:220-258中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與相對于對應于seq?id?no:220-258中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:80的殘基12至604的參考序列或相對于對應于seq?id?no:80的參考序列包含一個或更多個取代。
262、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下一個或更多個氨基酸位置處含有至少一個取代和取代集的氨基酸序列:300/454/456/541/584、21/300/454/545/584、253/300/454/456/584、154/253/300/454/456/505/573、21/154/300/454/456/573、152/300/454/456/505/584/593、154/253/300/456/505/545/573/584、253/300/454/456/505/573、154/253/300/454/456/541/573/584、154/300/454/505、21/253/300/454/456/545/573/593、168/300/454/456/545/573、253/300/454/505/573、154/300/505/545/584、154/253/300/456/541/573/584、21/154/300/454/456/505/545、154/253/300/454/505、21/154/253/300/454/573、300/454/505/541/584、300/454/505/541/573、154/253/300/454、154/300/454/573、300/454/456/545/573、253/300/454/456、154/253/300/454/545/573、21/152/253/300/454/456/541/573、154/253/300/454/456/573、152/300/454、154/253/300/454/505/541/593、21/154/300/454/573/584、154/300/456/573/593、152/253/300/454/545/573、21/300/456/495/505/541/584、154/300/454/541/584、253/300/505/541/573/584、253/300/584、253/300/454/456/545、21/253/300/573、300/454/545、454/456/541/545/573/584、152/253/454/505/545/573、21/300/454/456/495、300/573、154/300/454/545、154/253/300/545/584、21/300/505、21/152/253/300/454/456/545、154/253/300/456/541/573、154/300/454、253/300/454/541、253/454/456/541/584、21/300/573、300/454/456、300/454、154/253/300/454/456、154/456/505/593、454/456/505、253/454/456/584、154/253/300、253/456/505/584、454/456、154/454、584、432/505/573、456/584、21/505/545/584、21/154/545/573、454/584、154/253/505或505,其中所述氨基酸位置是相對于對應于seq?id?no:80的參考序列。
263、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與相對于對應于seq?id?no:224的殘基12至604的參考序列或與相對于對應于seq?id?no:224的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:224的殘基12至604的參考序列或相對于對應于seq?id?no:224的參考序列包含一個或更多個取代。
264、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與相對于對應于seq?id?no:360-400中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與相對于對應于seq?id?no:360-400中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:224的殘基12至604的參考序列或相對于對應于seq?id?no:224的參考序列包含一個或更多個取代。
265、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下氨基酸位置處含有至少一個取代集的氨基酸序列:144/154/505/547/573/584、154/191/325/505/573/584、144/154/373/374/505/573/584、134/136/154/505/547/573/584、81/144/154/505/547/573/584、154/505/573/584、144/154/191/230/322/505/573/584、68/144/154/505/573/584、144/154/226/230/505/573/584、144/154/374/486/505/573/584、81/114/144/154/505/573/584、144/154/276/505/573/584、134/144/154/505/573/584、144/154/505/573/584、81/144/154/183/505/547/573/584、68/81/133/134/144/154/505/547/573/584、144/154/374/505/573/584、92/133/144/154/505/573/584、144/154/373/505/573/584、114/144/154/505/573/584、154/505/551/573/584/585或81/154/505/547/573/584,其中所述氨基酸位置是相對于對應于seq?idno:224的參考序列。
266、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與相對于對應于seq?id?no:366的殘基12至604的參考序列或與相對于對應于seq?id?no:366的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于對應于seq?id?no:366的殘基12至604的參考序列或相對于對應于seq?id?no:366的參考序列包含一個或更多個取代。
267、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與相對于對應于seq?id?no:402-488中偶數(shù)編號的seq?id?no.的殘基12至604的參考序列或與相對于對應于seq?id?no:402-488中偶數(shù)編號的seq?id?no.的參考序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列,其中所述氨基酸序列相對于相對于對應于seq?id?no:366的殘基12至604的參考序列或相對于對應于seq?id?no:366的參考序列包含一個或更多個取代。
268、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在以下一個或更多個氨基酸位置處含有至少一個取代或取代集的氨基酸序列:24/58/432、58/432/575、58/115/432/575、24/115/432/575、24/25/221/432、25/58/432/575、24/25/58/432/575、221/432/575、432/575、24/221/432、24/115/221/432、24/115/221/432/575、432、24/34/432、24/432/575、184/221/432/575、24/432、24/25/58/115/432/575、25/221/432、25/58/115/432、221/575、221/432、24/58/115/221/575、24/25/221/432/575、24/25/58/221/432、34/58/105/432、24/25/115/432、24/221/575、115/432、58/221、58/575、25/432/575、25/432、24/221/432/575、24/115/432、24/25/105/432、25/34/432、25/105/221/432、24/25/432、24/58/575或24/25/105/432/575,其中所述氨基酸位置是相對于對應于seq?id?no:366的參考序列。
269、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在表6.1、7.1、8.1和9.1中提供的氨基酸位置處含有至少一個取代的氨基酸序列,其中所述位置是相對于對應于seq?id?no:2、10、80、224或366的參考序列,如每個表中提供的。
270、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有表6.1、7.1、8.1和9.1中提供的至少一個取代的氨基酸序列,其中所述取代的氨基酸位置是相對于對應于seq?id?no:2、10、80、224或366的參考序列,如每個表中提供的。
271、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含在表6.1、7.1、8.1和9.1中提供的一個或更多個氨基酸位置處含有至少一個取代或取代集的氨基酸序列,其中所述氨基酸位置是相對于對應于seq?id?no:2、10、80、224或366的參考序列,如每個表中提供的。
272、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有表6.1、7.1、8.1和9.1中列出的變體的至少一個取代或取代集的氨基酸序列,其中所述取代或取代集的氨基酸位置是相對于對應于seq?id?no:2、10、80、224或366的參考序列,如每個表中提供的。
273、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含與含有表5.1、6.1、7.1、8.1和9.1中列出的工程化dna聚合酶變體的取代或取代集的參考氨基酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的氨基酸序列。
274、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的氨基酸序列或包含seq?id?no:4-488中偶數(shù)編號的seq?id?no.。
275、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有seq?id?no:10、80、224或366的殘基12至604或含有seq?idno:10、80、224或366的氨基酸序列。
276、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有以下序列的殘基12至604的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486或488,任選地,其中工程化dna聚合酶在氨基酸序列中具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。
277、在一些實施方案中,重組多核苷酸包含編碼工程化dna多肽的多核苷酸序列,所述工程化dna多肽包含含有以下的氨基酸序列:seq?id?no:4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、216、218、220、222、224、226、228、230、232、234、236、238、240、242、244、246、248、250、252、254、256、258、260、262、264、266、268、270、272、274、276、278、280、282、284、286、288、290、292、294、296、298、300、302、304、306、308、310、312、314、316、318、320、322、324、326、328、330、332、334、336、338、340、342、344、346、348、350、352、354、356、358、360、362、364、366、368、370、372、374、376、378、380、382、384、386、388、390、392、394、396、398、400、402、404、406、408、440、442、444、446、448、420、422、424、426、428、430、432、434、436、438、440、442、444、446、448、450、452、454、456、458、460、462、464、466、468、470、472、474、476、478、480、482、484、486或488,任選地,其中工程化dna聚合酶在氨基酸序列中具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。
278、在一些實施方案中,編碼的工程化dna聚合酶多肽在氨基酸序列中具有1個、2個、3個、4個、多達5個取代。在一些實施方案中,工程化dna聚合酶多肽在氨基酸序列中具有1個、2個、3個或4個取代。在一些實施方案中,取代包括保守取代。在一些實施方案中,取代包括非保守取代。在一些實施方案中,取代包括非保守取代和保守取代。
279、在一些實施方案中,重組多核苷酸包含編碼工程化dna聚合酶的多核苷酸序列,所述工程化dna聚合酶包含含有seq?id?no:10、80、224或366的殘基12至604的氨基酸序列或含有seq?id?no:10、80、224或366的氨基酸序列,任選地其中所述氨基酸序列在多肽序列中具有1個、2個、3個、4個、5個、6個、7個、8個、9個或多達10個取代。在一些實施方案中編碼的dna聚合酶在氨基酸序列中具有1個、2個、3個、4個、多達5個取代。在一些實施方案中,編碼的dna聚合酶在氨基酸序列中具有1個、2個、3個或4個取代。
280、在一些實施方案中,重組多核苷酸包含與對應于seq?id?no:1、9、79、223或365的核苷酸殘基34至1812的參考多核苷酸序列或與對應于seq?id?no:1、9、79、223或365的參考多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的多核苷酸序列,其中重組多核苷酸編碼工程化dna聚合酶。
281、在一些實施方案中,重組多核苷酸包含與對應于seq?id?no:3-487中奇數(shù)編號的seq?id?no.的核苷酸殘基34至1812的參考多核苷酸序列或與對應于seq?id?no:3-487中奇數(shù)編號的seq?id?no.的參考多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的多核苷酸序列,其中重組多核苷酸編碼工程化dna聚合酶。
282、在一些實施方案中,編碼工程化dna聚合酶的重組多核苷酸包含與對應于以下序列的核苷酸殘基34至1812的多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的多核苷酸序列:seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485或487。
283、在一些實施方案中,編碼工程化dna聚合酶的重組多核苷酸包含與對應于以下序列的多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的多核苷酸序列:seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485或487。
284、在一些實施方案中,編碼工程化dna聚合酶的重組多核苷酸包含含有以下的核苷酸殘基34至1812的多核苷酸序列:seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485或487。
285、在一些實施方案中,編碼工程化dna聚合酶的重組多核苷酸包含含有以下的多核苷酸序列:seq?id?no:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、215、217、219、221、223、225、227、229、231、233、235、237、239、241、243、245、247、249、251、253、255、257、259、261、263、265、267、269、271、273、275、277、279、281、283、285、287、289、291、293、295、297、299、301、303、305、307、309、311、313、315、317、319、321、323、325、327、329、331、333、335、337、339、341、343、345、347、349、351、353、355、357、359、361、363、365、367、369、371、373、375、377、379、381、383、385、387、389、391、393、395、397、399、401、403、405、407、409、411、413、415、417、419、421、423、425、427、429、431、433、435、437、439、441、443、445、447、449、451、453、455、457、459、461、463、465、467、469、471、473、475、477、479、481、483、485或487。
286、在一些實施方案中,重組多核苷酸包含含有seq?id?no:9、79、223或365的核苷酸殘基34至1812的多核苷酸序列或含有seq?id?no:9、79、223或365的多核苷酸序列。
287、在一些實施方案中,重組多核苷酸編碼包含含有以下的氨基酸序列的dna聚合酶:
288、seq?id?no:490的氨基酸殘基12至603;
289、seq?id?no:492的氨基酸殘基12至605;
290、seq?id?no:494的氨基酸殘基12至603;
291、seq?id?no:496的氨基酸殘基12至603;
292、seq?id?no:498的氨基酸殘基12至600;
293、seq?id?no:500的氨基酸殘基12至603;
294、seq?id?no:502的氨基酸殘基12至603;
295、seq?id?no:504的氨基酸殘基12至605;
296、seq?id?no:506的氨基酸殘基12至606;
297、seq?id?no:508的氨基酸殘基12至503;
298、seq?id?no:510的氨基酸殘基12至607;
299、seq?id?no:512的氨基酸殘基12至604;
300、seq?id?no:514的氨基酸殘基12至605;
301、seq?id?no:516的氨基酸殘基12至600;
302、seq?id?no:518的氨基酸殘基12至605;
303、seq?id?no:520的氨基酸殘基12至601;
304、seq?id?no:522的氨基酸殘基12至599;
305、seq?id?no:524的氨基酸殘基12至599;
306、seq?id?no:526的氨基酸殘基12至605;
307、seq?id?no:528的氨基酸殘基12至600;
308、seq?id?no:530的氨基酸殘基12至600;或者
309、seq?id?no:532的氨基酸殘基12至602。
310、在一些實施方案中,重組多核苷酸編碼包含含有seq?id?no:2、490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530或532的氨基酸序列的工程化dna聚合酶。
311、在一些實施方案中,重組多核苷酸包含與對應于seq?id?no:1、505、507、509、511、513、515、517、519、521、523、525、527、529或531的參考多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的多核苷酸序列,其中重組多核苷酸編碼如本文描述的dna聚合酶。在一些實施方案中,編碼工程化dna聚合酶的重組多核苷酸包含含有seq?id?no:1、489、491、493、495、497、499、501、503、505、507、509、511、513、515、517、519、521、523、525、527、529或531的多核苷酸序列。
312、在一些實施方案中,重組多核苷酸在高度嚴格條件下與本文描述的編碼工程化dna聚合酶的參考多核苷酸序列或其反向互補序列雜交。在一些實施方案中,參考多核苷酸序列對應于seq?id?no:1、9、79、223或365的殘基34至1812或?qū)趕eq?id?no:1、9、79、223或365的序列或其反向互補序列,或編碼本文提供的任何其他工程化dna聚合酶的多核苷酸序列或其反向互補序列。在一些實施方案中,重組多核苷酸在高度嚴格條件下與對應于seqid?no:1-487中奇數(shù)編號的seq?id?no.的殘基34至1812的參考多核苷酸序列雜交或與包含對應于seq?id?no:1-487中奇數(shù)編號的seq?id?no.的序列的參考多核苷酸雜交或與其反向互補序列雜交。
313、在一些實施方案中,在高度嚴格條件下雜交的重組多核苷酸包含與至少一個參考多核苷酸序列具有至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高序列同一性的序列,所述參考多核苷酸序列對應于表5.1、6.1、7.1、8.1或9.1中列出的多核苷酸序列的殘基34至1812或表5.1、6.1、7.1、8.1或9.1中列出的多核苷酸序列。
314、在一些實施方案中,編碼本文的dna聚合酶中的任何一個的重組多核苷酸以各種方式被操縱,以促進dna聚合酶多肽的表達。在一些實施方案中,編碼dna聚合酶的重組多核苷酸包含表達載體,其中存在一個或更多個控制序列來調(diào)節(jié)dna聚合酶多核苷酸和/或多肽的表達。根據(jù)使用的表達載體,在分離的多核苷酸插入載體之前對分離的多核苷酸的操縱可以是期望的或必要的。利用重組dna方法修飾多核苷酸和核酸序列的技術是本領域熟知的。在一些實施方案中,控制序列包括,除其他以外,啟動子、前導序列、多腺苷酸化序列、前肽序列、信號肽序列和轉錄終止子。
315、在一些實施方案中,基于使用的宿主細胞選擇適合的啟動子。對于細菌宿主細胞,用于指導本公開內(nèi)容的核酸構建體的轉錄的合適啟動子包括,但不限于從以下獲得的啟動子:大腸桿菌lac操縱子、天藍色鏈霉菌(streptomyces?coelicolor)瓊脂糖酶基因(daga)、枯草芽孢桿菌(bacillus?subtilis)果聚糖蔗糖酶基因(sacb)、地衣芽孢桿菌(bacilluslicheniformis)α-淀粉酶基因(amyl)、嗜熱嗜脂肪芽孢桿菌(bacillusstearothermophilus)麥芽糖淀粉酶基因(amym)、解淀粉芽孢桿菌(bacillusamyloliquefaciens)α-淀粉酶基因(amyq)、地衣芽孢桿菌青霉素酶基因(penp)、枯草芽孢桿菌xyla和xylb基因,以及原核β-內(nèi)酰胺酶基因(參見,例如,villa-kamaroff等人,proc.natl?acad.sci.usa,1978,75:3727-3731),以及tac啟動子(參見,例如,deboer等人,proc.natl?acad.sci.usa,1983,80:21-25)。用于絲狀真菌宿主細胞的示例性啟動子包括但不限于從以下的基因獲得的啟動子:米曲霉(aspergillus?oryzae)taka淀粉酶、米黑根毛霉(rhizomucor?miehei)天冬氨酸蛋白酶、黑曲霉(aspergillus?niger)中性α-淀粉酶、黑曲霉酸穩(wěn)定型α-淀粉酶、黑曲霉或泡盛曲霉(aspergillus?awamori)葡糖淀粉酶(glaa)、米黑根毛霉脂肪酶、米曲霉堿性蛋白酶、米曲霉磷酸丙糖異構酶、構巢曲霉(aspergillusnidulans)乙酰胺酶和尖孢鐮刀菌(fusarium?oxysporum)胰蛋白酶樣蛋白酶(參見,例如wo96/00787),以及na2-tpi啟動子(來自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖異構酶基因的啟動子的雜合體),和其突變體、截短的和雜合的啟動子。示例性酵母細胞啟動子可以來自以下的基因:釀酒酵母(saccharomyces?cerevisiae)烯醇酶(eno-1)、釀酒酵母半乳糖激酶(gal1)、釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(adh2/gap)、和釀酒酵母3-磷酸甘油酸激酶。用于酵母宿主細胞的其他有用的啟動子是本領域已知的(參見例如,romanos等人,yeast,1992,8:423-488)。用于在哺乳動物細胞中使用的示例性啟動子包括但不限于,來自巨細胞病毒(cmv)的啟動子、與cmv增強子融合的雞β-肌動蛋白啟動子、猿猴空泡病毒40(sv40)的啟動子、來自智人(homo?sapiens)磷酸甘油酸激酶、來自β-肌動蛋白、延伸因子-1a或甘油醛-3-磷酸脫氫酶基因的啟動子或來自家雞(gallus)β-肌動蛋白的啟動子。
316、在一些實施方案中,控制序列是合適的轉錄終止子序列(即,由宿主細胞識別以終止轉錄的序列)。在一些實施方案中,終止子序列可操作地連接至編碼dna聚合酶多肽的核酸序列的3’末端。在選擇的宿主細胞中有功能的任何合適的終止子可用于本發(fā)明中。對于細菌表達,轉錄終止子可以是依賴于rho轉錄因子的rho依賴性終止子,或者是不需要轉錄因子的rho獨立性或內(nèi)在終止子。示例性細菌轉錄終止子在peters等人,j?mol?biol.,2011,412(5):793-813中描述。用于絲狀真菌宿主細胞的示例性轉錄終止子可以從以下的基因獲得:米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶、和尖孢鐮刀菌胰蛋白酶樣蛋白酶。用于酵母宿主細胞的示例性終止子可以從以下的基因獲得:釀酒酵母烯醇酶、釀酒酵母細胞色素c(cyc1)、和釀酒酵母甘油醛-3-磷酸脫氫酶。用于酵母宿主細胞的其他有用的終止子是本領域已知的(參見例如,romanos等,上文)。用于哺乳動物細胞的示例性終止子包括但不限于來自巨細胞病毒(cmv)、猿猴病毒40(sv40)、來自智人生長激素基因hgh、牛生長激素bgh和人或兔β球蛋白的那些終止子。
317、在一些實施方案中,控制序列是合適的前導序列(對由宿主細胞的翻譯重要的mrna的非翻譯區(qū))。在一些實施方案中,前導序列可操作地連接至編碼dna聚合酶多肽的核酸序列的5’末端。在選擇的宿主細胞中有功能的任何合適的前導序列可用于本發(fā)明中。用于絲狀真菌宿主細胞的示例性前導序列從以下的基因獲得:米曲霉taka淀粉酶和構巢曲霉磷酸丙糖異構酶。用于酵母宿主細胞的合適的前導序列從以下的基因獲得:釀酒酵母烯醇化酶(eno-1)、釀酒酵母3-磷酸甘油酸激酶、釀酒酵母α-因子和釀酒酵母醇脫氫酶/甘油醛-3-磷酸脫氫酶(adh2/gap)。用于哺乳動物宿主細胞的合適的先導序列包括但不限于正痘病毒屬(orthopoxvirus)mrna或sv40?mrna中存在的5’-utr元件。
318、在一些實施方案中,控制序列是多腺苷酸化序列(即可操作地連接至核酸序列的3’末端的序列,并且其在轉錄時,被宿主細胞識別為將多腺苷殘基添加至轉錄的mrna的信號)。在選擇的宿主細胞中有功能的任何合適的多腺苷酸化序列可用于本發(fā)明中。用于絲狀真菌宿主細胞的示例性多腺苷酸化序列包括,但不限于以下的基因:米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、構巢曲霉鄰氨基苯甲酸合酶、尖孢鐮刀菌胰蛋白酶樣蛋白酶和黑曲霉α葡糖苷酶。用于酵母宿主細胞的有用的多腺苷酸化序列是已知的(參見例如guo和sherman,mol.cell.biol.,1995,15:5983-5990)。用于哺乳動物宿主細胞的有用的多腺苷酸化和3’utr序列包括但不限于α-和β-珠蛋白mrna的3-utr,其含有增加mrna穩(wěn)定性和翻譯的幾個序列元件,以及來自哺乳動物病毒諸如sv40的那些。
319、在一些實施方案中,控制序列也是信號肽(即編碼連接至多肽的氨基末端并將編碼的多肽引導到細胞的分泌途徑的氨基酸序列的編碼區(qū))。在一些實施方案中,核酸序列的編碼序列的5’末端包含符合翻譯閱讀框地與編碼分泌的多肽的編碼區(qū)的區(qū)段天然地連接的信號肽編碼區(qū)。將表達的多肽引導到選擇的宿主細胞的分泌途徑中的任何合適的信號肽編碼區(qū)可用于一種或更多種工程化多肽的表達。用于細菌宿主細胞的有效信號肽編碼區(qū)是包括但不限于從以下的基因獲得的那些信號肽編碼區(qū):芽孢桿菌nclb?11837麥芽糖淀粉酶、嗜熱脂肪芽孢桿菌α-淀粉酶、地衣芽孢桿菌枯草桿菌蛋白酶、地衣芽孢桿菌β-內(nèi)酰胺酶、嗜熱脂肪芽孢桿菌中性蛋白酶(nprt、nprs、nprm)和枯草芽孢桿菌prsa。另外的信號肽是本領域已知的(參見例如,simonen和palva,microbiol.rev.,1993,57:109-137)。在一些實施方案中,對于絲狀真菌宿主細胞有效的信號肽編碼區(qū)包括但不限于從以下的基因獲得的信號肽編碼區(qū):米曲霉taka淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特異腐質(zhì)霉(humicola?insolens)纖維素酶和humicola?lanuginosa脂肪酶。用于酵母宿主細胞的有用的信號肽包括但不限于來自以下的基因的那些:釀酒酵母α-因子和釀酒酵母轉化酶。用于哺乳動物宿主細胞的有用信號肽包括但不限于來自免疫球蛋白γ(igg)的基因和人類分泌蛋白(諸如人類β-半乳糖苷酶多肽)中的信號肽的那些。
320、在一些實施方案中,控制序列是編碼定位在多肽的氨基末端處的氨基酸序列的前肽編碼區(qū)。產(chǎn)生的多肽被稱為“前酶(proenzyme)”、“前多肽(propolypeptide)”或“酶原(zymogen)”。前多肽可以通過催化或自動催化前肽從前多肽的裂解被轉化為成熟活性多肽。前肽編碼區(qū)可以從包括但不限于以下的基因的任何合適的來源獲得:枯草芽孢桿菌堿性蛋白酶(apre)、枯草芽孢桿菌中性蛋白酶(nprt)、釀酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜熱毀絲霉(myceliophthora?thermophila)乳糖酶(參見例如wo?95/33836)。在信號肽和前肽區(qū)域兩者均存在于多肽的氨基末端時,前肽區(qū)域緊鄰多肽的氨基末端定位并且信號肽區(qū)域緊鄰前肽區(qū)域的氨基末端定位。
321、在一些實施方案中,控制序列是促進重組多核苷酸和/或編碼的多肽的表達的調(diào)節(jié)的調(diào)節(jié)序列。調(diào)節(jié)系統(tǒng)的實例是引起基因的表達響應于化學或物理刺激(包括調(diào)節(jié)性化合物的存在)被開啟或關閉的那些。在原核宿主細胞中,合適的調(diào)節(jié)序列包括但不限于lac、tac和trp操縱子系統(tǒng)。在酵母宿主細胞中,合適的調(diào)節(jié)系統(tǒng)包括但不限于adh2系統(tǒng)或gal1系統(tǒng)。在絲狀真菌中,合適的調(diào)節(jié)序列包括但不限于taka?α-淀粉酶啟動子、黑曲霉葡糖淀粉酶啟動子和米曲霉葡糖淀粉酶啟動子。
322、在另一方面,本公開內(nèi)容提供了一種重組表達載體,其包含編碼工程化dna聚合酶多肽的重組多核苷酸,其中重組多核苷酸可操作地連接至一個或更多個控制序列,諸如啟動子和終止子、復制起點等,這取決于它們將被引入其中的宿主的類型,例如,用于表達多核苷酸和/或編碼的多肽。在一些實施方案中,本文描述的各種核酸和控制序列與重組多核苷酸連接在一起(即,可操作地連接)以產(chǎn)生重組表達載體,所述重組表達載體包含一個或更多個方便的限制性位點,以允許在這樣的位點插入或取代編碼dna聚合酶多肽的核酸序列。在一些實施方案中,重組表達載體可以是任何合適的載體(例如,質(zhì)粒或病毒),其可以方便地經(jīng)受重組dna程序并導致dna聚合酶多核苷酸和/或編碼的多肽的表達。載體的選擇通常取決于載體與待引入載體的宿主細胞的相容性。載體可以是線性質(zhì)?;蜷]合的環(huán)狀質(zhì)粒。
323、在一些實施方案中,表達載體為自主復制載體(即,作為染色體外的實體存在的載體,其復制獨立于染色體復制,諸如質(zhì)粒、染色體外元件、微型染色體或人工染色體)。載體可以包含用于確保自我復制的任何工具(means)。在一些可選擇的實施方案中,載體是其中當被引入宿主細胞中時,被整合到基因組中并與其被整合進的一條或更多條染色體一起復制的載體。此外,在一些實施方案中,利用了單一載體或質(zhì)粒,或者一起包含待引入宿主細胞的基因組中的總dna的兩種或更多種載體或質(zhì)粒,和/或轉座子。
324、在一些實施方案中,重組多核苷酸可以在非復制表達載體或質(zhì)粒上提供。在一些實施方案中,非復制表達載體或質(zhì)粒可以基于復制缺陷的病毒載體(參見,例如,travieso等人,npj?vaccines,2022,vol.7,article?75)。
325、在一些實施方案中,表達載體包含允許容易選擇轉化的細胞的一個或更多個可選擇的標志物?!翱蛇x擇的標志物”是其產(chǎn)物提供抗微生物劑或病毒抗性、對重金屬的抗性、對營養(yǎng)缺陷型的原養(yǎng)性(prototrophy?to?auxotrophs)等的基因。細菌的可選擇的標志物的實例包括但不限于,來自枯草芽孢桿菌或地衣芽孢桿菌的dal基因,或賦予抗生素抗性諸如氨芐青霉素、卡那霉素、氯霉素或四環(huán)素抗性的標志物。用于酵母宿主細胞的合適的標志物包括但不限于ade2、his3、leu2、lys2、met3、trp1和ura3。用于在絲狀真菌宿主細胞中使用的可選擇的標志物包括但不限于amds(乙酰胺酶;例如來自構巢曲霉(a.nidulans)或米曲霉(a.orzyae))、argb(鳥氨酸氨甲酰轉移酶)、bar(膦絲菌素乙酰轉移酶;例如來自吸水鏈霉菌(s.hygroscopicus))、hph(潮霉素磷酸轉移酶)、niad(硝酸還原酶)、pyrg(乳清苷-5’-磷酸脫羧酶;例如來自構巢曲霉或米曲霉)、sc(硫酸腺苷酰轉移酶(sulfateadenyltransferase))和trpc(鄰氨基苯甲酸合酶),以及其等同物。
326、在另一方面,本公開內(nèi)容提供了一種宿主細胞,所述宿主細胞包含編碼本公開內(nèi)容的至少一種工程化dna聚合酶多肽的多核苷酸,所述多核苷酸被可操作地連接至一個或更多個控制序列用于在宿主細胞中表達一種或更多種工程化dna聚合酶。在一些實施方案中,宿主細胞包含表達載體,所述表達載體包含編碼本文描述的工程化dna聚合酶多肽的重組多核苷酸。在一些實施方案中,適用于表達由表達載體編碼的多肽的宿主細胞是原核細胞或真核細胞。本領域已知的宿主細胞包括但不限于細菌細胞,諸如大腸桿菌、河流弧菌(vibrio?fluvialis)、鏈霉菌屬(streptomyces)和鼠傷寒沙門氏菌(salmonellatyphimurium)細胞;真菌細胞,諸如酵母細胞(例如,釀酒酵母(saccharomycescerevisiae)或巴斯德畢赤酵母(pichia?pastoris)(atcc登錄號201178));昆蟲細胞諸如果蠅s2和夜蛾sf9細胞;動物(例如,哺乳動物)細胞,諸如cho、cos、bhk、293和鮑斯黑素瘤(bowes?melanoma)細胞;和植物細胞。示例性宿主細胞還包括多種大腸桿菌(escherichiacoli)菌株(例如,w3110(δfhua)和bl21)。
327、在另一方面,本公開內(nèi)容提供了一種產(chǎn)生工程化dna聚合酶多肽的方法,其中所述方法包括在適合于表達多肽的條件下培養(yǎng)能夠表達編碼工程化dna聚合酶多肽的多核苷酸的宿主細胞,使得產(chǎn)生工程化dna聚合酶。在一些實施方案中,所述方法還包括從培養(yǎng)基和/或宿主細胞中分離工程化dna聚合酶。在一些實施方案中,所述方法還包括純化dna聚合酶多肽,諸如通過本文描述的方法。
328、用于宿主細胞的合適的培養(yǎng)基和生長條件是本領域已知的。預期任何用于將表達dna聚合酶多肽的多核苷酸引入宿主細胞的合適方法可用于本發(fā)明。合適的技術包括但不限于,電穿孔、生物彈射粒子轟擊、脂質(zhì)體介導的轉染、氯化鈣轉染和原生質(zhì)體融合。
329、在一些實施方案中,重組多肽(例如,dna聚合酶變體)可以使用本領域已知的任何合適的方法產(chǎn)生。例如,存在本領域技術人員熟知的許多種不同的誘變技術。此外,誘變試劑盒還可從許多商業(yè)分子生物學供應商獲得。方法可以用于做出確定的氨基酸(定點)處的特定取代、基因的局部區(qū)域中的特異性(區(qū)域特異性)或隨機突變,或整個基因內(nèi)的隨機誘變(例如,飽和誘變)。本領域的技術人員已知產(chǎn)生酶變體的許多合適的方法,包括但不限于,使用pcr對單鏈dna或雙鏈dna定點誘變、盒式誘變、基因合成、易錯pcr、改組和化學飽和誘變,或本領域已知的任何其他合適的方法。用于dna和蛋白工程化的方法的非限制性實例在以下專利中提供:美國專利第6,117,679號;美國專利第6,420,175號;美國專利第6,376,246號;美國專利第6,586,182號;美國專利第7,747,391號;美國專利第7,747,393號;美國專利第7,783,428號;和美國專利第8,383,346號。在產(chǎn)生變體之后,可以針對任何期望的性質(zhì)(例如,高或增加的活性,或低或降低的活性,增加的熱活性,增加的穩(wěn)定性,增加的持續(xù)合成能力,增加的保真度,增加的抑制劑抗性或耐受性,增加的耐鹽性和/或ph穩(wěn)定性等)對它們進行篩選。
330、在一些實施方案中,具有本文公開的性質(zhì)的工程化dna聚合酶多肽可以通過例如,如本文描述的,使編碼天然存在的或工程化dna聚合酶多肽的多核苷酸經(jīng)受本領域已知的合適的誘變和/或定向進化方法來獲得。示例性的定向演化技術為誘變和/或dna改組(參見例如,stemmer,proc.natl.acad.sci.usa,1994,91:10747-10751;wo?95/22625;wo?97/0078;wo?97/35966;wo?98/27230;wo?00/42651;wo?01/75767和美國專利6,537,746)。可以使用的其他定向演化程序包括,交錯延伸過程(step)、體外重組(參見例如,zhao等人,nat.biotechnol.,1998,16:258-261)、誘變pcr(參見例如,caldwell等人,pcr?methodsappl.,1994,3:s136-s140)和盒式誘變(參見例如,black等人,proc.natl.acad.sci.usa,1996,93:3525-3529)以及其他。
331、誘變和定向進化的方法可以地應用至編碼dna聚合酶的多核苷酸,以產(chǎn)生可以被表達、篩選和測定的變體文庫。任何合適的誘變和定向進化方法可用于在本公開內(nèi)容中使用(參見,例如,美國專利號5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326、9,665,694、9,684,771,以及所有相關的pct和非美國的對應申請;ling等人,anal.biochem.,1997,254(2):157-78;dale等人,meth.mol.biol.,1996,57:369-74;smith,ann.rev.genet.,1985,19:423-462;botstein等人,science,1985,229:1193-1201;carter,biochem.j.,1986,237:1-7;kramer等人,cell,1984,38:879-887;wells等人,gene,1985,34:315-323;minshull等人,curr.op.chem.biol.,1999,3:284-290;christians等人,nat.biotechnol.,1999,17:259-264;crameri等人,nature,1998,391:288-291;crameri,等人,nat.biotechnol.,1997,15:436-438;zhang等人,proc.nat.acad.sci.u.s.a.,1997,94:4504-4509;crameri等人,nat.biotechnol.,1996,14:315-319;stemmer,nature,1994,366:389-391;stemmer,proc.nat.acad.sci.usa,1994,91:10747-10751;ep?3?049?973;wo?95/22625;wo?97/0078;wo?97/35966;wo?98/27230;wo?00/42651;wo?01/75767;wo?2009/152336;和wo?2015/048573,其全部通過引用并入本文)。
332、在一些實施方案中,通過使酶制劑經(jīng)受限定的處理條件或測定條件(例如,溫度、ph條件、模板類型(例如,dna、rna、gc含量、二級結構等)、輸入模板濃度、核苷酸等)并在處理或其他合適的測定條件后測量酶活性來篩選在誘變處理后獲得的克隆。然后將包含編碼感興趣的多肽的多核苷酸的克隆從基因分離,測序以鑒定核苷酸序列的改變(如果有),并且用于在宿主細胞中表達酶。測量來自表達文庫的酶活性可以使用本領域已知的任何合適的方法并且如實施例中描述的進行。
333、對于已知序列的工程化多肽,編碼酶的多核苷酸可以根據(jù)已知的合成方法通過標準的固相方法制備。在一些實施方案中,多達約100個堿基的核酸片段可以被單獨地合成,然后連接(例如,通過酶促或化學連接方法或聚合酶介導的方法)以形成任何期望的連續(xù)序列。例如,本文公開的多核苷酸和寡核苷酸可以使用經(jīng)典的亞磷酰胺方法通過化學合成制備(參見例如,beaucage等人,tet.lett.,22:1859-69[1981];和matthes等人,embo?j.,3:801-05[1984]),如通常在自動合成方法中所實踐的。lett.,1981,22:1859-69;和matthes等人,embo?j.,1984,3:801-05),如通常在自動化合成方法中所實踐的,通過化學合成制備。
334、在一些實施方案中,用于制備工程化dna聚合酶多肽的方法可以包括:(a)合成編碼包含選自本文描述的任何變體的氨基酸序列的多肽的多核苷酸,和(b)表達由所述多核苷酸編碼的dna聚合酶多肽。在該方法的一些實施方案中,由多核苷酸編碼的氨基酸序列可以任選地具有一個或幾個(例如,多達3個、4個、5個或多達10個)氨基酸殘基缺失、插入和/或取代。在一些實施方案中,氨基酸序列任選地具有1-2個、1-3個、1-4個、1-5個、1-6個、1-7個、1-8個、1-9個、1-10個、1-15個、1-20個、1-21個、1-22個、1-23個、1-24個、1-25個、1-30個、1-35個、1-40個、1-45個或1-50個氨基酸殘基缺失、插入和/或取代。在一些實施方案中,氨基酸序列任選地具有1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、30個、30個、35個、40個、45個或50個氨基酸殘基缺失、插入和/或取代。在一些實施方案中,氨基酸序列任選地具有1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、11個、12個、13個、14個、15個、16個、18個、20個、21個、22個、23個、24個或25個氨基酸殘基缺失、插入和/或取代。在一些實施方案中,取代是保守的或非保守的取代。
335、在一些實施方案中,使用用于蛋白純化的已知技術中的任何一種或更多種,將宿主細胞中表達的工程化dna聚合酶多肽中的任一種從細胞和/或培養(yǎng)基中回收和/或純化,用于蛋白純化的熟知技術除了其他以外包括,溶菌酶處理、聲處理(sonication)、過濾、鹽析、超離心和色譜法。
336、用于分離并純化dna聚合酶多肽的色譜技術,除了其他以外,包括反相色譜、高效液相色譜、離子交換色譜、疏水相互作用色譜、尺寸排阻色譜、凝膠電泳和親和色譜。用于純化特定的酶的條件可部分地取決于諸如凈電荷、疏水性、親水性、分子量、分子形狀等因素,并且對本領域技術人員將是明顯的。在一些實施方案中,親和技術可以用于分離改進的dna聚合酶。對于親和色譜純化,可以使用特異性結合感興趣的dna聚合酶多肽的任何抗體。為了產(chǎn)生抗體,通過注射dna聚合酶多肽或其片段免疫接種各種宿主動物,包括但不限于兔、小鼠、大鼠等。在一些實施方案中,dna聚合酶多肽或片段借助于側鏈官能基團或附接至側鏈官能基團的接頭被附接至合適的載體,諸如bsa。在工程化dna聚合酶包括允許用于親和純化的融合多肽諸如his標簽的情況下,可以使用針對特定融合蛋白的標準親和方法。
337、dna聚合酶的組合物
338、在另一方面,本公開內(nèi)容提供了本文公開的dna聚合酶的組合物。在一些實施方案中,組合物包含本文描述的至少一種工程化dna聚合酶多肽。在一些實施方案中,組合物中的工程化dna聚合酶多肽是分離或純化的。在一些實施方案中,dna聚合酶與其他組分和化合物組合以提供適合用于不同的應用和用途(例如,診斷方法、分子生物學工具和組合物)的包含工程化dna聚合酶多肽的組合物和制劑。
339、在一些實施方案中,組合物包含含有seq?id?no:2的殘基12至604的氨基酸序列或含有seq?id?no:2的序列的dna聚合酶和/或本文描述的至少一種工程化dna聚合酶。在一些實施方案中,所述組合物包含含有seq?id?no:4-488中偶數(shù)編號的seq?id?no.的殘基12至604的氨基酸序列或含有seq?id?no:4-488中偶數(shù)編號的seq?id?no.的氨基酸序列的工程化dna聚合酶。
340、在一些實施方案中,組合物包含表10.2中提供的dna聚合酶的大片段。在一些實施方案中,組合物包含含有以下的氨基酸序列的dna聚合酶:
341、seq?id?no:490的氨基酸殘基12-603;
342、seq?id?no:492的氨基酸殘基12-605;
343、seq?id?no:494的氨基酸殘基12-603;
344、seq?id?no:496的氨基酸殘基12-603;
345、seq?id?no:498的氨基酸殘基12-600;
346、seq?id?no:500的氨基酸殘基12-603;
347、seq?id?no:502的氨基酸殘基12-603;
348、seq?id?no:504的氨基酸殘基12-605;
349、seq?id?no:506的氨基酸殘基12-606;
350、seq?id?no:508的氨基酸殘基12-503;
351、seq?id?no:510的氨基酸殘基12-607;
352、seq?id?no:512的氨基酸殘基12至604;
353、seq?id?no:514的氨基酸殘基12-605;
354、seq?id?no:516的氨基酸殘基12-600;
355、seq?id?no:518的氨基酸殘基12-605;
356、seq?id?no:520的氨基酸殘基12-601;
357、seq?id?no:522的氨基酸殘基12-599;
358、seq?id?no:524的氨基酸殘基12-599;
359、seq?id?no:526的氨基酸殘基12-605;
360、seq?id?no:528的氨基酸殘基12-600;
361、seq?id?no:530的氨基酸殘基12-600;或者
362、seq?id?no:532的氨基酸殘基12-602。
363、在一些實施方案中,組合物包含含有以下的氨基酸序列的dna聚合酶:seq?id?no:490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530或532。
364、在一些實施方案中,組合物包含表10.2中提供的全長dna聚合酶。在一些實施方案中,組合物包含具有uniprot?id?no.a0a023cmu9、p52026、a0a167uh07、m8d3y0、a0a0a2sk72、q08ie4、a0a4r1qh44、q45458、a0a0b4sb30、a0a0d1jlc4、a0a0n0i8n0、a0a3r9uck4、a0a084gx94、a0a176jap1、a0a1w1ii73、a0a2s0u8d5、a0a1i5vyy5、d5dmv6、e6u0l1、g8pdr9、k1knj5、l5n8z2或q03rj7的氨基酸序列的dna聚合酶。
365、在一些實施方案中,組合物還包含緩沖液、核苷酸底物(例如,dntp、dntp類似物和/或修飾的dntp)和/或至少一種引物(例如,與靶核酸互補的合成引物)中的一種或更多種。在一些實施方案中,組合物還包含模板多核苷酸,特別是模板dna或rna。在一些實施方案中,模板多核苷酸包含異源模板dna或rna。在一些實施方案中,模板多核苷酸包含dna和rna的混合物。
366、在一些實施方案中,組合物還可以包含除本文描述的工程化dna聚合酶之外的dna聚合酶(例如,第二dna聚合酶)。在一些實施方案中,第二dna聚合酶是第二熱穩(wěn)定dna聚合酶,例如taq或pfu聚合酶,或者逆轉錄酶,諸如在rt-pcr偶聯(lián)反應中有用的那些。在一些實施方案中,組合物包含探針或指示物,諸如核酸結合染料(例如,green,等),用于檢測和/或定量例如在qrt-pcr反應中形成的產(chǎn)物的量。
367、在一些實施方案中,本文描述的工程化dna聚合酶在溶液中提供或被固定在基底上。在一些實施方案中,基底是固體基底或膜或顆粒。酶可以被包埋在基質(zhì)或膜中。在一些實施方案中,基質(zhì)包括聚合物材料諸如藻酸鈣、瓊脂、k-角叉菜膠、聚丙烯酰胺和膠原,或固體基質(zhì)諸如活性炭、多孔陶瓷和硅藻土。在一些實施方案中,基質(zhì)是顆粒、膜或纖維。膜的類型包括尼龍、纖維素、聚砜或聚丙烯酸酯以及其他。
368、在一些實施方案中,酶被固定在支持物材料的表面上。在一些實施方案中,酶被吸附在支持物材料上。在一些實施方案中,酶通過共價附接被固定在支持物材料上。支持物材料包括無機材料,諸如氧化鋁、二氧化硅、多孔玻璃、陶瓷、硅藻土、黏土和膨潤土或有機材料,諸如纖維素(cmc、deae-纖維素)、淀粉、活性炭、聚丙烯酰胺、聚苯乙烯和離子交換樹脂,諸如amberlite、sephadex和dowex以及其他。
369、工程化dna聚合酶多肽及試劑盒的用途
370、在另一方面,本公開內(nèi)容提供了工程化dna聚合酶用于診斷和分子生物學目的的用途,諸如用于檢測靶核酸的存在、核酸測序和核酸的直接/間接擴增。
371、在一些實施方案中,工程化dna聚合酶被用于制備靶核酸/多核苷酸的互補dna。在一些實施方案中,制備靶核酸/多核苷酸的互補dna的方法包括在存在足以產(chǎn)生互補dna的底物的條件下,在適于產(chǎn)生與靶核酸/多核苷酸的全部或部分(all?or?a?portion)(即,整體或部分(whole?or?in?part))互補的互補dna的反應條件下,使靶核酸/多核苷酸與具有包含seq?id?no:2的殘基12至604的序列或包含seq?id?no:2的氨基酸序列的dna聚合酶;本文描述的工程化dna聚合酶;或表10.2中描述的dna聚合酶接觸。在一些實施方案中,靶核酸/多核苷酸是dna。在一些實施方案中,靶核酸/多核苷酸是rna。在一些實施方案中,靶核酸/多核苷酸包含dna和rna的混合物。
372、在一些實施方案中,用于在所述方法中使用的dna聚合酶包含含有以下的氨基酸序列:
373、seq?id?no:490的氨基酸殘基12至603;
374、seq?id?no:492的氨基酸殘基12至605;
375、seq?id?no:494的氨基酸殘基12至603;
376、seq?id?no:496的氨基酸殘基12至603;
377、seq?id?no:498的氨基酸殘基12至600;
378、seq?id?no:500的氨基酸殘基12至603;
379、seq?id?no:502的氨基酸殘基12至603;
380、seq?id?no:504的氨基酸殘基12至605;
381、seq?id?no:506的氨基酸殘基12至606;
382、seq?id?no:508的氨基酸殘基12至503;
383、seq?id?no:510的氨基酸殘基12至607;
384、seq?id?no:512的氨基酸殘基12至604;
385、seq?id?no:514的氨基酸殘基12至605;
386、seq?id?no:516的氨基酸殘基12至600;
387、seq?id?no:518的氨基酸殘基12至605;
388、seq?id?no:520的氨基酸殘基12至601;
389、seq?id?no:522的氨基酸殘基12至599;
390、seq?id?no:524的氨基酸殘基12至599;
391、seq?id?no:526的氨基酸殘基12至605;
392、seq?id?no:528的氨基酸殘基12至600;
393、seq?id?no:530的氨基酸殘基12至600;或者
394、seq?id?no:532的氨基酸殘基12至602。
395、在一些實施方案中,用于在所述方法中使用的dna聚合酶包含含有seq?id?no:490、492、494、496、498、500、502、504、506、508、510、512、514、516、518、520、522、524、526、528、530或532的氨基酸序列。
396、在一些實施方案中,用于在本文方法中使用的dna聚合酶包含表10.2中提供的全長dna聚合酶。在一些實施方案中,用于在所述方法中使用的dna聚合酶包含uniprot?idno.a0a023cmu9、p52026、a0a167uh07、m8d3y0、a0a0a2sk72、q08ie4、a0a4r1qh44、q45458、a0a0b4sb30、a0a0d1jlc4、a0a0n0i8n0、a0a3r9uck4、a0a084gx94、a0a176jap1、a0a1w1ii73、a0a2s0u8d5、a0a1i5vyy5、d5dmv6、e6u0l1、g8pdr9、k1knj5、l5n8z2或q03rj7的氨基酸序列。
397、如本文討論和本領域已知的,底物包括用于dna聚合酶活性的核苷酸(例如,dntp或dntp類似物)和/或寡核苷酸引物。引物可以與靶核酸的特定序列互補,或可以為隨機引物,諸如用于產(chǎn)生dna文庫。在一些實施方案中,反應條件包括dna聚合酶活性所需的組分,諸如二價金屬,例如,mg+2,和/或處于適當ph的緩沖液。
398、在一些實施方案中,靶核酸/多核苷酸是適合作為工程化dna聚合酶的模板的任何dna或rna,包括但不限于基因組dna或mrna、線粒體dna或rna、無細胞dna或無細胞rna(例如,從血液/血清獲得的)、細菌dna或rna、真菌dna或rna、植物dna或rna、哺乳動物dna或rna或病毒dna或rna。
399、在一些實施方案中,seq?id?no:2的dna聚合酶、本文描述的工程化dna聚合酶或表10.2中的其他dna聚合酶可用于診斷應用,例如,用于檢測靶核酸/多核苷酸(包括dna和rna)的存在。在一些實施方案中,用于檢測靶核酸/多核苷酸的存在的方法包括在存在底物的情況下,在適合于dna聚合酶介導產(chǎn)生與靶核酸/多核苷酸的全部或部分(即,整體或部分)互補的dna的條件下,使懷疑含有靶核酸/多核苷酸的樣品與dna聚合酶反應,并檢測互補dna的存在,所述dna聚合酶包含含有seq?id?no:2的殘基12至604的氨基酸序列或含有seq?id?no:2的氨基酸序列;本文描述的工程化dna聚合酶;或表10.2中展示的dna聚合酶。在一些實施方案中,靶核酸/多核苷酸是dna。在一些實施方案中,靶核酸/多核苷酸是rna。在一些實施方案中,靶核酸/多核苷酸包含dna和rna的混合物。
400、在一些實施方案中,合適的反應條件,特別是對于工程化dna聚合酶的合適的反應條件,包括15℃至80℃、15℃至75℃、20℃至70℃、25℃至65℃、30℃至60℃或35℃至55℃的反應溫度。在一些實施方案中,反應溫度為約15℃、20℃、25℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃或80℃。
401、在一些實施方案中,樣品可以是懷疑含有靶核酸的任何材料或物質(zhì)。在一些實施方案中,樣品是生物樣品,諸如活檢和尸檢樣品、出于組織學目的獲取的冷凍切片、血液、血漿、血清、痰、糞便、眼淚、黏液、毛發(fā)、皮膚等。在一些實施方案中,生物樣品是細胞或病毒,諸如來自細菌培養(yǎng)物、病毒培養(yǎng)物或細胞培養(yǎng)物的細胞或病毒。在一些實施方案中,樣品是環(huán)境樣品,包括來自水(包括海洋、河流、垃圾/下水道等)、土壤、空氣、通風口或表面(諸如地板、機器、柜臺等)的樣品以及其他。
402、在一些實施方案中,由dna聚合酶產(chǎn)生的互補dna產(chǎn)物的檢測可以通過本領域已知的方法實現(xiàn)。在一些實施方案中,互補dna通過擴增該互補dna,諸如通過pcr或等溫擴增來檢測。在一些實施方案中,用于與工程化dna聚合酶一起使用的等溫擴增方法包括lamp、全基因組擴增(wga)和多重置換擴增以及其他。在一些實施方案中,核苷酸底物中的一種或更多種可以被標記,并且取決于標記,可以直接(例如,熒光標記的核苷酸)或間接(例如,生物素標記的核苷酸)被檢測。在一些實施方案中,dna聚合酶反應中使用的一種或更多種引物可以被標記。
403、在一些實施方案中,工程化dna聚合酶被用于檢測靶rna,其中本文描述的工程化dna聚合酶的逆轉錄酶活性被用于制備靶rna的dna拷貝。在一些實施方案中,dna聚合酶還用于擴增靶rna的dna拷貝。在一些實施方案中,逆轉錄酶反應與使用dna聚合酶的擴增反應分開進行。在一些實施方案中,逆轉錄酶反應和使用dna聚合酶的dna擴增反應依次進行。在一些實施方案中,逆轉錄酶反應和使用dna聚合酶的dna擴增反應同時或并行進行。在一些實施方案中,逆轉錄酶反應和dna擴增反應是“一鍋”反應。在一些實施方案中,逆轉錄酶反應和dna擴增反應在分開的反應中進行。
404、在一些實施方案中,擴增靶dna或rna的方法包括在存在底物的情況下,在適合于擴增靶dna或rna的條件下,使靶dna或rna與包含含有seq?id?no:2的殘基12至604的氨基酸序列或含有seq?id?no:2的氨基酸序列的dna聚合酶;本文描述的工程化dna聚合酶;或表10.2中提供的dna聚合酶接觸。在一些實施方案中,擴增dna或rna是通過等溫擴增,諸如通過lamp。
405、在一些實施方案中,工程化dna聚合酶用于對核酸進行測序。用于dna測序的各種方法,特別是ngs測序方法,是本領域熟知的。在一些實施方案中,對靶dna進行測序的方法包括在存在適合于測序的底物的情況下,在適合于dna聚合酶介導的靶dna的互補dna的延伸的條件下,使靶dna與包含含有seq?id?no:2的殘基12至604的氨基酸序列或含有seq?idno:2的氨基酸序列的dna聚合酶;或本文描述的工程化dna聚合酶;或表10.2中提供的dna聚合酶接觸,并確定靶dna的序列。
406、在另一方面,本公開內(nèi)容提供了一種試劑盒,所述試劑盒包含具有含有seq?idno:2的殘基12至604的氨基酸序列或具有seq?id?no:2的氨基酸序列的dna聚合酶;或至少一種本文公開的工程化dna聚合酶;或如本文描述的表10.2中提供的至少一種dna聚合酶。在一些實施方案中,試劑盒還包含緩沖液、核苷酸底物和/或寡核苷酸引物中的一種或更多種。在一些實施方案中,試劑盒可以包含多個(例如兩個或更多個)寡核苷酸引物,例如針對靶核酸的不同部分。在一些實施方案中,試劑盒還包含模板dna或rna,例如用作檢測靶dna或rna的陽性對照的限定序列和/或量的對照模板dna或rna。在一些實施方案中,試劑盒包含第二dna聚合酶,諸如taq或pfu?dna聚合酶。
407、實施例
408、提供以下實施例,包括實驗和獲得的結果,僅用于說明的目的,而不應被解釋為限制本發(fā)明。
409、在下面公開的實驗中,以下縮寫在相關的情況下適用:ppm(百萬分率);m(摩爾/升);mm(毫摩爾/升)、um和μm(微摩爾/升);nm(納摩爾/升);mol(摩爾);gm和g(克);mg(毫克);ug和μg(微克);l和l(升);ml和ml(毫升);μl和μl(微升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(分鐘);h和hr(小時);u(單位);mw(分子量);rpm(每分鐘轉數(shù));rcf(相對離心力);psi和psi(磅/平方英寸);℃(攝氏度);rt和rt(室溫);ngs(下一代測序);ds(雙鏈);ss(單鏈);cds(編碼序列);dna(脫氧核糖核酸);rna(核糖核酸);e.coli?w3110(常用的實驗室大腸桿菌菌株,可從coli?genetic?stock?center[cgsc]獲得);htp(高通量);hplc(高壓液相色譜法);ddh2o(雙蒸餾水);pbs(磷酸鹽緩沖鹽水);bsa(牛血清白蛋白);dtt(二硫蘇糖醇);cam(氯霉素);cat(氯霉素乙酰轉移酶);iptg(異丙基β-d-1-硫代吡喃半乳糖苷);fiopc(相對于陽性對照的倍數(shù)改進)或fiop(相對于親本的倍數(shù)改進);lb(luria-bertani);tb(terrific-broth);spri(固相可逆固定化);gitc(硫氰酸胍);cdc(美國疾病控制中心)。
410、實施例1
411、含有重組dna聚合酶基因的大腸桿菌表達宿主
412、用于產(chǎn)生本文公開的變體的初始dna聚合酶是seq?id?no:2,其是parageobacillus?genomosp.1的野生型dna聚合酶的大片段(即,氨基酸殘基285至876),在lac1阻遏物的控制下被克隆到表達載體pck110900中(參見,美國專利申請公布第2006/0195947號的圖3)可操作地連接至lac啟動子。所述表達載體還包含p15a復制起點和氯霉素抗性基因。使用本領域已知的標準方法,用所得質(zhì)粒轉化大腸桿菌w3110。通過使細胞經(jīng)歷氯霉素選擇來分離轉化體,如本領域已知的(參見例如美國專利第8,383,346號和wo2010/144103)。
413、實施例2
414、htp含有逆轉錄酶(rt)的濕細胞沉淀物的制備
415、將來自單克隆菌落的包含重組dna聚合酶編碼基因的大腸桿菌細胞接種到96孔淺孔微量滴定板的孔中的含有1%葡萄糖和30μg/ml氯霉素(cam)的180μl?lb中。將板用o2可透過密封件密封,并使培養(yǎng)物在30℃、200rpm和85%濕度生長過夜。然后,將10μl的每一種細胞培養(yǎng)物轉移到含有390ml?tb和30μg/ml?cam的96孔深孔板的孔中。用o2可透過的密封件密封深孔板,并且在30℃、250rpm和85%濕度培養(yǎng),直至達到od6000.6-0.8。然后將細胞培養(yǎng)物用終濃度為1mm的iptg誘導,并在與最初使用的相同條件下孵育過夜。然后將細胞在4,000rpm離心10min進行沉淀。棄去上清液,并在裂解前將沉淀冷凍在-80℃。
416、實施例3
417、htp含有dna聚合酶的細胞裂解物的制備
418、為了制備細胞裂解物,將含有50mm三乙醇胺-hcl(ph?7.5)的200μl緩沖液添加到每個孔中的如實施例2中所述地產(chǎn)生的細胞糊狀物中。在臺式振蕩器上搖動板以重懸細胞。將懸浮液(100μl)轉移到96孔硬殼pcr板中,并在熱循環(huán)儀中在68℃至80℃范圍的、在具體實施例中指定的設定裂解溫度裂解60min。然后將板在4,000rpm和4℃離心15min。將澄清的上清液任選地稀釋并用于生物催化反應以確定它們的活性、rna敏感性和熱穩(wěn)定性水平。
419、實施例4
420、使用熱處理的裂解物用于rt-lamp反應以進行sars-cov-2檢測
421、使用靶向cov-orf1a的引物組進行rt-lamp測定,該引物組由不同濃度的六種寡核苷酸組成(終濃度fip:1.6um,bip:1.6um,f3:0.2um,b3:0.2um,loop?f:0.4um,loop?b:0.5um)。在包含以下的5ul反應中篩選每種變體:sars-cov-2合成rna對照1(genbank/gisaid?id?mt007544.1,twist?biosciences部件號102019,每個反應50-1250個拷貝,如實施例中指定的)、0.5ul?10×等溫擴增緩沖液(neb目錄號b0537s)、0.5ul?10×orf1a?lamp引物混合物(fip:16um,bip:16um,f3:2um,b3:2um,loop?f:4um,loop?b:4um)、dntp混合物(每種dntp的終濃度1.1mm)、0.3ul?100mm?mgso4(終濃度6mm;總計8mm,包括來自10×等溫擴增緩沖液的貢獻)、0.25ul?(20×水儲備液,1.25um終濃度)、2ul含有dna聚合酶變體的熱處理的大腸桿菌裂解物(裂解物在加入反應之前稀釋,如以下實施例中指定的)。最后加入合成rna對照以引發(fā)反應。將384孔pcr板短暫渦旋并離心進行混合,然后插入cfx?touch?384孔實時pcr檢測系統(tǒng)(bio-rad)中。等溫擴增反應在65℃進行30秒的120個循環(huán),每次循環(huán)后在fam通道中分析反應的熒光。
422、
423、實施例5
424、相對于seq?id?no:2在熱穩(wěn)定性方面的改進
425、在不存在單獨的逆轉錄酶的情況下,在rt-lamp反應中篩選各種野生型酶的大片段(參見表10.2)的逆轉錄酶和lamp活性兩者之后,選擇實施例1中描述的seq?id?no:2的dna聚合酶的大片段作為親本酶。使用確立的技術(例如,飽和誘變、先前鑒定的有益突變的重組)產(chǎn)生工程化基因的文庫。如實施例2描述的以htp產(chǎn)生由每個基因編碼的多肽,并如實施例3描述的產(chǎn)生可溶性裂解物,裂解溫度為68℃。將澄清的裂解物稀釋四倍,然后如實施例4中描述的用1250拷貝的sars-cov-2rna建立rt-lamp反應。
426、將相對于seq?id?no:2的熱處理后的殘余活性(活性fiop)計算為定量循環(huán)(cq)值的倒數(shù),并在表5.1中示出。將120個循環(huán)后不具有高于閾值的可檢測信號的樣品(包括不具有可檢測信號的陽性和陰性對照)設置為120的cq(測量的最大循環(huán))而不是未檢測到(n.d.)以實現(xiàn)倍數(shù)改進計算。
427、
428、
429、實施例6
430、相對于seq?id?no:10在熱穩(wěn)定性方面的改進
431、選擇seq?id?no:10作為本輪定向演化的親本酶。使用確立的技術(例如,飽和誘變、先前鑒定的有益突變的重組)產(chǎn)生工程化基因的文庫。如實施例2中描述的以htp產(chǎn)生由每個基因編碼的多肽,并且如實施例3中描述的產(chǎn)生可溶性裂解物,其中重復板在71℃、72℃、73.5℃和75℃的裂解溫度裂解。將澄清的裂解物稀釋8倍,然后如實施例4中描述的用1250拷貝的sars-cov-2rna建立rt-lamp反應。
432、將相對于seq?id?no:10的熱處理后的殘余活性(活性fiop)計算為定量循環(huán)(cq)值的倒數(shù),并在表6.1中示出。將120個循環(huán)后不具有高于閾值的可檢測信號的樣品(包括不具有可檢測信號的陽性和陰性對照)設置為120的cq(測量的最大循環(huán))而不是未檢測到(n.d.)以實現(xiàn)倍數(shù)改進計算。
433、
434、
435、
436、
437、
438、
439、
440、實施例7
441、相對于seq?id?no:80在熱穩(wěn)定性方面的改進
442、選擇seq?id?no:80作為本輪定向演化的親本酶。使用充分確立的技術(例如,飽和誘變、先前鑒定的有益突變的重組)產(chǎn)生工程化基因的文庫。如實施例2中描述的以htp產(chǎn)生由每個基因編碼的多肽,并且如實施例3中描述的產(chǎn)生可溶性裂解物,其中重復板在77℃、78℃和79℃的裂解溫度裂解。將澄清的裂解物稀釋8倍,然后如實施例4中描述的用1000拷貝的sars-cov-2rna建立rt-lamp反應。
443、將相對于seq?id?no:80的熱處理后的殘余活性(活性fiop)計算為定量循環(huán)(cq)值的倒數(shù),并在表7.1中示出。將120個循環(huán)后不具有高于閾值的可檢測信號的樣品(包括不具有可檢測信號的陽性和陰性對照)設置為120的cq(測量的最大循環(huán))而不是未檢測到(n.d.),以實現(xiàn)倍數(shù)改進計算。
444、
445、
446、
447、
448、
449、
450、
451、
452、
453、
454、
455、實施例8
456、相對于seq?id?no:224在等溫聚合酶活性方面的改進
457、選擇seq?id?no:224作為本輪定向演化的親本酶。使用確立的技術(例如,飽和誘變、先前鑒定的有益突變的重組)產(chǎn)生工程化基因的文庫。如實施例2中描述的以htp產(chǎn)生由每個基因編碼的多肽,并如實施例3中描述的產(chǎn)生可溶性裂解物,其中重復板在75℃的裂解溫度裂解。將澄清的裂解物稀釋8倍,然后如實施例4中描述的用100拷貝的sars-cov-2rna建立rt-lamp反應。
458、將相對于seq?id?no:224的熱處理后的殘余活性(活性fiop)計算為定量循環(huán)(cq)值的倒數(shù),并在表8.1中示出。將120個循環(huán)后不具有高于閾值的可檢測信號的樣品(包括不具有可檢測信號的陽性和陰性對照)設置為120的cq(測量的最大循環(huán))而不是未檢測到(n.d.)以實現(xiàn)倍數(shù)改進計算。
459、
460、
461、
462、實施例9
463、相對于seq?id?no:366在等溫聚合酶活性方面的改進
464、選擇seq?id?no:366作為本輪定向演化的親本酶。使用充分確立的技術(例如,飽和誘變、先前鑒定的有益突變的重組)產(chǎn)生工程化基因的文庫。如實施例2中描述的以htp產(chǎn)生由每個基因編碼的多肽,并如實施例3中描述的產(chǎn)生可溶性裂解物,其中重復板在80℃的裂解溫度裂解。將澄清的裂解物稀釋8倍,然后如實施例4中描述的用500拷貝的sars-cov-2rna建立rt-lamp反應。
465、將相對于seq?id?no:366的熱處理后的殘余活性(活性fiop)計算為定量循環(huán)(cq)值的倒數(shù),并在表9.1中示出。將120個循環(huán)后不具有高于閾值的可檢測信號的樣品(包括不具有可檢測信號的陽性和陰性對照)設置為120的cq(測量的最大循環(huán))而不是未檢測到(n.d.)以實現(xiàn)倍數(shù)改進計算。
466、
467、
468、
469、
470、實施例10
471、用于初始活性篩選的dna聚合酶:
472、用于sars-cov-2檢測的rt-lamp反應中純化的dna聚合酶活性
473、搖瓶表達
474、將如上所述生長的選擇的培養(yǎng)物鋪到含有1%葡萄糖和30μg/ml氯霉素的lb瓊脂板上并在30℃生長過夜。將來自每種培養(yǎng)物的單個菌落轉移到含有1%葡萄糖和30μg/ml氯霉素的5ml?lb肉湯中。使培養(yǎng)物在30℃、250rpm生長20h,并以約1:50稀釋度稀釋到250ml具有30μg/ml氯霉素的terrific肉湯中來傳代培養(yǎng),至最終od600為約0.05。將培養(yǎng)物在30℃、250rpm孵育約195min至約0.6的od600,并且然后加入終濃度為1mm的iptg進行誘導。誘導的培養(yǎng)物在30℃、250rpm孵育20h。在該孵育期之后,將培養(yǎng)物以4000rpm×10min離心。棄去培養(yǎng)上清液,并將沉淀重懸于30ml的50mm?tris-hcl,ph?8中。將該細胞懸浮液在冰浴中冷卻并使用微流化細胞破碎器(microfluidics?m-110l)裂解。通過離心(11,000rpm,在4℃,60min)沉淀粗裂解物,并然后通過0.2μm?pes膜過濾上清液以進一步澄清裂解物。
475、從搖瓶裂解物中純化dna聚合酶
476、使用aktapure純化系統(tǒng)和5ml?histrap?ff柱(ge?healthcare)純化dna聚合酶裂解物;運行參數(shù)在表10.1中提供。搖瓶洗滌緩沖液包含50mm?tris-hcl,ph?8,500mm?nacl,20mm咪唑,0.02%v/v?triton?x-100試劑,并且搖瓶洗脫緩沖液包含50mm?tris-hcl,ph?8,500mm?nacl,250mm咪唑,0.02%v/v?triton?x-100試劑。
477、
478、將基于uv吸收(a280)的四個最濃縮的1.5ml級分合并并在3.5k?slide-a-lyzertm透析盒(thermo?fisher)中在透析緩沖液(40mm?tris-hcl,ph?8,100mm?kcl,0.1mm?edta和50%甘油)中透析過夜以進行緩沖液交換。通過在280nm處的吸收測量制劑中的dna聚合酶濃度,并歸一化為2mg?ml-1。
479、使用純化的dna聚合酶的大片段的rt-lamp反應
480、使用dna聚合酶的純化的大片段的rt-lamp測定使用靶向cov-orf1a的引物組進行,所述引物組由不同濃度的六種寡核苷酸組成(終濃度fip:1.6um,bip:1.6um,f3:0.2um,b3:0.2um,loop?f:0.4um,loop?b:0.4um)。在包含以下的5ul反應中篩選每種變體:sars-cov-2合成rna對照1(0.5ul,genbank/gisaid?id?mt007544.1,twist?biosciences部件號102019,每個反應5000拷貝)、0.5ul?10×等溫擴增緩沖液(neb目錄號b0537s)、0.5ul10×orf1a?lamp引物混合物(fip:16um,bip:16um,f3:2um,b3:2um,loop?f:4um,loop?b:4um)、dntp混合物(每種dntp的終濃度1.1mm)、0.3ul?100mm?mgso4(終濃度6mm;總計8mm,包括來自10×等溫擴增緩沖液的貢獻)、0.25ul?evagreen(20×水儲備液,1.25um終濃度)、1ul純化的dna聚合酶(終濃度10ng?ul-1)。最后加入合成rna對照以開始反應。無模板對照(ntc)添加了無核酸酶的水來代替合成rna對照溶液。將384孔pcr板短暫渦旋并離心進行混合,然后插入cfx?touch?384孔實時pcr檢測系統(tǒng)(bio-rad)中。等溫擴增反應在55℃進行120個30sec的循環(huán),每次循環(huán)后在fam通道中分析反應的熒光。
481、在不存在單獨的逆轉錄酶的情況下dna聚合酶的rt-lamp活性計算為ntc的定量循環(huán)(cq)值與含有5000拷貝的合成rna對照的樣品的cq的比率,并在表10.2中示出。在120個循環(huán)后不具有高于閾值的可檢測信號的樣品(包括不具有可檢測信號的陽性和陰性對照)被設置為120的cq(測量的最大循環(huán))而不是未檢測到(n.d.)以能夠計算倍數(shù)改進。
482、
483、
484、實施例11
485、測定工程化dna聚合酶對抑制劑的抗性
486、通過逆轉錄酶環(huán)介導擴增(rt-lamp)檢測工程化dna聚合酶對抑制劑的抗性。靶向75個拷貝的合成乙型流感rna并含有熒光染料的反應在20μl體積中進行(n=3),其中添加了各自終濃度如下的以下每種抑制劑:3%(v/v)乙醇、25mm硫氰酸胍(gtc)、20%(v/v)病毒轉運培養(yǎng)基(vtm)、6.25u/ml肝素、10μm血紅素、50ng的人類總rna或100ng的人類基因組dna(hgdna)。平行運行不含抑制劑的聚合酶的另外的反應以進行比較。反應使用bio-rad?cfx?opus熱循環(huán)儀(bio?rad,ca)在65℃(或lavalamp為68℃)進行72分鐘。通過將測量的cq值乘以每個循環(huán)的時間來計算每個重復的結果時間(time?to?result,ttr)。將抑制劑抗性與無抑制劑情況下的工程化dna聚合酶、與dna聚合酶bst?3.0(new?englandbiolabs,目錄#mo374)和與lgc?lava?amp(lgc?biosearch?technologies)進行比較。
487、盡管已經(jīng)參考具體的實施方案描述了本發(fā)明,可以做出多種改變并且可以替換等同物,以適應特定的情況、材料、物質(zhì)的組成、方法、方法步驟(process?step?or?steps),從而實現(xiàn)本發(fā)明的益處,而不偏離所要求保護的范圍。
488、出于所有目的,本公開內(nèi)容中引用的每一個出版物和專利文件都通過引用并入本文,如同每一個這樣的出版物或文件都被具體和單獨地指示通過引用并入本文。出版物和專利文件的引用不被認為是任何此類文件是相關的現(xiàn)有技術的指示,也不構成對其內(nèi)容或日期的承認。