HI,欢迎来到起点商标网!
24小时服务QQ:2880605093

靶结合部分的组合物及使用方法与流程

2021-02-02 17:02:11|228|起点商标网
靶结合部分的组合物及使用方法与流程

交叉引用

本申请要求于2018年3月26日提交的美国临时专利申请号62/648,218,以及于2018年6月19日提交的美国临时专利申请号62/686,858的优先权,其各自通过引用以其全文并入于此。



背景技术:

已经开发了询问抗体库的方法。这些方法分为两大类:(1)对感兴趣的抗体的编码区进行测序,和(2)使用大型分子(例如,肽)文库检查这些分子中的哪些可以与感兴趣的抗体结合。这两类在本文中分别称为“测序方法”和“结合方法”。

在下一代测序(nextgensequencing)的帮助下,测序方法可以相对容易进行,但对感兴趣的抗体可以结合的分子知之甚少。

结合方法可以包括蛋白质和肽阵列。靶基因不同区域的克隆和表达和重组截短蛋白的纯化可以是映射抗原表位的常规方法。然而,此过程可能很耗时,并且一些重组蛋白可能难以纯化。由于低的结合亲和力,在固体支持物上打印合成肽以制备肽阵列可能具有低灵敏度,并且可能具有较小的文库大小。因此,结合方法的成功可能受到部分限制,因为制备足够大和/或具有高灵敏度的分子(例如,肽)文库可能具有挑战性。



技术实现要素:

本文中认识到需要产生具有大文库大小和/或高灵敏度的靶结合分子(例如,与抗体结合的肽)文库。根据本公开内容的一个方面,本文提供了一种包括多核苷酸条形码化的靶结合部分的组合物,其中所述多核苷酸条形码化的靶结合部分包括(a)核酸序列,所述核酸序列通过接头连接至(b)靶结合单元,所述靶结合单元包括(i)包括第一结合区的第一肽序列,和(ii)包括第二结合区的第二肽序列;其中所述第一结合区和所述第二结合区被间隔区隔开,并且间隔一定距离,使得所述第一肽序列和所述第二肽序列同时结合至包括抗体的抗原结合域的单个分子;其中所述核酸序列编码所述第一肽序列和/或所述第二肽序列;并且其中所述组合物是可溶的。

根据本公开内容的另一方面,本文提供了一种包括多个多核苷酸条形码化的靶结合部分的组合物,所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分包括(a)核酸序列,所述核酸序列通过接头连接至(b)靶结合单元,所述靶结合单元包括(i)包括第一结合区的第一肽序列,和(ii)包括第二结合区的第二肽序列;其中所述第一结合区和所述第二结合区被间隔区隔开,并且间隔一定距离,使得所述第一肽序列和所述第二肽序列同时结合至包括抗体的抗原结合域的单个分子;其中所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分的所述核酸序列是唯一的;并且其中所述组合物是可溶的。

在一些实施方案中,所述单个分子包括第一抗原结合域和第二抗原结合域;其中所述第一结合区和所述第二结合区间隔一定距离,使得所述第一结合区结合至所述第一抗原结合域并且所述第二结合区结合至所述第二抗原结合域。在一些实施方案中,所述第一结合区和第二结合区具有相同的序列。在一些实施方案中,所述第一结合区和第二结合区具有被所述单个分子识别的相同结构。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分的所述核酸序列包括唯一的条形码序列。在一些实施方案中,所述核酸序列还包括条形码。在一些实施方案中,所述核酸序列是单链的。在一些实施方案中,所述核酸序列是双链的。在一些实施方案中,所述核酸序列是脱氧核糖核酸(dna)。在一些实施方案中,所述核酸序列是核糖核酸(rna)。在一些实施方案中,所述核酸与引物杂交。在一些实施方案中,所述多核苷酸条形码化的靶结合部分包括单个靶结合单元。在一些实施方案中,所述多核苷酸条形码化的靶结合部分包括两个或更多个靶结合单元。在一些实施方案中,所述组合物包括多个多核苷酸条形码化的靶结合部分。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分均包括单个靶结合单元。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的至少一个多核苷酸条形码化的靶结合部分包括单个靶结合单元。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的两个或更多个多核苷酸条形码化的靶结合部分包括单个靶结合单元。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分均包括两个或更多个靶结合单元。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的至少一个多核苷酸条形码化的靶结合部分包括两个或更多个靶结合单元。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的两个或更多个多核苷酸条形码化的靶结合部分包括两个或更多个靶结合单元。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分包括至少约10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1x106个或更多个多核苷酸条形码化的靶结合部分。在一些实施方案中,所述组合物包括两个或更多个靶结合单元。在一些实施方案中,所述组合物包括2至1000个靶结合单元。在一些实施方案中,所述组合物包括三个或更多个靶结合单元。在一些实施方案中,所述间隔区是聚合物。在一些实施方案中,所述间隔区是聚乙二醇。在一些实施方案中,所述间隔区包括相同的氨基酸序列。在一些实施方案中,所述间隔区包括折叠的多肽、二级结构和/或三级结构。在一些实施方案中,所述间隔区包括卷曲螺旋结构或β片层结构。在一些实施方案中,所述间隔区包括两个或更多个分离的肽链,其中所述两个或更多个分离的肽链中的至少一个包括α-螺旋体或β-链。在一些实施方案中,所述间隔区包括折叠成至少两个α-螺旋体或至少两个β-链的单个肽链。在一些实施方案中,所述单个肽链包括四个α-螺旋体或四个β-链。在一些实施方案中,所述间隔区包括第一肽链、第二肽链和第三肽链,其中所述第二肽链与所述第一肽链的第一部分相互作用,并且其中所述第三肽链与所述第一肽链的第二部分相互作用。在一些实施方案中,所述第一肽链、所述第二肽链和/或所述第三肽链折叠成α-螺旋体。在一些实施方案中,所述第二肽链和所述第三链连接至双链多核苷酸的相对端。在一些实施方案中,所述间隔区包括寡核苷酸。在一些实施方案中,所述寡核苷酸是双链寡核苷酸。在一些实施方案中,所述寡核苷酸包括20至40个核苷酸或碱基对。

在一些实施方案中,所述第一结合区和所述第二结合区包括相同的表位。在一些实施方案中,所述第一肽序列的序列与所述第二肽序列的序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%相同。在一些实施方案中,所述核酸序列是双链dna-rna杂种。在一些实施方案中,所述接头包括嘌呤霉素或其衍生物。在一些实施方案中,所述多核苷酸条形码化的靶结合部分是线性聚合物链或支链聚合物链。在一些实施方案中,所述第一肽序列、所述第二肽序列和所述间隔区在单个多肽链中邻接。在一些实施方案中,所述第一肽序列和所述第二肽序列通过非肽键连接至所述间隔区。在一些实施方案中,所述抗原结合域是scfv、fab或f(ab)2。在一些实施方案中,所述第一肽序列和所述第二肽序列的长度为至少5个氨基酸残基。在一些实施方案中,所述多核苷酸条形码化的靶结合部分或所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分在容器内。在一些实施方案中,所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分在多个容器中的不同容器内。在一些实施方案中,所述容器是液滴。在一些实施方案中,所述液滴是油包水液滴。在一些实施方案中,所述抗体是生物标志物。

根据本公开内容的另一方面,本文提供了一种固体支持物,包括多个离散区,其中所述多个离散区中的每个离散区包括通过接头与其附接的靶结合部分,其中所述靶结合部分包括(a)包括第一结合区的第一肽序列,和(b)包括第二结合区的第二肽序列;其中所述第一结合区和所述第二结合区被间隔区隔开,并间隔一定距离,使得所述第一肽序列和所述第二肽序列同时结合至包括抗体的抗原结合域的单个分子。在一些实施方案中,所述多个离散区包括至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约20、至少约30、至少约40、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约103、至少约104、至少约105或至少约106个离散区。在一些实施方案中,所述靶结合部分包括第一反应基团。在一些实施方案中,所述固体支持物包括与其附接的第二反应基团。在一些实施方案中,通过使所述第一反应基团与所述第二反应基团反应来产生所述接头。在一些实施方案中,所述间隔区包括聚合物链。在一些实施方案中,所述聚合物链包括多核苷酸、多肽或聚乙二醇。在一些实施方案中,所述多核苷酸是双链dna、双链rna或双链dna-rna杂种。在一些实施方案中,所述多肽包括折叠的多肽、二级结构和/或三级结构。在一些实施方案中,所述间隔区包括卷曲螺旋结构或β片层结构。在一些实施方案中,所述间隔区包括两个或更多个分离的肽链,其中所述两个或更多个分离的肽链中的至少一个包括α-螺旋体或β-链。在一些实施方案中,所述间隔区包括折叠成至少两个α-螺旋体或至少两个β-链的单个肽链。在一些实施方案中,所述单个肽链包括四个α-螺旋体或四个β-链。在一些实施方案中,所述间隔区包括第一肽链、第二肽链和第三肽链,其中所述第二肽链与所述第一肽链的第一部分相互作用,并且其中所述第三肽链与所述第一肽链的第二部分相互作用。在一些实施方案中,所述第一肽链、所述第二肽链和/或所述第三肽链折叠成α-螺旋体。在一些实施方案中,所述第二肽链和所述第三链连接至双链多核苷酸的相对端。在一些实施方案中,所述单个分子包括第一抗原结合域和第二抗原结合域;其中所述第一结合区和所述第二结合区间隔一定距离,使得所述第一结合区结合至所述第一抗原结合域并且所述第二结合区结合至所述第二抗原结合域。在一些实施方案中,所述第一结合区和第二结合区具有相同的序列。在一些实施方案中,所述第一结合区和第二结合区具有被所述单个分子识别的相同结构。在一些实施方案中,所述抗原结合域是scfv、fab或f(ab)2。在一些实施方案中,所述第一肽序列的序列与所述第二肽序列的序列至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或100%相同。在一些实施方案中,所述靶结合部分包括两个或更多个肽序列,所述两个或更多个肽序列中的每一个包括结合区。

本文还提供了通过rna显示来制备靶结合部分的方法。本文还提供了通过体外区域化(compartmentalization)来制备靶结合部分的方法。本文还提供了使用靶结合部分的方法。本文还提供了使用靶结合部分对抗体混合物进行概况分析的方法。本文还提供了使用靶结合部分诊断疾病的方法。在一些实施方案中,所述疾病是癌症或自身免疫疾病。

根据本公开内容的另一方面,本文提供了一种方法,包括翻译rna的rna序列,其中所述rna序列编码肽序列,其中所述rna在所述rna的3'端连接至肽受体;将所述肽受体与包括所述肽序列的翻译肽的氨基酸残基连接,从而形成核酸-肽融合分子,其中所述核酸-肽融合分子包括多核苷酸条形码化的靶结合部分,其包括:(a)包括第一结合区的第一肽序列,和(b)包括第二结合区的第二肽序列;其中所述第一结合区和所述第二结合区被间隔区隔开,并间隔一定距离,使得所述第一肽序列和所述第二肽序列同时结合至包括抗体的抗原结合域的单个分子。在一些实施方案中,所述方法还包括提供dna,其中所述dna编码所述rna。在一些实施方案中,所述方法还包括转录所述dna。在一些实施方案中,所述方法还包括反转录所述rna。在一些实施方案中,所述dna分子和/或所述rna序列编码所述第一肽序列、所述第二肽序列和所述间隔区。在一些实施方案中,所述核酸-肽融合分子包括多个核酸-肽融合分子。在一些实施方案中,所述多个核酸-肽融合分子中的每个核酸-肽融合分子包括唯一的核酸序列。在一些实施方案中,所述第一结合区和第二结合区具有相同的序列。在一些实施方案中,所述第一结合区和第二结合区具有被所述单个分子识别的相同结构。在一些实施方案中,每个核酸-肽融合分子的所述间隔区是相同的或包括相同的氨基酸序列。在一些实施方案中,所述间隔区包括折叠的多肽、二级结构和/或三级结构。在一些实施方案中,所述间隔区包括卷曲螺旋结构或β片层结构。在一些实施方案中,所述第一肽序列的序列与所述第二肽序列的序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%相同。在一些实施方案中,抗原结合域是scfv、fab或f(ab)2。在一些实施方案中,所述第一肽序列和所述第二肽序列的长度为4至30个氨基酸、5至20个氨基酸、6至10个氨基酸、8至11个氨基酸或10至20个氨基酸。在一些实施方案中,所述翻译包括体外翻译。

根据本公开内容的另一方面,本文提供了一种方法,包括在多个容器的每个容器中表达由核酸编码的第一肽序列和由核酸编码的第二肽序列,其中所述多个容器中的每个容器包括支架,所述支架包括由间隔区隔开的第一连接位点和第二连接位点;以及使所述第一肽序列与所述第一连接位点结合,并且使所述第二肽序列与所述第二连接位点结合,其中与所述第一连接位点结合的所述第一肽序列和与所述第二连接位点结合的所述第二肽序列间隔一定距离,使得所述第一肽序列和所述第二肽序列同时结合至包括抗体的抗原结合域的单个分子,从而形成多个靶结合部分。在一些实施方案中,所述核酸通过接头连接至所述支架。在一些实施方案中,所述核酸的5'端或3'端通过所述接头连接至所述支架。在一些实施方案中,所述核酸是单个核酸分子。在一些实施方案中,在产生所述多个容器之前或之后,将所述核酸连接至所述支架。在一些实施方案中,所述核酸分子是双链或单链的。在一些实施方案中,所述核酸分子是dna、rna或其组合。在一些实施方案中,表达包括转录和/或翻译。在一些实施方案中,所述第一肽序列和所述第二肽序列包括相同的序列。在一些实施方案中,所述第一肽序列的序列与所述第二肽序列的序列至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或100%相同。在一些实施方案中,所述方法还包括合并所述容器的多个多核苷酸条形码化的靶结合部分。在一些实施方案中,所述容器是液滴。在一些实施方案中,所述液滴是油包水液滴。在一些实施方案中,还包括将所述多个靶结合部分中的所述靶结合部分条形码化。在一些实施方案中,条形码化包括将条形码附接至所述靶结合部分。在一些实施方案中,所述支架在表达前附接至条形码化的多核苷酸。在一些实施方案中,所述支架附接至编码所述第一肽序列的所述核酸和/或编码所述第二肽序列的所述核酸。在一些实施方案中,所述支架在表达前附接至编码所述第一肽序列的所述核酸和/或编码所述第二肽序列的所述核酸。

根据本公开内容的另一方面,本文提供一种方法,包括:使抗体的混合物与靶结合部分群体接触,其中所述群体中的每个靶结合部分均包括具有第一结合区和第二结合区的靶结合单元,其中所述第一结合区和所述第二结合区被间隔区隔开并且间隔一定距离,使得所述第一结合区和所述第二结合区同时结合至所述混合物中的单个抗体分子。在一些实施方案中,所述靶结合单元还包括具有所述第一结合区的第一肽和/或类肽序列和具有所述第二结合区的第二肽和/或类肽序列。在一些实施方案中,所述第一结合区和所述第二结合区具有相同的序列。在一些实施方案中,所述第一结合区和所述第二结合区具有被所述单个分子识别的相同结构。在一些实施方案中,靶结合部分的所述群体被提供在固体支持物上。在一些实施方案中,靶结合部分的所述群体被固定在所述固体支持物上。在一些实施方案中,所述固体支持物具有至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约20、至少约30、至少约40、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约103、至少约104、至少约105或至少约106个离散区。在一些实施方案中,每个所述离散区具有来自其上固定的所述群体的不同的靶结合部分。在一些实施方案中,来自所述群体的所述不同的靶结合部分包括相同的结合区。在一些实施方案中,来自所述群体的所述不同的靶结合部分包括相同的肽和/或类肽序列。在一些实施方案中,每个所述离散区具有所述不同的靶结合部分的两个或更多个拷贝。在一些实施方案中,所述方法还包括去除所述混合物中的未结合的抗体。在一些实施方案中,所述方法还包括定量在每个所述离散区处结合的抗体的量。在一些实施方案中,所述定量包括检测荧光信号、电化学信号、化学发光信号、生色信号或其组合。在一些实施方案中,所述方法还包括从受试者获得血液样品。在一些实施方案中,所述方法还包括从所述血液样品制备血清样品,其中所述血清样品包括所述抗体混合物。在一些实施方案中,所述受试者包括患病受试者和/或健康受试者。在一些实施方案中,所述方法还包括从所述患病受试者获得第一血清样品和从所述健康受试者获得第二血清样品,其中所述定量包括定量在第一固体支持物上的所述第一血清样品中和在第二固体支持物上的所述第二血清样品中结合在每个所述离散区处的抗体的量。在一些实施方案中,所述方法还包括对结合在所述第一固体支持物上的每个所述离散区处的抗体的量和结合在所述第二固体支持物上的每个所述离散区处的抗体的量进行比较。在一些实施方案中,所述方法还包括选择所述离散区的一组肽,这些肽在结合在所述第一固体支持物和所述第二固体支持物上的抗体的量上具有差异。在一些实施方案中,靶结合部分的所述群体在溶液中提供。在一些实施方案中,靶结合部分的所述群体中的每一个与编码部分连接。在一些实施方案中,所述编码部分是多核苷酸。在一些实施方案中,所述多核苷酸是脱氧核糖核酸(dna)、核糖核酸(rna)或其组合。在一些实施方案中,所述多核苷酸是单链dna、单链rna、双链dna、双链rna或双链dna-rna杂种。在一些实施方案中,所述编码部分包括鉴定所述靶结合部分的序列的核酸序列。在一些实施方案中,所述核酸序列编码所述两个或更多个靶结合部分的肽序列。在一些实施方案中,靶结合部分的所述群体包括至少约100、至少约103、至少约104、至少约105或至少约106种不同类型的靶结合部分。在一些实施方案中,来自所述群体的每种类型的靶结合部分包括相同的肽和/或类肽序列。在一些实施方案中,所述编码部分对于所述群体的每种类型的靶结合部分是唯一的。在一些实施方案中,所述方法还包括捕获、或富集、或分离所述群体的靶结合部分的抗体结合级分。在一些实施方案中,所述方法还包括扩增靶结合部分的所述抗体结合级分的编码部分。在一些实施方案中,所述方法还包括定量所述抗体结合级分的所述编码部分或所述编码部分的拷贝。在一些实施方案中,定量包括对靶结合部分的所述抗体结合级分的所述编码部分或所述编码部分的拷贝进行测序。在一些实施方案中,所述方法还包括从受试者获得血液样品。在一些实施方案中,所述方法还包括从所述血液样品制备血清样品,其中所述血清样品包括所述抗体混合物。在一些实施方案中,所述受试者包括患病受试者和/或健康受试者。在一些实施方案中,所述方法还包括从所述患病受试者获得第一血清样品和从所述健康受试者获得第二血清样品,其中所述定量包括定量在所述第一血清样品中的靶结合部分的所述抗体结合级分的量和在所述第二血清样品中的靶结合部分的所述抗体结合级分的量。在一些实施方案中,所述方法还包括对所述第一血清样品中的靶结合部分的所述抗体结合级分的所述量和所述第二血清样品中的所述抗体结合级分的所述量进行比较。在一些实施方案中,所述方法还包括选择一组肽,其中所述组中的每个肽在所述第一血清样品和所述第二血清样品中的靶结合部分的抗体结合级分的所述量上具有差异。在一些实施方案中,在所述第一血清样品中而不是在所述第二血清样品中大量鉴定到所述组中的每个肽,或者在所述第二血清样品中而不是在所述第一血清样品中大量鉴定到所述组中的每个肽。在一些实施方案中,所述方法还包括通过rna显示来制备各自与所述编码部分连接的靶结合部分的所述群体。在一些实施方案中,靶结合部分的所述群体中的每一个还包括嘌呤霉素部分或其变体。在一些实施方案中,所述第一肽和/或类肽序列的序列与所述第二肽和/或类肽序列的序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%或至少约99%或100%相同。在一些实施方案中,所述第一肽序列、所述第二肽序列和所述间隔区通过肽键连接。在一些实施方案中,所述第一肽和/或类肽序列、所述第二肽和/或类肽序列,以及所述间隔区通过非肽键连接。在一些实施方案中,所述靶结合部分包括两个或更多个靶结合单元。在一些实施方案中,所述第一肽和/或类肽序列,或所述第二肽和/或类肽序列的长度为至少5个残基。在一些实施方案中,所述间隔区包括聚合物。在一些实施方案中,所述间隔区包括预先设计的氨基酸序列。在一些实施方案中,所述间隔区是多肽、多核苷酸或聚乙二醇。在一些实施方案中,所述间隔区包括折叠的多肽、二级结构和/或三级结构。在一些实施方案中,所述折叠的多肽包括卷曲螺旋结构或β片层。在一些实施方案中,所述卷曲螺旋结构由两条分离的肽链形成,其中所述两条分离的肽链中的每一条均折叠成α-螺旋体。在一些实施方案中,所述卷曲螺旋结构由单个肽链形成,所述单个肽链包括折叠成α-螺旋体的至少两个区域。在一些实施方案中,所述单个肽链包括折叠成α-螺旋体的四个区域。在一些实施方案中,所述卷曲螺旋结构由第一肽链、第二肽链和第三肽链形成,其中所述第二肽链与所述第一肽链的第一部分相互作用,并且所述第三肽链与所述第一肽链的第二部分相互作用。在一些实施方案中,所述第二肽链和所述第三肽链连接至双链多核苷酸的相对端。在一些实施方案中,所述间隔区包括双链脱氧核糖核酸。在一些实施方案中,所述抗体混合物是单克隆抗体的混合物、多克隆抗体的混合物或其组合。在一些实施方案中,所述抗体混合物包括生物标志物。

根据本公开内容的另一方面,本文提供一种用于选择一组肽的方法,包括:(a)提供包括第一阵列和第二阵列的阵列的两个或更多个拷贝;(b)从患病受试者获得第一抗体混合物并从健康受试者获得第二抗体混合物;(c)使所述第一混合物与所述第一阵列接触,并且使所述第二混合物与所述第二阵列接触,其中每个阵列具有至少104个离散区,其中每个所述离散区具有唯一类型的靶结合部分,所述靶结合部分具有第一靶结合区和第二靶结合区,其中所述第一结合区和所述第二结合区被间隔区隔开并且间隔一定距离,使得所述第一结合区和所述第二结合区同时结合至所述混合物中的单个抗体分子;(d)去除所述第一阵列和所述第二阵列上未结合的抗体级分;(e)定量在所述第一阵列和所述第二阵列的每个所述离散区上的结合抗体的量;以及(f)鉴定所述第二阵列中未被所述第一阵列上的抗体结合的肽。

根据本公开内容的另一方面,本文提供一种用于选择一组肽的方法,包括:(a)提供第一溶液和第二溶液;(b)从患病受试者获得第一抗体混合物并从健康受试者获得第二抗体混合物;(c)使所述第一混合物与所述第一溶液接触,并使所述第二混合物与所述第二溶液接触,其中所述第一溶液和所述第二溶液中的每一个包括多个多核苷酸条形码化的靶结合部分,其中所述多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分包括通过接头连接至靶结合单元的核酸序列,所述靶结合单元包括含有第一结合区的第一肽序列和含有第二结合区的第二肽序列;其中所述第一结合区和所述第二结合区被间隔区隔开,并间隔一定距离,使得所述第一肽序列和所述第二肽序列同时结合至包括抗体的抗原结合域的单个分子;(d)在所述第一溶液和所述第二溶液中捕获所述群体中抗体结合的成分;(e)对从所述第一溶液和所述第二溶液中捕获的编码部分进行测序;以及(f)选择所述一组肽。

根据本公开内容的另一方面,本文提供了一种用于对来自受试者的抗体混合物进行概况分析的方法,包括:使所述抗体混合物与具有至少10个离散区的阵列接触,其中每个所述离散区具有唯一类型的靶结合部分,其中每个所述唯一类型的靶结合部分均包括第一结合区和第二结合区,其中所述第一结合区和所述第二结合区被间隔区隔开并且间隔一定距离,使得所述第一结合区和所述第二结合区同时结合至所述混合物中的单个抗体分子。在一些实施方案中,所述方法还包括去除所述混合物中抗体的未结合级分。在一些实施方案中,所述方法还包括检测所述阵列上所述混合物中抗体的结合级分,其中在其上结合有抗体的每个所述离散区处观察到信号,从而在所述阵列上产生信号模式。在一些实施方案中,所述方法还包括鉴定所述受试者的疾病。在一些实施方案中,所述疾病是自身免疫疾病、癌症或传染病。在一些实施方案中,每个所述唯一类型的靶结合部分还包括具有所述第一结合区的第一肽和/或类肽序列和具有所述第二结合区的第二肽和/或类肽序列。在一些实施方案中,所述第一结合区和所述第二结合区具有相同的序列。在一些实施方案中,所述第一结合区和所述第二结合区具有被所述单个分子识别的相同结构。在一些实施方案中,所述第一肽和/或类肽序列的序列与所述第二肽和/或类肽序列的序列至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或100%相同。在一些实施方案中,所述第一肽序列、所述第二肽序列和所述间隔区通过肽键连接。在一些实施方案中,所述第一肽和/或类肽序列、所述第二肽和/或类肽序列,以及所述间隔区通过非肽键连接。在一些实施方案中,所述靶结合部分包括两个或更多个结合区。在一些实施方案中,所述第一肽和/或类肽序列,或所述第二肽和/或类肽序列的长度为至少5个残基。在一些实施方案中,所述间隔区包括聚合物。在一些实施方案中,所述间隔区包括相同的氨基酸序列。在一些实施方案中,所述间隔区是多肽、多核苷酸或聚乙二醇。在一些实施方案中,所述间隔区包括折叠的多肽、二级结构和/或三级结构。在一些实施方案中,所述折叠的多肽包括卷曲螺旋结构或β片层。在一些实施方案中,所述卷曲螺旋结构由两条分离的肽链形成,其中所述两条分离的肽链中的每一条均折叠成α-螺旋体。在一些实施方案中,所述卷曲螺旋结构由单个肽链形成,所述单个肽链形成包括折叠成α-螺旋体的至少两个区域。在一些实施方案中,所述单个肽链包括折叠成α-螺旋体的四个区域。在一些实施方案中,所述卷曲螺旋结构由第一肽链、第二肽链和第三肽链形成,其中所述第二肽链与所述第一肽链的第一部分相互作用,并且所述第三肽链与所述第一肽链的第二部分相互作用。在一些实施方案中,所述第二肽链和所述第三肽链连接至双链多核苷酸的相对端。在一些实施方案中,所述间隔区包括双链脱氧核糖核酸。在一些实施方案中,所述抗体混合物是单克隆抗体的混合物、多克隆抗体的混合物或其组合。在一些实施方案中,所述抗体混合物包括生物标志物。

根据本公开内容的另一方面,本文提供了多个核酸分子,其中所述多个核酸分子中的每个核酸分子编码多肽靶结合部分,所述肽靶结合部分包括:(i)包括第一结合区的第一肽序列,和(ii)包括第二结合区的第二肽序列;其中所述第一结合区和所述第二结合区(i)被间隔区隔开,并且(ii)间隔一定距离,使得所述第一肽序列和所述第二肽序列同时结合至单个分子;其中所述多个核酸分子包括至少约106、至少约107、至少约108、至少约109、至少约1010、至少约1011、至少约1012、至少约1013、至少约1014、或至少约1015个唯一的序列。在一些实施方案中,所述单个分子包括抗原结合域。在一些实施方案中,所述多个核酸分子是多个双链dna分子。在一些实施方案中,所述多个核酸分子是多个单链rna分子。在一些实施方案中,所述多个核酸分子中的每个核酸分子是环状分子。本文还提供了使用本文所述的核酸分子文库制备多核苷酸-肽融合分子文库的方法。所述方法包括:提供多个核酸分子并在rna显示测定中表达所述多个核酸分子以产生多个肽,其中每个核酸分子通过接头连接至从所述核酸分子表达的肽。在一些实施方案中,所述接头包括嘌呤霉素或其衍生物。

援引并入

本说明书中提到的所有出版物、专利和专利申请均通过引用并入本文,其程度如同特别地且单独地指出每一个单独的出版物、专利或专利申请均通过引用而并入。

附图说明

在所附权利要求书中具体阐述了本发明的新颖特征。通过参考对在其中利用到本发明的原理的说明性实施方案加以阐述的以下详细描述和附图,将会获得对本发明的特征和优点的更好的理解,在附

图中:

图1示出了本文所述的靶结合部分或与编码部分连接的靶结合部分的两个示例结构。

图2示出了本文所述的靶结合单元的示例结构。

图3示出了本文所述的间隔区的示例结构。

图4示出了具有不同离散区的阵列的示例以及固定在阵列的离散区上的支架的示例结构。

图5a示出了使用体外区域化产生多核苷酸条形码化的靶结合部分的示例实施方案。

图5b示出了使用体外区域化产生多核苷酸条形码化的靶结合部分的示例实施方案。

图5c示出了使用体外区域化产生多核苷酸条形码化的靶结合部分的示例实施方案。

图6a示出了用于通过裂分-合并(split-and-pool)合成产生多核苷酸条形码化的结合元件的示例结构。

图6b示出了用于通过裂分-合并合成产生多核苷酸条形码化的靶结合部分的示例结构。

图7a示出了产生靶结合部分的文库的示例方案。

图7b示出了产生靶结合部分的文库的示例方案。

图7c示出了产生靶结合部分的文库的示例方案。

图7d示出了产生靶结合部分的文库的示例方案。

图7e示出了产生靶结合部分的文库的示例方案。

图8a示出了产生靶结合部分的文库的示例方案。

图8b示出了变性聚丙烯酰胺凝胶图像,该图像示出了在图8a所示的示例方案的不同步骤期间产生的具有所需大小的产物(例如,d1、d4、d7、d12和d14)的存在。

图9示出了变性聚丙烯酰胺凝胶图像,该图像示出了通过在rna显示的不同步骤中进一步处理d14的dna产物(536bp)以制备rna-肽融合分子而产生的具有所需大小的产物的存在。

图10a示出了使用rna显示来产生多核苷酸-肽融合分子的示意图。

图10b示出了多核苷酸条形码化的靶结合部分的示例。

图10c示出了具有柔性间隔区的多核苷酸条形码化的靶结合部分的示例,可以进一步操纵该柔性间隔区以产生刚性间隔区。

具体实施方式

在本公开内容中,单数的使用包括复数,除非另有具体说明。此外,除非另外说明,否则“或”的使用表示“和/或”。类似地,“包括”、“包含”和“含有”不构成限制。

概述

确定抗体的特异性抗原结合区或表位不仅可有益于基于抗体的测试平台,而且有益于其治疗应用、疫苗开发、蛋白质相互作用研究、自身免疫疾病等。询问抗体库的方法可以包括(1)对感兴趣的抗体的编码区进行测序,(2)使用大型文库或分子(例如肽、类肽或蛋白质,它们在本公开内容中统称为潜在的免疫受体结合分子或pirm)来检查这些分子中的哪些可以被感兴趣的靶(例如,感兴趣的抗体)结合。为了克服与本领域已知的方法有关的问题,本文提供的组合物和方法可以用于产生具有大文库大小和/或高灵敏度的pirm文库。例如,本文提供的方法可以产生pirm文库,其包括至少约100、至少约103、至少约104、至少约105、至少约106、至少约107、至少约108、至少约109、至少约1010、至少约1011、至少约1012、至少约1013、至少约1014、至少约1015、至少约1016、至少约1017、至少约1018、至少约1019或至少约1020个不同的物种(例如,唯一序列)。

本文提供了用于筛选/鉴定与分析物结合的结合元件的组合物和方法。例如,本文提供了用于筛选/鉴定与抗体结合的肽或类肽序列的组合物和方法。本文公开的组合物和方法提供了优于传统肽阵列的若干优势,包括高文库大小和高灵敏度。所鉴定的肽序列随后可以用于制造具有可寻址肽序列文库的阵列,用于在给定样品中进行抗体概况分析。在本文公开的各种实施方案中,成对提供两个肽作为一个靶结合单元,其中所述两个肽间隔一定距离,使得它们可以同时结合至单个分子。

在一方面,本文提供了包括靶结合单元的组合物,其中靶结合单元包括被间隔区隔开的两个结合元件,其中两个结合元件同时结合至具有抗体的抗原结合域的单个分子。在各种实施方案中,结合元件是肽序列或类肽序列。靶结合单元的两个肽被间隔区隔开,使得它们被定位为同时结合抗体的两个抗原结合域(例如,fab)。本文提供的策略利用抗体的两个抗原结合域,并且可以将结合亲和力提高至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少7倍、至少8倍、至少9倍、至少10倍、至少11倍、至少12倍、至少13倍、至少14倍、至少15倍、至少16倍、至少17倍、至少18倍、至少19倍或至少20倍。在一些实施方案中,靶结合单元的两个肽具有相同的序列。本文还提供了包括靶结合部分的组合物,其中靶结合部分包括一个或多个靶结合单元。每个靶结合部分中的一个或多个靶结合单元可以被连接。靶结合部分包括两个或更多个结合元件(例如,肽序列或类肽序列)。在一些实施方案中,靶结合部分包括第一肽序列和第二肽序列,其中第一肽序列和第二肽序列被间隔区隔开,使得它们可以同时结合至单个抗体分子。在一些实施方案中,靶结合部分的两个或更多个肽序列具有相同的序列。

在另一方面,本文提供了使用靶结合单元或靶结合部分来筛选和鉴定在与患者样品中的抗体和健康样品中的抗体结合方面存在差异的肽或类肽序列的方法。例如,在肽筛选和鉴定方法中,将提供多个靶结合单元,其中每个靶结合单元包括具有相同序列或结合区(例如,表位)的两个肽。在一些情况下,在溶液中提供包括靶结合单元的组合物。在这种情况下,靶结合单元或靶结合部分可以进一步与编码部分连接。在一些应用中,编码部分用作对应于或鉴定靶结合单元的肽或类肽序列的条形码。在一些其他应用中,编码部分包括既可以编码靶结合单元的肽又可以用作鉴定肽序列的条形码的序列。编码部分能够通过高通量测序鉴定肽序列。在一些情况下,在固体表面上提供包括靶结合单元或靶结合部分的组合物。在这种情况下,具有唯一结合元件(例如,肽序列)的靶结合单元或靶结合部分将被固定在固体表面的离散区上,与具有不同结合元件的另一靶结合单元隔开。因此,当在固体表面上提供靶结合单元时,可以不需要编码部分。

在另一方面,本文提供了使用鉴定的肽或类肽序列对来自受试者的样品中的抗体进行概况分析的方法,其可用于推断受试者是否患有疾病。由于通过本文公开的筛选/鉴定方法鉴定了肽或类肽,因此已知该肽或类肽能够区分患者样品和健康样品,并且该肽或类肽也与患者样品相关的疾病有关。所鉴定的肽可以在固体表面(例如,阵列)上提供,当对样品中的抗体进行概况分析时,可以在固体表面上产生特征模式。在一些情况下,特征模式可以与患者样品相似,表明受试者可能患有疾病。在一些其他情况下,特征模式可以类似于健康样品,表明受试者是健康的。如本文所公开的,在固体表面上的肽序列作为靶结合单元提供,其中每个靶结合单元包括具有相同序列或表位的两个肽,其中两个肽由间隔区隔开。

定义

术语“约”或“大约”是指对于特定值而言,在可接受的误差范围内,如本领域普通技术人员所确定的,其将部分取决于如何测量或确定该值,即测量系统的局限性。例如,根据本领域的实践,“约”可以表示在1个或大于1个标准偏差之内。或者,“约”可以表示给定值的至多20%、至多10%、至多5%或至多1%的范围。或者,特别是就生物系统或过程而言,该术语可以指在一个数量级内,优选在一个值的5倍以内,更优选在2倍以内。在本申请和权利要求书中描述了特定值的情况下,除非另有说明,否则应假设术语“约”表示在该特定值的可接受的误差范围内。

术语“多核苷酸”、“核酸”和“寡核苷酸”是互换使用的。它们可以指任何长度的核苷酸的聚合形式,无论是脱氧核糖核苷酸或核糖核苷酸,或其类似物。多核苷酸可以包括一个或多个选自腺苷(a)、胞嘧啶(c)、鸟嘌呤(g)、胸腺嘧啶(t)和尿嘧啶(u)或其变体的核苷酸。本文提供的多核苷酸可以是双链或单链的。核苷酸通常包括核苷和至少1、2、3、4、5、6、7、8、9、10或更多个磷酸(po3)基团。核苷酸可以包括核碱基、五碳糖(核糖或脱氧核糖)以及一个或多个磷酸基团。多核苷酸可以具有任何三维结构,并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性示例:基因或基因片段的编码或非编码区、从连锁分析定义的基因座、外显子、内含子、信使rna(mrna)、转移rna(trna)、核糖体rna(rrna)、短干扰rna(sirna)、短发夹rna(shrna)、微小rna(mirna)、环状rna、核酶、cdna、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离dna、任何序列的分离rna、核酸探针和引物。多核苷酸可以包括一个或多个修饰的核苷酸,如甲基化的核苷酸和核苷酸类似物。如果存在对核苷酸结构的修饰,则其可以在聚合物组装之前或之后进行。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后进一步修饰,如通过与标记组分缀合。在一些情况下,本文提供的多核苷酸是可以用于指示另一部分的身份的编码部分。在一些其他情况下,本文提供的多核苷酸是可以用于连接两个实体的间隔区。

多核苷酸可以包括一个或多个核苷酸变体,包括非标准核苷酸、非天然核苷酸、核苷酸类似物和/或修饰的核苷酸。在一些情况下,核苷酸可以在其磷酸部分中包括修饰,包括对三磷酸部分的修饰。此类修饰的非限制性示例包括更长长度的磷酸链(例如,具有4、5、6、7、8、9、10或更多磷酸部分的磷酸链)和硫醇部分的修饰(例如,α-硫代三磷酸和β-硫代三磷酸)。核酸分子可以在碱基部分(例如,通常可用于与互补核苷酸形成氢键的一个或多个原子和/或通常不能够与互补核苷酸形成氢键的一个或多个原子)、糖部分或磷酸骨架处被修饰。核酸分子可以含有胺修饰的基团,如氨基烯丙基1-dutp(aa-dutp)和氨基己基丙烯酰胺-dctp(aha-dctp),以允许胺反应部分如n-羟基琥珀酰亚胺酯(nhs)的共价附接。多核苷酸可以在一个或多个位置上被修饰,以增强在化学合成或随后的酶修饰或聚合酶复制过程中引入的稳定性。这些修饰包括,但不限于,在低聚物中引入一个或多个烷基化核酸、锁核酸(lna)、肽核酸(pna)、膦酸酯、硫代磷酸酯等。经修饰核苷酸的示例包括,但不限于二氨基嘌呤、5-氟尿嘧啶、5-溴尿嘧啶、5-氯尿嘧啶、5-碘尿嘧啶、次黄嘌呤、黄嘌呤、4-乙酰胞嘧啶、5-(羧基羟甲基)尿嘧啶、5-羧甲基氨基甲基-2-硫代尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氢尿嘧啶、β-d-半乳糖基辫苷、肌苷、n6-异戊烯腺嘌呤、1-甲基鸟嘌呤、1-甲基肌苷、2,2-二甲基鸟嘌呤、2-甲基腺嘌呤、2-甲基鸟嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、n6-腺嘌呤、7-甲基鸟嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基氨基甲基-2-硫尿嘧啶、β-d-甘露糖基辫苷、5'-甲氧基羧甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲硫基-d46-异戊烯腺嘌呤、尿嘧啶-5-氧基乙酸(v)、wybutoxosine、假尿嘧啶、辫苷(queosine)、2-硫胞嘧啶、5-甲基-2-硫尿嘧啶、2-硫尿嘧啶、4-硫尿嘧啶、5-甲基尿嘧啶、尿嘧啶-5-氧基乙酸甲酯、尿嘧啶-5-氧基乙酸(v)、5-甲基-2-硫尿嘧啶、3-(3-氨基-3-n-2-羧丙基)尿嘧啶、(acp3)w、2,6-二氨基嘌呤等。对本公开内容的寡核苷酸中的标准dna碱基对或rna碱基对的替代物可以提供更高的密度(bit/mm3)、更高的安全性(抵抗天然毒素的偶然或目的性合成)、在光编程聚合酶中更容易区分,或较低的二级结构。在betzk,malyshevda,lavergnet,weltew,diederichsk,dwyertj,ordoukhanianp,romesbergfe,marxa.nat.chem.biol.2012jul;8(7):612-4中描述了用于从头合成和/或扩增合成的这种与天然和突变聚合酶相容的替代碱基对,其出于所有目的通过引用并入本文。

如本文所用,术语“多肽”是两个或更多个氨基酸通过肽键(或酰胺键)接合在一起,也称为“肽”。肽键,也称为酰胺键,是沿肽或蛋白质链连接两个连续氨基酸单体的共价化学键。在本说明书的上下文中,应当理解,氨基酸可以是l-光学异构体或d-光学异构体。氨基酸可以是非天然编码的氨基酸。肽可以包括一个或多个非天然编码的氨基酸。“非天然编码的氨基酸”是指不是常见氨基酸或吡咯赖氨酸或硒代半胱氨酸之一的氨基酸。可以与术语“非天然编码的氨基酸”同义使用的其他术语是“非天然氨基酸”、“非天然存在的氨基酸”,以及各种带有和不带有连接符的形式。术语“非天然编码的氨基酸”还包括,但不限于,通过天然编码的氨基酸(包括但不限于,20种常见氨基酸或吡咯赖氨酸和硒代半胱氨酸)的修饰(例如,翻译后修饰)而产生,但本身不被翻译复合物天然地结合到生长的多肽链中的氨基酸。这种非天然存在的氨基酸的示例包括,但不限于,n-乙酰氨基葡萄糖-l-丝氨酸、n-乙酰氨基葡萄糖-l-苏氨酸和o-磷酸酪氨酸。肽的长是两个或更多个氨基酸单体,并且通常可以超过20个氨基酸单体。多肽可以是线性非结构化的或以三维结构折叠。二十种常规氨基酸、非天然氨基酸(如α-,α-二取代氨基酸、n-烷基氨基酸、乳酸)和其他非常规氨基酸的立体异构体(例如,d-氨基酸)也可以是本公开内容的多肽的合适组分。非常规氨基酸的示例包括:4-羟基脯氨酸、γ-羧基谷氨酸、ε-n,n,n-三甲基赖氨酸、ε-n-乙酰赖氨酸、o-磷酸丝氨酸、n-乙酰丝氨酸、n-甲酰基甲硫氨酸、3-甲基组氨酸、5-羟基赖氨酸、σ-n-甲基精氨酸和其他类似的氨基酸和亚氨基酸(例如,4-羟基脯氨酸)。在本文使用的多肽符号中,根据标准用法和惯例,左手方向是氨基末端方向,并且右手方向是羧基末端方向。结构化多肽可以是蛋白质。如本文所用,“蛋白质”是指通过肽键连接的氨基酸残基的长聚合物,其可以由一个或多个多肽链组成。更具体地,术语“蛋白质”是指由一种或多种氨基酸按特定顺序组成的分子;例如,顺序由编码蛋白质的基因中核苷酸的碱基序列决定。蛋白质对于人体细胞、组织和器官的结构、功能和调节至关重要,并且每种蛋白质都有唯一的功能。示例是激素、酶、抗体及其任何片段。蛋白质可以是蛋白质的一部分,例如蛋白质的域、亚域或基序。蛋白质可以是蛋白质的变体(或突变体),其中一个或多个氨基酸残基插入到、被删除和/或取代到蛋白质的天然存在的(或至少已知的)氨基酸序列中。蛋白质可以是修饰的蛋白质。蛋白质修饰的非限制性示例包括磷酸化、乙酰化、糖基化、酰胺化、羟基化、甲基化、烷基化、酰化、泛素化、吡咯烷酮羧酸和硫酸化。蛋白质或其变体可以是天然存在的或重组的。

如本文所用,术语“类肽”,也称为聚-n-取代的甘氨酸,是一类模拟肽,其侧链附在肽骨架的氮原子上,而不是在α-碳原子上(如它们在氨基酸中一样)。在类肽中,侧链连接至肽骨架的氮,而不是像在肽中一样连接至α-碳。值得注意,类肽缺乏有助于肽和蛋白质中的许多二级结构元件的酰胺氢。类肽可用于模拟蛋白质/肽产物,以帮助发现蛋白酶稳定的小分子药物。在合成类肽中,每个残基可以通过被称为亚单体方法的方法在两个步骤中安装:酰化和取代。在酰化步骤中,卤代乙酸,通常是由二异丙基碳二亚胺活化的溴乙酸,与先前残基的胺反应。在取代步骤(经典的sn2反应)中,胺取代卤化物以形成n-取代的甘氨酸残基。亚单体方法允许将任何可商购或可合成获得的胺用于组合化学。类肽通常对蛋白水解具有抗性,因此对于蛋白水解是主要问题的治疗应用是有利的。由于类肽中的二级结构通常不涉及氢键,因此通常不会因溶剂、温度或化学变性剂(如尿素)而变性。由于主链亚甲基的柔性以及沿骨架的稳定氢键相互作用的缺乏,类肽低聚物可能在构象上不稳定。然而,通过选择合适的侧链,有可能形成特定的空间或电子相互作用,从而有利于形成稳定的二级结构,例如螺旋体,特别地,已知具有c-α支化侧链的类肽采用类似于聚脯氨酸i螺旋体的结构。不同的策略可以用来预测和表征类肽二级结构,最终目的是开发完全折叠的类肽蛋白质结构。顺式/反式酰胺键异构化可导致构象异质性,这可能不允许形成均一的类肽折叠体。然而,已经发现有利于聚脯氨酸ii型螺旋体的反式诱导剂n-芳基侧链,以及强顺式诱导剂,如大的萘乙基和叔丁基侧链。在本文提供的各种实施方案中,靶结合单元的肽序列可以被类肽序列替代。

术语“卷曲螺旋”或“卷曲螺旋结构”是指结构化模体,其中多个α-螺旋体像多股绳一样卷曲在一起(例如,二聚体和三聚体是常见类型的示例)。例如,亮氨酸拉链是卷曲螺旋结构。

术语“官能团”、“活性部分”、“活化基团”、“离去基团”、“反应位点”、“反应基团”、“化学反应基团”和“化学反应部分”是指分子中不同的、可定义的部分或单元。该术语在本文中用于表示分子中执行一些功能或活性或与其他分子反应的部分。

术语“连锁”或“接头”是指通常由于化学反应而形成的基团或键。

术语“间隔”或“隔开”在本文中可以互换使用。当描述两个肽/类肽序列被间隔区隔开或隔开时,意指两个肽不彼此直接连接,而是通过间隔区连接。

如本文所用,术语“序列”及其语法等同物可以指多肽序列或多核苷酸序列。多核苷酸或核苷酸序列可以是dna或rna;可以是线性的、循环的或分支的;并且可以是单链或双链。序列可以突变。序列可以具有任何长度,例如,长度在2至1,000,000个或更多个氨基酸或核苷酸之间(或在两者之间或以上的任意整数值),例如,在约100至约10,000个核苷酸之间或在约200至约500个氨基酸或核苷酸之间。

本文中的“固体支持物”、“支持物”、“固相支持物”、“基质”和其他语法等同物是指可以被修饰以包含适合于分子的附接或缔合的离散个体位点,并且可以适合至少一种检测方法的任何材料。它们可以是具有一个或多个刚性或半刚性表面的材料或一组材料。可能的基质数量可能非常大。可能的基质包括,但不限于,玻璃和改性或功能化玻璃、塑料(包括丙烯酸、聚苯乙烯以及苯乙烯与其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、聚四氟乙烯等)、多糖、尼龙或硝化纤维、树脂、二氧化硅或二氧化硅基材料(包括硅和改性硅)、碳、金属、无机玻璃、塑料、光纤束和各种其他聚合物。在一些情况下,基质允许进行光学检测,并且本身可以不发出荧光。基质可以是平的(平面的),不过也可以使用其他配置的基质;例如,基质可以使用三维结构,例如通过将靶结合部分嵌入到允许样品接近靶结合部分的塑料多孔块中。在一些实施方案中,可以将靶结合部分置于管的内表面上,用于流通样品分析,以使样品体积最小化。基质可以包括光纤束,以及平的平面基质,如玻璃、聚苯乙烯和其他塑料和丙烯酸。在一些实施方案中,固体支持物或基质可以是多孔板。在一些实施方案中,固相支持物的至少一个表面可以是基本平的,不过在一些实施方案中,用诸如孔、凸起区域、销、蚀刻的沟槽等将针对不同分子或反应的区域物理上隔开可以是有用的。在一些实施方案中,固体支持物可以采取珠、树脂、凝胶、微球或其他几何构型的形式。

关于靶结合单元或靶结合部分的“可寻址的”是指靶结合单元或靶结合部分的肽/类肽序列,或其他物理或化学特征,可以从其地址确定,例如,靶结合单元或靶结合部分的序列或其他性质与它所附接在固相支持物上的空间位置或固相支持物的特征之间有一对一对应性。

“阵列”或“微阵列”是指具有平面表面的固相支持物,其可以携带核酸或肽的阵列,该阵列的每个空间确定的区域或位点包括固定在该空间确定的区域或位点上的寡核苷酸或肽的拷贝,该区域或位点与阵列的其他区域或位点不重叠;即,区域或位点在空间上是离散的。空间确定的结合位点可以额外是“可寻址的”,因为例如在使用前,其位置和其固定的寡核苷酸或肽的身份是已知的或预先确定的。微阵列可以包括至少一个平面固相支持物,如玻璃显微镜载玻片。在一些实施方案中,寡核苷酸或肽共价附接至固相支持物。在一些实施方案中,寡核苷酸可以通过5'-端或3'-端附接至固体支持物。在一些实施方案中,肽可以通过寡核苷酸或通过并入肽中的非天然氨基酸间接附接。微阵列技术的评论,请参见:schena,editor,microarrays:apracticalapproach((lrlpress,oxford,2000);southern,currentopin.chem.biol.,2:404-410(1998);naturegeneticssupplement,21:1-60(1999)。“随机微阵列”是指其寡核苷酸或肽的空间离散区可能无法在空间上寻址的微阵列。例如,至少在最初,所附接的寡核苷酸或肽的身份可能无法从其位置来辨别。在一些方面,随机微阵列是微珠的平面阵列,其中每个微珠附接单一种类的寡核苷酸或肽。微珠阵列可以以多种方式形成,例如,brenner等人,naturebiotechnology,18:630-634(2000);tulley等人,美国专利号6,133,043;stuelpnagel等人,美国专利号6,396,995;chee等人,美国专利号6,544,732;等。同样地,在形成后,随机阵列中的微珠或其寡核苷酸/肽可以以多种方式鉴定,包括通过光学标记,例如,荧光染料比例或量子点、形状、序列分析等。

术语“标记”是指能够产生可检测信号的组合物,该可检测信号表明测定样品中靶多核苷酸的存在。合适的标记包括放射性同位素、核苷酸发色团、酶、底物、荧光分子、化学发光部分、磁性颗粒、生物发光部分等。这样,标记可以是通过光谱、光化学、生物化学、免疫化学、电学、光学或化学手段可检测的任何组合物。

“样品”是指来自生物、环境、医疗或患者来源的一定量的材料,在其中寻求对分析物的检测或测量。样品可以包括样本或培养物(例如,微生物培养物)。样品可以包括生物和环境样品。样品可以包括合成来源的样本。生物样品可以包括取自患者或健康受试者的材料,包括但不限于,血液、唾液、脊髓液、胸膜液、乳汁、淋巴液、痰液、精液、针吸液、血浆、血清、皮肤外部部分、呼吸道、肠道和泌尿生殖道、眼泪、细胞(包括但不限于血细胞)、肿瘤、器官,以及体外细胞培养成分的样品。生物样品可以从所有各种家畜以及野生动物获得,包括但不限于,有蹄类动物、熊类、鱼类、啮齿类动物等。环境样品可以包括环境材料,如表面物质、土壤、水和工业样品,以及从食品和乳制品加工仪器、装置、设备、器具、一次性和非一次性物品中获得的样品。这些示例不应被解释为限制适用于本公开内容的样品类型。

如本文所用,术语“容器”是指其中可以发生生化反应(例如,靶蛋白和抗体结合、核酸杂交和引物延伸)的隔室(例如,微流体通道、孔或液滴)。术语“容器”和“隔室”可以互换使用。隔室的体积可以大至1ml,也可以小至1皮升。在一些实施方案中,多个隔室中的隔室的中值大小为约1皮升至约10皮升、约10皮升至约100皮升、约100皮升至约1纳升、约1纳升至约10纳升、约10纳升至约100纳升、约100纳升至约1微升、约1微升至约10微升、约10微升至约100微升或约100微升至约1000微升。隔室中含水量的体积可以小于或约等于隔室的体积。在一些实施方案中,隔室中的含水量的中值体积为1微升或更小。

“液滴”是指被液体而不是固体包围的隔室。液滴可以是油包水;水包油包水或脂质层(脂质体)包水。在一些实施方案中,液滴可以具有均匀的大小或非均一的大小。在一些实施方案中,多个液滴中的液滴的中值直径可以在约0.001μm至约1mm的范围内。在一些实施方案中,多个液滴中的液滴的中值体积可以在约0.01纳升至约1微升的范围内。

术语“表位”是指能够与免疫球蛋白或抗体特异性结合的任何蛋白质或肽。表位影响因素可以包括分子的化学活性表面基团,如氨基酸或糖侧链,并且可以具有三维结构特征以及电荷特征。当解离常数为≤1μm或≤100nm或≤10nm时,抗体可以特异性结合抗原。如本文所用,表位也可用于指能够特异性结合至免疫球蛋白或抗体的类肽。

如本文所用,术语“分区”可以是动词或名词。当用作动词时(例如,“分区成”或“进行分区”),该术语通常是指将物种或样品(例如,多核苷酸样品)分级分离(例如,细分)到容器中,该容器可用于将一个级分(或细分)与另一个隔离。此类容器使用名词“分区”来表示。分区可以,例如,使用微流体技术、稀释、分配、涡旋等进行。分区可以是,例如,孔、微孔、洞、液滴(例如,乳液中的液滴)、乳液的连续相、试管、斑点、胶囊、珠、稀释溶液中的珠表面或任何其他的将一小部分样品与另一级分隔离的合适容器。分区也可以包括另一个分区。

相对于参考多肽序列(或核酸序列)的百分比(%)序列同一性是指在对序列进行比对并根据需要引入空位以实现最大的序列同一性百分比之后,在不考虑任何保守取代作为序列同一性的一部分的情况下,候选序列中与参考多肽序列(或核酸序列)中的氨基酸残基(或核苷酸)相同的氨基酸残基(或者在核酸序列的情况下是核苷酸)的百分比。为了确定氨基酸序列同一性百分比的目的,比对可以以本领域技术范围内的各种方式来实现,例如,使用公开可获得的计算机软件,如blast、blast-2、align或megalign(dnastar)软件。本领域技术人员可以确定用于比对序列的适当参数,包括在所比较的序列的全长上实现最大比对所需的任何算法。然而,出于本文的目的,使用序列比较计算机程序align-2产生%氨基酸序列同一性值。align-2序列比较计算机程序由genentech,inc.授权,并且源代码已与用户文档一起提交到美国版权局(华盛顿特区,20559),在美国版权注册号txu510087中进行了注册。align-2程序可从加利福尼亚南旧金山的genentech,inc.公开获得,也可以从源代码编译。align-2程序应编译为在unix操作系统(包括数字unixv4.0d)上使用。所有序列比较参数均由align-2程序设置,并且没有变化。

在使用align-2进行氨基酸序列比较的情况下,给定氨基酸序列a对于给定氨基酸序列b的%氨基酸序列同一性(也可以表述为给定氨基酸序列a与给定氨基酸序列b具有或包括一定的%氨基酸序列同一性)计算如下:分数x/y乘以100,其中x是由序列比对程序align-2在该程序的a和b比对中评分为相同匹配的氨基酸残基的数目,并且其中y是b中氨基酸残基的总数。应理解,如果氨基酸序列a的长度不等于氨基酸序列b的长度,则a与b的%氨基酸序列同一性将不等于b与a的%氨基酸序列同一性。除非另有特别说明,否则如前一段落所述,本文使用的所有%氨基酸序列同一性值是使用align-2计算机程序获得。

分析物

本文提供了用于鉴定可以与来自样品的分析物结合的结合元件(例如,肽序列或类肽序列)的组合物和方法。如本文所用,分析物可以指靶或靶分子。结合元件可以是肽序列或类肽序列。分析物可以是多肽。分析物可以是蛋白质。分析物可以是内源蛋白质或人工蛋白质。分析物可以是重组蛋白。本文所述的分析物可以从受试者获得或分离。在各种实施方案中,本文提供的方法包括使分析物与本文所述的靶结合部分或靶结合单元接触。

分析物可以是抗体或免疫球蛋白。在一些实施方案中,分析物是抗体片段。在一些实施方案中,组合物和方法中所述的抗体或其片段包括两个抗原结合(fab)片段。在一些实施方案中,两个fab片段结合相同的抗原。在一些实施方案中,抗体是双特异性抗体。在一些实施方案中,抗体是双特异性抗体,其中该双特异性抗体包括结合不同抗原的两个fab片段。在一些实施方案中,抗体或其片段包括非常规氨基酸。在一些实施方案中,抗体是单克隆抗体、多克隆抗体或其组合。在一些实施方案中,分析物是抗体混合物。在一些实施方案中,分析物是单克隆抗体混合物。在一些实施方案中,分析物是多克隆抗体混合物。在一些实施方案中,抗体混合物包括单克隆抗体和多克隆抗体。在一些实施方案中,血液样品中含有抗体混合物。在一些实施方案中,血清样品中含有抗体混合物。

在一些实施方案中,本文所述的分析物可以是与抗体的抗原结合域结合的分子。在一些实施方案中,本文所述的分析物可以是包括抗体的抗原结合域的分子。抗原结合域可以是scfv、fab或f(ab′)2。抗原结合域的其他示例包括,尤其是,fab、fab′、f(ab′)2、fv、dab和互补决定区(cdr)片段、单链抗体(scfv)、单域抗体、嵌合抗体、双抗体,以及含有免疫球蛋白的至少一部分的多肽,该部分足以使得与多肽进行特异性抗原结合。为了本文所述的目的,也包括线性抗体。如本文所用,术语“双抗体”是指具有两个抗原结合位点的小抗体片段,所述片段包括在同一条多肽链(vh-vl)中连接至轻链可变域(vl)的重链可变域(vh)。通过使用太短而使得同一条链上的两个域不能配对的接头,这些域被迫与另一条链的互补域配对,并产生两个抗原结合位点。

本文所述的分析物可以从受试者获得或分离。在一些应用中,分析物是从受试者的血样获得或分离的。在一些应用中,分析物是从受试者的血清样品获得或分离的。在一些应用中,抗体是从受试者的血液样品获得或分离的。在一些应用中,抗体是从受试者的血清样品获得或分离的。

在一些实施方案中,本文提供的方法包括使分析物与靶结合部分或靶结合单元接触。例如,方法可以包括使抗体与靶结合部分或靶结合单元接触。在一些实施方案中,抗体是抗体混合物。抗体混合物与一个或多个靶结合部分接触可以用于鉴定与抗体混合物中的抗体结合的靶结合部分。可以在溶液中或表面上鉴定与分析物结合的靶结合部分。

在一些实施方案中,分析物可以是生物标志物。在一些实施方案中,来自患者样品的分析物的量与来自健康样品的分析物的量不同。在一些实施方案中,对来自患者样品和健康样品的分析物的量的定量可以用于疾病诊断和预后。包括本文所述的靶结合部分或靶结合单元的阵列可以用于检测或定量来自患者样品和健康样品的分析物。

抗体

在一些实施方案中,分析物是免疫球蛋白、抗体或其抗原结合域。完整的免疫球蛋白或抗体通常可以由四个多肽组成:重(h)链多肽的两个相同拷贝和轻(l)链多肽的两个相同拷贝。在哺乳动物中,抗体分为五种同种型:igg、igm、iga、igd和ige。同种型在其生物学特性、功能位置和处理不同抗原的能力方面各不相同。存在的重链的类型定义了抗体的类别。用希腊字母表示的哺乳动物ig重链有五种类型:α、δ、ε、γ和μ。这些链分别在iga、igd、ige、igg和igm抗体中发现。重链的大小和组成不同;α和γ含有约450个氨基酸,而μ和ε含有约550个氨基酸。每个重链可以含有一个n末端可变(vh)区和三个c末端恒定(ch1、ch2和ch3)区,并且每个轻链可以含有一个n末端可变(vl)区和一个c末端恒定(cl)区。免疫球蛋白轻链可以根据其恒定域的氨基酸序列分配为两种不同的类型之一,kappa(κ)或lambda(λ)。在典型的免疫球蛋白中,每个轻链可以通过二硫键连接至重链,并且两个重链可以通过二硫键彼此连接。在一些实施方案中,提供的重链、轻链和/或抗体剂具有包括一个或多个二硫键的结构。在一些实施方案中,一个或多个二硫键在igg4免疫球蛋白的预期位置是或包括二硫键。轻链的可变区可以与重链的可变区比对,并且轻链恒定区可以与重链的第一恒定区比对。重链的其余恒定区可以彼此比对。

每对轻链和重链的可变区可以形成抗体的抗原结合位点。vh和vl区可以具有相同的总体结构,每个区包括四个框架(fw或fr)区,它们通过三个互补决定区(cdr)连接。如本文所用,术语“框架区”可以指位于高变或互补决定区(cdr)之间的可变域内的相对保守的氨基酸序列。在典型的免疫球蛋白中,每个可变区中可以有四个框架区,分别为fr1、fr2、fr3和fr4。框架区形成β片层,其提供可变区的结构构架(参见,例如,c.a.janeway等人(eds.),immunobiology,第5版,garlandpublishing,newyork,ny(2001))。在典型的免疫球蛋白中,每个可变域中可以存在三个互补决定区(cdr),分别为cdr1、cdr2和cdr3。cdr形成抗体的“高变区”,负责抗原结合。cdr形成环,连接由框架区形成的β片层结构,并且在一些情况下构成由框架区形成的β片层结构的一部分。示例性的高变环出现在氨基酸残基26-32(l1)、50-52(l2)、91-96(l3)、26-32(h1)、53-55(h2)和96-101(h3)处(chothia和lesk,j.mol.biol.,196:901-917(1987))。示例性cdr(cdr-l1、cdr-l2、cdr-l3、cdr-h1、cdr-h2和cdr-h3)出现在氨基酸残基l1的24-34、l2的50-56、l3的89-97、h1的31-35b、h2的50-65和h3的95-102(kabat等人,sequencesofproteinsofimmunologicalinterest,第五版(1991))。除了vh中的cdr1外,cdr通常包括形成高变环的氨基酸残基。cdr还包括“特异性决定残基”或“sdr”,它们是与抗原接触的残基。sdr被包含在被称为缩写cdr或a-cdr的cdr区域内。示例性的a-cdr(a-cdr-l1、a-cdr-l2、a-cdr-l3、a-cdr-h1、a-cdr-h2和a-cdr-h3)出现在氨基酸残基l1的31-34、l2的50-55、l3的89-96、h1的31-35b、h2的50-58和h3的95-102处(参见,例如,fransson,front.biosci.,13:1619-1633(2008))。除非另有说明,否则可变域中的残基在本文中根据上文kabat等人所述进行编号。可变区是抗体重链或轻链的域,其涉及抗体与抗原的结合(参见,例如,kindt等人,kubyimmunology,第6版,w.h.freemanandco.,p.91(2007))。单个vh或vl域可以足以赋予抗原结合特异性。此外,可以使用vh或vl域从结合抗原的抗体中分离结合特定抗原的抗体,以分别筛选互补vl或vh域的文库(参见,例如,portolano等人,j.immunol.,150:880-887(1993);clarkson等人,nature352:624-628(1991))。

抗体可以包括抗原结合片段(fab)和片段可结晶区(fc)。fc区可以与细胞表面受体相互作用,该细胞表面受体可以允许抗体激活免疫系统。在igg、iga和igd抗体同种型中,fc区由两个相同的蛋白片段组成,它们分别来自抗体两条重链的第二和第三恒定域;igm和ige的fc区在每条多肽链中含有三个重链恒定域(ch域2-4)。igg的fc区带有高度保守的n-糖基化位点。fc片段的糖基化对于fc受体介导的活性可能是至关重要的。附接于该位点的n-聚糖主要是复合型的核心岩藻糖基化双触角结构。抗体片段的示例包括,但不限于,(1)fab片段,是由vl、vh、cl和ch1域组成的单价片段,(2)f(ab')2片段,是包括通过铰链区的二硫键连接的两个fab片段的二价片段,(3)fv片段,由抗体单臂的vl和vh域组成,(4)fab'片段,在温和的还原条件下破坏f(ab')2片段的二硫键而产生,(5)二硫键稳定的fv片段(dsfv),以及(6)单域抗体(sdab),是特异性结合抗原的抗体单可变区域(vh或vl)多肽。

虽然轻链和重链的恒定区可以不直接参与抗体与抗原的结合,但恒定区可以影响可变区的取向。恒定区还可以表现出各种效应子功能,如通过与效应分子和细胞相互作用而参与抗体依赖的补体介导的裂解或抗体依赖的细胞毒性。

抗体还可以包括嵌合抗体、人源化抗体和重组抗体、从转基因非人动物产生的人抗体,以及使用技术人员可用的富集技术从文库中选择的抗体。

抗体可以是在脊椎动物的血液或其他体液中发现的蛋白质,其被免疫系统用来鉴定和中和异物,如细菌和病毒。抗体可以包括单克隆抗体、多克隆抗体、多特异性抗体(例如,双特异性抗体和多反应性抗体)和抗体片段。因此,抗体可以包括,但不限于,任何特异性结合成员、免疫球蛋白类别和/或同种型(例如,igg1、igg2、igg3、igg4、igm、iga、igd、ige和igm);及其生物学相关的片段或其特异性结合成员,包括但不限于fab、f(ab')2、fv和scfv(单链或相关实体)。抗体片段是通过重组dna技术或完整抗体的酶切或化学切割产生的。除“双特异性”或“双功能”抗体以外的抗体应理解为其每个结合位点均相同。单克隆抗体可以从基本同型的抗体的群体中获得,即,除了可能少量存在的可能自然发生的突变以外,构成该群体的各个抗体是相同的。多克隆抗体可以是包括针对不同决定簇(表位)的不同抗体的制品。

抗体生物标志物

抗体可以用作疾病诊断或预后的生物标志物。在一些实施方案中,抗体可以是用于癌症诊断或预后的生物标志物。在一些实施方案中,抗体可以是用于传染病诊断或预后的生物标志物。在一些实施方案中,抗体可以是用于自身免疫疾病诊断或预后的生物标志物。

患者自身的免疫系统在暴露于癌症蛋白后所产生的循环抗体可以是早期检测癌症的生物标志物。在一些实施方案中,此类循环抗体是自身抗体。自身抗体作为生物标志物的一个优势是,尽管相应抗原的量相对较小,但其仍可以大量生产。由于有限的蛋白水解和清除作用,自身抗体也有望具有持久的浓度和长的半衰期。免疫系统不断监测人体中微生物和外来分子的入侵。对抗体、t淋巴细胞、抗原呈递细胞、细胞因子和微环境信号的紧密调控的网络确保发展出抵抗感染的适当靶向免疫应答。b淋巴细胞识别外来的细胞外和表面抗原,通过分泌抗体来产生应答。为了引起持续的抗体应答,b细胞可以利用来自t辅助细胞的额外信号,该辅助细胞以与ii类主要组织相容性复合物(mhc)相复合的长度为15-25个氨基酸的肽片段的形式呈递相关抗原。抗原也可以刺激cd8+t淋巴细胞。这些细胞被某些细胞内和膜蛋白激活,该细胞内和膜蛋白通过内源处理途径被处理并以与i类mhc复合的8-12个氨基酸的肽呈递。这两个系统是高度协调的,并且在大多数情况下,高亲和力免疫球蛋白g(igg)抗体应答可能需要b和t淋巴细胞都识别抗原。在免疫系统的发展初期,估计半数以上新生成的b细胞受体能够结合自身抗原。然而,大多数自身反应性b细胞在b细胞成熟过程中被清除,从而阻止成熟的b细胞与自身分子发生反应。这种选择为自身耐受性,即免疫系统识别和忽略人体自身细胞和组织的能力,的发展提供了基础。有时由于过度表达、突变、蛋白质半衰期改变、折叠错误、自身蛋白质异常降解,或蛋白质的翻译后修饰(例如,糖基化和磷酸化)改变,这种机制失效,并且免疫系统会与自身抗原发生反应。长期以来,自身抗体已经在自身免疫疾病中被认识到,包括系统性红斑狼疮、重症肌无力和类风湿关节炎。在一些疾病中,自身抗体在其发病机制中起重要作用(例如,重症肌无力)。例如,在类风湿关节炎中,对抗-igg抗体(也称为类风湿因子)的测试是有用的,灵敏度约为80%。在癌症患者中可以检测到针对各种抗原的自身抗体。该抗原主要存在于癌细胞中,而很少存在于健康细胞中。

可以用作生物标志物的肿瘤相关抗体的示例包括,但不限于,抗il6、抗il8、抗ca-125、抗c-myc、抗p53、抗cea、抗ca15-3、抗muc-1、抗存活蛋白、抗bhcg、抗骨桥蛋白、抗pdgf、抗her2/neu、抗akt1和抗细胞角蛋白19抗体。在一些实施方案中,来自患者血液的样品中存在异常水平的两种或更多种抗体表明患者中癌症的存在。还可以提供阵列来定量患者血液中抗体生物标志物的水平。在一些实施方案中,一种预测癌症发作的方法包括确定来自患者血液的样品中两种或更多种抗体随时间的浓度变化。

靶结合单元

本文提供了包括靶结合单元的组合物和方法。靶结合单元可以是两个结合元件(例如,肽或类肽序列)的结构排列,每个结合元件包括靶结合区。例如,靶结合单元可以是两个肽序列的结构排列。如本文所用,结合元件可以指潜在的免疫受体结合分子,或pirm。在各种实施方案中,肽序列可以被类肽序列替代。靶结合单元可以是期望结合至分析物分子(例如,抗体或其片段)的最小单元。

根据本公开内容的一个方面,靶结合单元包括第一肽序列和第二肽序列,其中第一肽序列和第二肽被间隔区隔开,并间隔一定距离,以使第一肽序列和第二肽序列同时结合至包括抗体的抗原结合域的单个分子。第一肽序列可以具有与第二肽序列相同的序列。第一肽序列可以具有与第二肽序列不同的序列。例如,第一肽序列的序列与第二肽序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%相同的序列。在一些实施方案中,第一肽序列包括第一结合区,并且第二肽序列包括第二结合区。如本文所用,“结合区”和“靶结合区”可以互换使用,并且是指结合元件与分析物相互作用的区域,例如,表位。在一些实施方案中,第一结合区和第二结合区被间隔区隔开,并间隔一定距离,以使第一结合区和第二结合区同时结合至包括抗体的抗原结合域的单个分子。结合区可以是与分子的抗原结合域物理相互作用或附接的肽序列的一部分。例如,结合区可以是直接与抗体的fab相互作用或附接的表位。在一些实施方案中,第一结合区和第二结合区具有相同的序列。在一些实施方案中,第一结合区和第二结合区具有相同的表位。在一些实施方案中,第一结合区和第二结合区具有被单个分子识别的相同结构。

根据本公开内容的另一个方面,靶结合单元包括第一类肽序列和第二类肽序列,其中第一类肽序列和第二类肽序列同时结合至包括抗体的抗原结合域的单个分子。

在一些实施方案中,第一肽序列、第二肽序列和间隔区是相邻的并且包括在单个肽链中。例如,第一肽序列的c末端和间隔区的n末端,以及间隔区的c末端和第二肽序列的n末端通过肽键连接。

在一些实施方案中,第一肽序列、第二肽序列和间隔区不包括在单个肽链中。例如,间隔区可以用作支架,并且第一肽序列和第二肽序列分别连接至间隔区的相对端。在一些实施方案中,第一肽序列、第二肽序列和间隔区通过非肽键连接。

间隔区可以是任何类型的聚合物,并且可以用于分离第一肽序列和第二肽序列,使得第一肽序列和第二肽序列同时结合至分析物的单个分子。间隔区可以包括聚合物的一条或多条链/股。在一些实施方案中,间隔区包括相同类型聚合物的一条或多条链/股。在一些实施方案中,间隔区包括不同类型的聚合物的一条或多条链/股。在一些实施方案中,聚合物可以是多肽、多核苷酸或聚亚烷基二醇。聚亚烷基二醇可以包括聚乙二醇(peg)和聚丙二醇(ppg)。聚合物的其他示例包括,但不限于,乙酸纤维素(包括二乙酸纤维素)、乙烯乙烯醇共聚物、水凝胶(例如,丙烯酸树脂类)、聚丙烯腈、聚乙酸乙烯酯、乙酸丁酸纤维素、硝化纤维素、氨基甲酸酯/碳酸酯的共聚物、苯乙烯/马来酸的共聚物、聚丙交酯、聚乙交酯、聚己内酯、聚酸酐、聚酰胺、聚氨酯、聚酯酰胺、聚原酸酯、聚二噁烷、聚缩醛、聚缩酮、聚碳酸酯、聚原碳酸酯、聚磷腈、聚羟基丁酸酯、聚羟基戊酸酯、聚亚烷基草酸酯、聚亚烷基琥珀酸酯、聚(苹果酸)、聚(氨基酸)、聚乙烯吡咯烷酮、聚乙二醇、聚羟基纤维素、甲壳质、壳聚糖,以及共聚物、三元共聚物、纤维蛋白、明胶、胶原蛋白及其任何组合。

在一些情况下,两个肽或类肽序列通过接头连接至间隔区。在一些情况下,接头由在肽或类肽序列上的第一反应基团和在间隔区上的第二反应基团形成。例如,间隔区可以包括两个反应基团,其可以连接至两个肽或类肽序列。

间隔区可以是非结构化的接头。在一些实施方案中,间隔区折叠成结构。结构可以是多核苷酸的双螺旋体结构,或多肽或多核苷酸的任何二级结构或三级结构。在一些实施方案中,间隔区包括预先设计的氨基酸序列。例如,预先设计的氨基酸可以包括多组甘氨酸和丝氨酸重复序列,如(gly4ser)n,其中n是等于或大于1的正整数。在一些实施方案中,间隔区包括折叠的多肽。在一些实施方案中,间隔区包括二级结构和/或三级结构。在一些实施方案中,间隔区包括卷曲螺旋结构或β片层结构。在一些实施方案中,间隔区包括两个或更多个分离的肽链,其中两个或更多个分离的肽链中的至少一个包括α-螺旋体或β-链。在一些实施方案中,间隔区包括两条分离的肽链,其中两条肽链中的每条包括α-螺旋体,并且两个α-螺旋体形成卷曲螺旋结构。在一些实施方案中,间隔区包括两条分离的肽链,其中两条肽链中的每条均包括β链,并且两条β链形成β片层。在一些实施方案中,间隔区包括折叠成至少两个α-螺旋体或至少两个β-链的单个肽链。在一些实施方案中,间隔区包括折叠成卷曲螺旋结构或β片层结构的单个肽链。在一些实施方案中,间隔区包括单个肽链,并且单个肽链折叠成四个α-螺旋体或四个β-链。

在一些实施方案中,间隔区包括由三条分离的肽链形成的卷曲螺旋结构。例如,间隔区包括第一肽链、第二肽链和第三肽链,其中第二肽链与第一肽链的第一部分相互作用,并且其中第三肽链与第一肽链的第二部分相互作用。在这种情况下,第一肽链、第二肽链和第三肽链折叠成α-螺旋体。在一些实施方案中,第二肽链和第三肽链连接至双链多核苷酸的相对端。在一些实施方案中,间隔区包括寡核苷酸。在一些实施方案中,间隔区包括寡核苷酸,其中寡核苷酸是双链寡核苷酸。

间隔区的长度可以被设计为使两个结合元件隔开一定距离,使得两个结合元件同时结合至具有抗体的抗原结合域的单个分子。在一些实施方案中,间隔区是多核苷酸。在这种情况下,间隔区的长度可以是从20至40个核苷酸、从30至50个核苷酸、从40至60个核苷酸、从50至70个核苷酸、从60至80个核苷酸、从70至90个核苷酸、从80至100个核苷酸、从90至110个核苷酸、从100至120个核苷酸、从110至130个核苷酸、从120至140个核苷酸或130至150个核苷酸。在一些情况下,间隔区的长度可以是至少10个核苷酸、至少15个核苷酸、至少20个核苷酸、至少25个核苷酸、至少30个核苷酸、至少35个核苷酸、至少40个核苷酸、至少45个核苷酸、至少50个核苷酸、至少55个核苷酸、至少60个核苷酸、至少65个核苷酸、至少70个核苷酸、至少75个核苷酸、至少80个核苷酸、至少85个核苷酸、至少90个核苷酸、至少95个核苷酸、至少100个核苷酸或更多。多核苷酸可以是双链或单链的。在双链多核苷酸的情况下,使用“核苷酸”为单位的长度可以意指“碱基对”。例如,长度为20个核苷酸可以意指长度为20个碱基对。在一些实施方案中,间隔区是多肽。在这种情况下,间隔区的长度可以是从20至40个氨基酸残基、从30至50个氨基酸残基、从40至60个氨基酸残基、从50至70个氨基酸残基、从60至80个氨基酸残基、从70至90个氨基酸残基、从80至100个氨基酸残基、从90至110个氨基酸残基、从100至120个氨基酸残基、从110至130个氨基酸残基、从120至140个氨基酸残基、从130至150个氨基酸残基、从140至160个氨基酸残基、从150至170个氨基酸残基、从160至180个氨基酸残基、从170至190个氨基酸残基或从180至200个氨基酸残基。在一些情况下,间隔区的长度可以是至少20个氨基酸残基、至少30个氨基酸残基、至少40个氨基酸残基、至少50个氨基酸残基、至少60个氨基酸残基、至少70个氨基酸残基、至少80个氨基酸残基、至少90个氨基酸残基、至少100个残基、至少120个氨基酸残基、至少150个氨基酸残基或更多。

靶结合单元可以包括两个结合元件。在一些实施方案中,结合元件是肽序列或类肽序列。在一些实施方案中,结合元件可以是长度为从4至30个氨基酸、从5至20个氨基酸、从6至10个氨基酸、从8至11个氨基酸或从10至20个氨基酸的肽序列。在一些实施方案中,结合元件可以是长度为从5至15个氨基酸、从6至16个氨基酸、从7至17个氨基酸、从8至18个氨基酸、从9至19个氨基酸、从10至20个氨基酸、从11至21个氨基酸、从12至22个氨基酸、从13至23个氨基酸、从14至24个氨基酸、从15至25个氨基酸、从16至26个氨基酸、从17至27个氨基酸、从18至28个氨基酸、从19至29个氨基酸或从20至30个氨基酸的肽序列。在一些实施方案中,结合元件可以是长度为至少5个氨基酸、至少10个氨基酸、至少15个氨基酸、至少20个氨基酸、至少25个氨基酸、至少30个氨基酸、至少35个氨基酸、至少40个氨基酸、至少45个氨基酸、至少50个氨基酸或更长的肽序列。在一些实施方案中,结合元件是具有折叠结构的肽序列。例如,结合元件可以是蛋白质或其一部分。在这种情况下,结合元件可以具有至少50个氨基酸、至少60个氨基酸、至少70个氨基酸、至少80个氨基酸、至少90个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸、至少250个氨基酸、至少300个氨基酸、至少400个氨基酸、至少500个氨基酸或更长的长度。

在一些实施方案中,结合元件是类肽序列。在一些实施方案中,结合元件可以是长度为从4至30个残基、从5至20个残基、从6至10个残基、从8至11个残基或从10至20个残基的类肽序列。在一些实施方案中,结合元件可以是长度为从5至15个残基、从6至16个残基、从7至17个残基、从8至18个残基、从9至19个残基、从10至20个残基、从11至21个残基、从12至22个残基、从13至23个残基、从14至24个残基、从15至25个残基、从16至26个残基、从17至27个残基、从18至28个残基、从19至29个残基或从20至30个残基的类肽序列。在一些实施方案中,结合元件可以是长度为至少5个残基、至少10个残基、至少15个残基、至少20个残基、至少25个残基、至少30个残基、至少35个残基、至少40个残基、至少45个残基、至少50个残基或更长的类肽序列。

靶结合部分

靶结合部分是指包括一个或多个连接在一起的靶结合单元的构建体。在一些情况下,靶结合部分仅包括一个靶结合单元,并且在这种情况下,靶结合单元和靶结合部分是等同的。

本文提供了包括靶结合部分的组合物和方法,其中靶结合部分包括一个或多个靶结合单元。靶结合单元可以包括被间隔区分离的两个结合元件(例如,肽或类肽)。

本文还提供了包括多核苷酸条形码化的靶结合部分的组合物和方法,其中多核苷酸条形码化的靶结合部分包括一个或多个靶结合单元。在一些情况下,多核苷酸可以用作条形码,其鉴定或对应于靶结合部分的身份,例如,靶结合部分的肽或类肽序列。在一些情况下,多核苷酸可以编码(例如,可以被转录和/或翻译成)靶结合部分的肽序列。多核苷酸可以通过本领域中任何可用的方法检测,以确定多核苷酸的序列,从而确定相应肽序列的序列。例如,多核苷酸可以通过测序检测。

在一些实施方案中,本文提供了一种多核苷酸条形码化的靶结合部分,其包括通过接头连接至靶结合单元的核酸序列,该靶结合单元包括含有第一结合区的第一肽序列和含有第二结合区的第二肽序列;其中第一结合区和第二结合区被间隔区隔开,并间隔一定距离,使得第一肽序列和第二肽序列同时结合至包括抗体的抗原结合域的单个分子;其中核酸序列编码第一肽序列和/或第二肽序列。

在一些实施方案中,靶结合部分包括第一肽和第二肽,其中第一肽和第二肽被间隔开,使得第一肽和第二肽同时结合至单个分析物分子。

靶结合部分可以包括线性链或支链。

在一些情况下,靶结合部分包括线性链,其中靶结合单元在单个肽链中是相邻的。如上所述,在这种情况下,每个靶结合单元的第一肽序列、第二肽序列和间隔区是相邻的并且包括在单个肽链中。在一些实施方案中,靶结合部分是线性聚合物链。在一些实施方案中,靶结合部分是线性多肽链。靶结合单元的第一肽、第二肽和间隔区在线性多肽链中可以是相邻的。在一些实施方案中,靶结合部分是包括一个或多个靶结合单元的线性多肽链,其中一个或多个靶结合单元在线性多肽链中是相邻的。

在一些其他情况下,靶结合部分包括具有主链和两条或更多条侧链的支链聚合物链。主链可以是支架。两条或更多条侧链可以包括肽序列。两条或更多条侧链可以通过键或接头连接至支架。在一些实施方案中,靶结合部分的支架是多肽链。在一些实施方案中,靶结合部分的支架是聚亚烷基二醇链。在一些其他实施方案中,靶结合部分的支架是多核苷酸链。

在一些实施方案中,靶结合部分包括支架。在一些实施方案中,支架包括多肽链。多肽链可以是任何长度。例如,多肽链的长度可以是2至50000个氨基酸残基。在一些实施方案中,多肽链的长度可以是至少约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50或更多个氨基酸残基。在一些实施方案中,多肽链的长度可以是至少约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、70、80、90、100、150、200、250、300、350、400、450、500或更多个氨基酸残基。在一些实施方案中,多肽链的长度可以是至多约8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、55、60、70、80、90、100、150、200、250、300、350、400、450、500或更少的氨基酸残基。

在一些实施方案中,多肽链的总长度为至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、至少30、至少40、至少50、至少60、至少70、至少80、至少90、至少100、至少150、至少200、至少250、至少300、至少350、至少400、至少450或至少500个氨基酸。在一些实施方案中,多肽链的总长度为至少500、至少600、至少700、至少800、至少900、至少1000、至少1200、至少1500、至少2000、至少3000、至少4000、至少5000、至少6000、至少7000、至少8000、至少9000或至少10000个氨基酸残基。在一些实施方案中,多肽链的总长度为至少10000、至少20000、至少30000、至少40000或至少5000个氨基酸残基。

在一些实施方案中,多肽链的总长度为至多8、至多9、至多10、至多11、至多12、至多13、至多14、至多15、至多16、至多17、至多18、至多19、至多20、至多21、至多22、至多23、至多24、至多25、至多26、至多27、至多28、至多29、至多30、至多40、至多50、至多60、至多70、至多80、至多90、至多100、至多150、至多200、至多250、至多300、至多350、至多400、至多450或至多500个氨基酸。在一些实施方案中,多肽链的总长度为至多500、至多600、至多700、至多800、至多900、至多1000、至多1200、至多1500、至多2000、至多3000、至多4000、至多5000、至多6000、至多7000、至多8000、至多9000或至多10000个氨基酸残基。在一些实施方案中,多肽链的总长度为至多10000、至多20000、至多30000、至多40000或至多5000个氨基酸残基。

在一些实施方案中,支架包括多核苷酸链。多核苷酸链可以是任何长度。在一些实施方案中,多核苷酸链的长度为1个核苷酸至约3,000,000个核苷酸、1个核苷酸至约2,500,000个核苷酸、1个核苷酸至约2,000,000个核苷酸、1个核苷酸至约1,500,000个核苷酸、1个核苷酸至约1,000,000个核苷酸、1个核苷酸至约500,000个核苷酸、1个核苷酸至约250,000个核苷酸、1个核苷酸至约200,000个核苷酸或1个核苷酸至约150,000个核苷酸。多核苷酸的示例还可以是长度为1个核苷酸至约100,000个核苷酸、1个核苷酸至约10,000个核苷酸、1个核苷酸至约5,000个核苷酸、4个核苷酸至约2,000个核苷酸、6个核苷酸至约2,000个核苷酸、10个核苷酸至约1,000个核苷酸、10个核苷酸至约500个核苷酸、10个核苷酸至约300个核苷酸、10个核苷酸至约200个核苷酸或20个核苷酸至约100个核苷酸,以及其间的任何范围或值,无论是否重叠。在一些实施方案中,多核苷酸链的长度可以为5至20个核苷酸、10至30个核苷酸、15至35个核苷酸、20至40个核苷酸、25至50个核苷酸、30至60个核苷酸、50至100个核苷酸、60至150个核苷酸、100至200个核苷酸、200至300个核苷酸、300至400个核苷酸或400至500个核苷酸。

在一些实施方案中,支架是聚亚烷基二醇链。如本文所用,术语“聚亚烷基二醇”或“聚(烯烃二醇)”是指聚乙二醇(聚(乙二醇))、聚丙二醇、聚丁二醇及其衍生物。例如,在商业供应商目录中列出了其他示例实施方案,例如,shearwatercorporation的目录“用于生物医学应用的聚乙二醇和衍生物(polyethyleneglycolandderivativesforbiomedicalapplications)”(2001)。

各种接头可以用于将肽序列连接至支架。如上所述,在靶结合单元的情况下,可以使用各种接头将肽序列连接至间隔区。在一些实施方案中,接头由肽序列上的第一反应基团和支架或间隔区上的第二反应基团形成。

在一些实施方案中,接头是连接化合物的两个部分的有机部分。此类接头可以包括直接键或原子,如氧或硫、单元,如nh、c(o)、c(o)nh、so、so2、so2nh、ss)或原子链,如取代的或未取代的c1-c6烷基、取代或未取代的c2-c6烯基、取代或未取代的c2-c6炔基、取代或未取代的c6-c12芳基、取代或未取代的c5-c12杂芳基、取代或未取代的c5-c12杂环基、取代或未取代的c3-c12环烷基,其中一个或多个亚甲基可以被o、s、s(o)、so2、nh、c(o)中断或终止。

接头可以是可裂解的接头。可裂解的连接基团的示例包括,但不限于,氧化还原可裂解的连接基团(例如,—s—s—和—c(r)2—s—s—,其中r是h或c1-c6烷基,并且至少一个r是c1-c6烷基,如ch3或ch2ch3);基于磷酸酯的可裂解的连接基团(例如,—o—p(o)(or)—o—、—o—p(s)(or)—o—、—o—p(s)(sr)—o—、—s—p(o)(or)—o—、—o—p(o)(or)—s—、—s—p(o)(or)—s—、—o—p(s)(ork)-s—、—s—p(s)(or)—o—、—o—p(o)(r)—o—、—o—p(s)(r)—o—、—s—p(o)(r)—o—、—s—p(s)(r)—o—、—s—p(o)(r)—s—、—o—p(s)(r)—s—、—o—p(o)(oh)—o—、—o—p(s)(oh)—o—、—o—p(s)(sh)—o—、—s—p(o)(oh)—o—、—o—p(o)(oh)—s—、—s—p(o)(oh)—s—、—o—p(s)(oh)—s—、—s—p(s)(oh)—o—、—o—p(o)(h)—o—、—o—p(s)(h)—o—、—s—p(o)(h)—o—、—s—p(s)(h)—o—、—s—p(o)(h)—s—和—o—p(s)(h)—s—,其中r是任选取代的线性或支链c1-c10烷基);酸可裂解的连接基团(例如,腙、酯,以及氨基酸的酯、—c═nn—和—oc(o)—);基于酯的可裂解连接基团(例如,—c(o)o—);基于肽的可裂解连接基团(例如,被诸如肽酶和蛋白酶的酶裂解的连接基团,例如,—nhchrac(o)nhchrbc(o)—,其中ra和rb是两个相邻氨基酸的r基团)。基于肽的可裂解连接基团包括两个或更多个氨基酸。在一些实施方案中,基于肽的裂解连接包括氨基酸序列,该氨基酸序列是细胞中发现的肽酶或蛋白酶的底物。

除了共价连接外,化合物的两个部分可以通过亲和结合对连接在一起。术语“亲和结合对”或“结合对”是指彼此特异性结合的第一分子和第二分子。结合对的一个成员与要连接的第一部分缀合,而第二成员与要连接的第二部分缀合。如本文所用,术语“特异性结合”是指结合对的第一成员与结合对的第二成员之间以比其他分子更大的亲和力和特异性结合。

示例性的结合对包括与相应抗体或其结合部分或片段组合的任何半抗原或抗原性化合物(例如,洋地黄毒苷和抗洋地黄毒苷;小鼠免疫球蛋白和山羊抗小鼠免疫球蛋白)和非免疫结合对(例如,生物素-亲和素、生物素-链霉亲和素、生物素-中性亲和素、激素(例如,甲状腺素和皮质醇-激素结合蛋白)、受体-受体激动剂、受体-受体拮抗剂(例如,乙酰胆碱受体-乙酰胆碱或其类似物)、igg-蛋白a、igg-蛋白g、igg-合成蛋白ag、凝集素-碳水化合物、酶-酶辅因子、酶-酶抑制剂和能够形成核酸双链体的互补寡核苷酸对)等。结合对还可以包括带负电荷的第一分子和带正电荷的第二分子。

使用结合对缀合的示例是生物素-亲和素、生物素-链霉亲和素或生物素-中性亲和素缀合。在这种方法中,一个分子(例如,肽)可以被生物素化,并且另一个(例如,支架)可以与亲和素或链霉亲和素缀合。再例如,支架被生物素化,并且肽与亲和素或链霉亲和素缀合。许多商业试剂盒可以用于生物素化分子。

使用结合对缀合的另一个示例是生物素-夹心法。参见,例如,davis等人,proc.natl.acad.sci.usa,103:8155-60(2006)。两个待缀合在一起的分子可以被生物素化,然后使用至少一个四价亲和素类分子(例如,亲和素、链霉亲和素或中性亲和素)作为接头缀合在一起。因此,在一些实施方案中,肽和支架都可以被生物素化,然后使用亲和素类分子(例如,亲和素、链霉亲和素或中性亲和素)连接在一起。在一些实施方案中,中性亲和素和/或链霉亲和素用作接头,以将生物素化的分子桥接在一起。

使用结合对缀合的另一个示例是双链核酸缀合。在这种方法中,待连接的第一部分可以与双链核酸的第一链缀合,并且待连接的第二部分可以与双链核酸的第二链缀合。核酸可以包括,但不限于,限定的序列区段和序列,其包括核苷酸、核糖核苷酸、脱氧核糖核苷酸、核苷酸类似物、修饰的核苷酸和包含骨架修饰、分支点和核苷酸残基的核苷酸、基团或桥。

使用结合对缀合的另一个示例是卷曲螺旋缀合。在这种方法中,待连接的第一部分与折叠成α-螺旋体的第一肽链缀合,并且待连接的第二部分与折叠成α-螺旋体的第二肽链缀合。两个α-螺旋体相互作用形成卷曲螺旋结构,以将两个部分连接在一起。

结合对缀合的其他示例包括halotag、clip-tag和snap-tag。

在一些实施方案中,接头可以是接头分子。接头分子的示例可包括,但不限于,聚合物、糖、核酸、肽、蛋白质、烃、脂质、聚乙二醇、交联剂或其组合。

可以用作接头分子的交联剂的非限制性示例可以包括,但不限于,胺-胺交联剂(例如,但不限于基于nhs-酯和/或亚胺酸酯反应性基团的那些)、胺-巯基交联剂、羧基-胺交联剂(例如,但不限于,碳二亚胺交联剂,如dcc和/或edc(edac);和/或n-羟基琥珀酰亚胺(nhs))、光反应性交联剂(例如,但不限于,芳基叠氮化物、双吖丙啶和任何本领域公认的光反应性(光活化)化学交联剂)、巯基-碳水化合物交联剂(例如,但不限于基于马来酰亚胺和/或酰肼反应性基团的那些)、巯基-羟基交联剂(例如,但不限于基于马来酰亚胺和/或异氰酸酯反应性基团的那些)、巯基-巯基交联剂(例如,但不限于,马来酰亚胺和/或吡啶二硫基反应性基团)、sulfo-smcc交联剂、sulfo-sbed生物素标记转移试剂、基于巯基的生物素标记转移试剂、光反应性氨基酸(例如,但不限于亮氨酸和/或蛋氨酸的双吖丙啶类似物)、nhs-叠氮化物staudinger连接试剂(例如,但不限于,活化的叠氮基化合物)、nhs-膦staudinger连接试剂(例如,但不限于,活化的膦化合物)及其任何组合。

合适的反应基团的示例包括亲电试剂或亲核试剂,其可以分别与相应的亲核试剂或亲电试剂在感兴趣的基质上反应形成共价键。合适的亲电反应基团的非限制性示例可以包括,例如,包括活化酯在内的酯(例如,琥珀酰亚胺酯)、酰胺、丙烯酰胺、酰基叠氮化物、酰基卤、酰基腈、醛、酮、卤代烷、烷基磺酸盐、酸酐、芳基卤化物、氮丙啶、硼酸盐、碳二亚胺、重氮烷、环氧化物、卤代乙酰胺、卤代铂酸盐、卤代三嗪、亚氨基酯、异氰酸酯、异硫氰酸酯、马来酰亚胺、亚磷酰胺、甲硅烷基卤化物、磺酸酯、磺酰卤等。合适的亲核反应基团的非限制性示例可以包括,例如,胺、苯胺、硫醇、醇、酚、肼(hyrazine)、羟胺、羧酸、乙二醇、杂环等。

编码部分

在各种实施方案中,本文提供了与靶结合部分连接的编码部分。编码部分可以是多核苷酸或核酸序列。与靶结合部分相连的编码部分可以指“多核苷酸条形码化的靶结合部分”。

根据一个方面,编码部分是单链多核苷酸。根据另一方面,编码部分是双链多核苷酸。在一些情况下,编码部分可以包括单链的第一多核苷酸部分和双链的第二多核苷酸部分。编码部分可以是脱氧核糖核酸、核糖核酸或其组合。

编码部分的长度可以变化。根据某些方面,编码部分的长度可以为1个核苷酸至约3,000,000个核苷酸、1个核苷酸至约2,500,000个核苷酸、1个核苷酸至约2,000,000个核苷酸、1个核苷酸至约1,500,000个核苷酸、1个核苷酸至约1,000,000个核苷酸、1个核苷酸至约500,000个核苷酸、1个核苷酸至约250,000个核苷酸、1个核苷酸至约200,000个核苷酸或1个核苷酸至约150,000个核苷酸。靶多核苷酸的示例也可以是长度为1个核苷酸至约100,000个核苷酸、1个核苷酸至约10,000个核苷酸、1个核苷酸至约5,000个核苷酸、4个核苷酸至约2,000个核苷酸、6个核苷酸至约2,000个核苷酸、10个核苷酸至约1,000个核苷酸、10个核苷酸至约500个核苷酸、10个核苷酸至约300个核苷酸、10个核苷酸至约200个核苷酸或20个核苷酸至约100个核苷酸,以及其间的任何范围或值,无论是否重叠。在一些情况下,编码部分的长度可以等于或大于约100、200、300、400、500、600、700、800、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、30,000或更多个核苷酸。在一些情况下,编码部分的长度可以等于或大于约5、10、20、30、40、50、60、70、80、90、100或更多个核苷酸。对于双链多核苷酸,“核苷酸长度”是指“碱基对数”或双链多核苷酸中的两条链之一的长度。

在一些实施方案中,编码部分是包括条形码的多核苷酸。条形码可以用于确定靶结合部分上对应的肽或类肽序列的身份。通过测序或以其他方式检测条形码,可以确定构成靶结合区的肽或类肽的身份(例如,序列)。

编码部分可以编码靶结合部分的肽序列。在各种实施方案中,编码的肽序列是结合元件。在一些实施方案中,编码的肽序列是与肽接头融合的结合元件。在一些实施方案中,编码部分是编码结合元件的多核苷酸。在一些实施方案中,编码部分是编码结合元件和接头的多核苷酸,使得编码的结合元件在表达后可以与肽接头融合。在一些实施方案中,编码部分是编码肽序列的多核苷酸。在这种情况下,多核苷酸可以被转录和/或翻译成多肽序列。并且在这种情况下,靶结合部分是从多核苷酸转录和/或翻译。在一些实施方案中,可以通过rna显示制造多核苷酸条形码化的靶结合部分。在一些实施方案中,可以通过体外区域化,例如,通过使用乳剂来制造多核苷酸条形码化的靶结合部分。

靶结合部分的制造

具有或不具有连接的编码部分的靶结合部分可以通过几种不同的方法制造。在一些情况下,靶结合部分不与编码部分连接,并且在这种情况下,可以使用各种方法将肽或类肽序列与如本文所述的支架连接,例如,通过接头和结合对。在一些情况下,靶结合部分附接在固体表面上,并且在这种情况下,可以使用各种方法将靶结合部分连接到固体表面上。这些方法包括,但不限于,使用由两个官能团生成的接头连接两个不同的实体。在其他一些情况下,靶结合部分与编码部分,例如,多核苷酸连接,以形成多核苷酸条形码化的靶结合部分。本文所述的是制造多核苷酸条形码化的靶结合部分的三个非限制性示例,包括rna显示、体外区域化和裂分-合并合成。

如本文所述,在一些实施方案中,靶结合部分是多肽链。为了制备靶结合部分的文库,首先可以制备核酸模板的文库。然后可以将核酸模板的文库用于体外转录和/或翻译,以制备靶结合部分的文库。例如,可以制备dna模板的文库,然后转录成rna模板,然后将其翻译成多肽链,每个多肽链具有两个或更多个结合元件。又例如,可以制备rna模板的文库,然后将其翻译成多肽链,每个多肽链具有两个或更多个结合元件。核酸模板的文库可以使用实施例部分示出的方法(例如,实施例3和11)制备。在一些情况下,核酸模板文库中的每个核酸模板可以包括两个或更多个子序列,这些子序列具有相同的核酸序列或编码相同的肽序列。如本文所用,“文库大小”可以用于表示核酸模板文库可以产生多少个唯一的物种(例如,靶结合部分或唯一结合元件序列)。唯一的靶结合部分可以指具有唯一的结合元件序列的靶结合部分。在靶结合部分的文库中,间隔区和支架的序列在所有靶结合部分中可以是相同的。例如,核酸模板的文库大小可以是至少约103个物种、至少约104个物种、至少约105个物种、至少约106个物种、至少约107个物种、至少约108个物种、至少约109个物种、至少约1010个物种、至少约1011个物种、至少约1012个物种、至少约1013个物种、至少约1014个物种、至少约1015个物种、至少约1016个物种或更多个物种。使用核酸模板的文库,可以产生多个靶结合部分或靶结合部分的文库,其具有至少约103个物种、至少约104个物种、至少约105个物种、至少约106个物种、至少约107个物种、至少约108个物种、至少约109个物种、至少约1010个物种、至少约1011个物种、至少约1012个物种、至少约1013个物种、至少约1014个物种、至少约1015个物种、至少约1016个物种或更多个物种。

rna显示

含有本文所述的靶结合部分的组合物可以通过rna显示来制备。使用rna显示,可以将编码肽序列的核酸序列物理连接至其编码的肽序列。在rna显示中,编码的多肽(例如,蛋白质或肽)可以共价附接于rna,例如,使用3'嘌呤霉素标记的rna。嘌呤霉素是翻译抑制剂,在翻译过程中能够进入核糖体并与新生蛋白质/肽形成稳定的共价键。这可以允许在rna显示模板与其编码的蛋白质/肽之间形成稳定的共价连接,从而得到rna显示的蛋白质/肽。

在rna显示中,rna文库的成员可以直接附接至其编码的感兴趣的多肽,例如,通过与嘌呤霉素的稳定共价连接,嘌呤霉素是可以模拟trna的氨酰基端的抗生素。嘌呤霉素是氨基核苷抗生素,对原核生物或真核生物均具有活性,来源于白黑链霉菌(streptomycesalboniger)。在核糖体中发生翻译期间,过早的链终止可以抑制肽合成。分子的一部分可以作为酪氨酰-trna3'端的类似物,其中它的一部分结构可以模拟腺苷分子,并且另一部分可以模拟酪氨酸分子。它可以进入a位点并转移至生长链,导致形成嘌呤霉素化的新生链和过早的链释放。3'位置可以含有酰胺键,而不是trna的正常酯键,从而使分子更耐水解,并阻止沿核糖体的前进。

其他嘌呤霉素类似物或蛋白质合成的衍生物抑制剂包括o-去甲基嘌呤霉素、o-炔丙基-嘌呤霉素、9-{3'-脱氧-3'-[(4-甲基-l-苯丙氨酰基)氨基]-p-d-呋喃核糖基}-6-(n,n'-二甲氨基)嘌呤[l-(4-me)-phe-pans]和6-二甲氨基-9-[3-(对叠氮基-l-β-苯丙氨酰氨基)-3-脱氧-β-呋喃核糖基]嘌呤。

rna文库的成员可以通过接头(诸如但不限于,多核苷酸或化学接头,例如,聚乙二醇)与嘌呤霉素连接。在一些实施方案中,多核苷酸接头在3'末端与嘌呤霉素连接。在其他实施方案中,peg接头与嘌呤霉素连接。当与rna分子3'末端连接的嘌呤霉素进入核糖体时,由于核糖体中的肽基转移酶活性,它可以与新生蛋白质(由rna分子编码)建立共价键。反过来,在蛋白质与嘌呤霉素的o-甲基酪氨酸部分之间可以形成稳定的酰胺键。rna-嘌呤霉素融合物的rna文库可以在体外进行翻译,如本文所述,以产生rna-嘌呤霉素-蛋白质复合物(例如,多核苷酸条形码化的靶结合部分)。

亲和力选择可以在rna显示的肽文库上进行,以筛选具有给定特性(如与分析物的特异性结合)的蛋白质/肽。rna显示可以在溶液中或在固体支持物上进行。可以通过本领域已知的标准方法,如亲和色谱法,来纯化所选择的感兴趣的rna显示的蛋白质/肽。rna可以被克隆、pcr扩增和/或测序,以确定所选择的感兴趣的蛋白质/肽的编码序列。在一些方面,核酸成员文库的成员与嘌呤霉素连接,其中每个成员编码感兴趣的预期蛋白质/肽,该蛋白质/肽的初级氨基酸序列与由其他核酸成员编码的其他蛋白质/肽不同。rna显示系统可以含有不同复合物的群体或混合物,使得每个复合物具有与嘌呤霉素、核糖体和感兴趣的预期蛋白质/肽连接的不同rna。

如本文所提供的,rna显示可以用于产生核酸-肽融合分子的文库。可以提供多种核酸-肽融合分子的文库,其中文库的每个分子可以包括与编码的肽连接的编码核酸,并且其中文库的一个或多个肽可以含有至少一个非天然氨基酸残基。如本文所用,术语“编码核酸”是指包括两个或更多个可以翻译成肽的密码子的核苷酸序列。类似地,术语“编码的肽”是指可以从编码核酸翻译的氨基酸序列。在一些情况下,编码核酸是rna分子,其可以是可以作为本文公开的肽的翻译模板的任何rna分子,例如,从dna或rna模板转录的mrna分子,或化学合成的rna分子。

根据一个方面,本文提供了一种方法,其包括翻译rna的rna序列,其中rna序列编码肽序列,其中rna在rna的3'端连接至肽受体,将肽受体与包括肽序列的翻译肽的氨基酸残基连接,从而形成核酸-肽融合分子。在一些实施方案中,核酸-肽融合分子包括多核苷酸条形码化的靶结合部分,其包括:(i)包括第一结合区的第一肽序列,和(ii)包括第二结合区的第二肽序列;其中第一结合区和第二结合区(i)被间隔区隔开,并且(ii)间隔一定距离,以使第一肽序列和第二肽序列同时结合至包括抗体的抗原结合域的单个分子。在一些情况下,该方法还包括提供dna,其中dna编码rna。在一些情况下,该方法还包括转录dna。在一些情况下,该方法可以还包括反转录rna。通过反转录单链rna产生的dna链可以与该单链rna杂交,以稳定该单链rna。在一些实施方案中,dna分子和/或rna序列编码第一肽序列、第二肽序列和间隔区。在一些实施方案中,核酸-肽融合分子包括多个核酸-肽融合分子。在一些情况下,多个核酸-肽融合分子中的每个核酸-肽融合分子包括唯一的核酸序列。第一结合区和第二结合区可以具有相同的序列。第一结合区和第二结合区可以具有被单个分子识别的相同结构。每个核酸-肽融合分子的间隔区可以相同或包括相同的氨基酸序列。在一些实施方案中,间隔区包括折叠的多肽、二级结构和/或三级结构。例如,隔离子可以包括卷曲螺旋结构或β片层结构。在一些情况下,第一肽序列和第二肽序列具有相同的序列。在一些情况下,第一肽序列的序列与第二肽序列的序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%相同。抗原结合域可以是抗体的片段。抗原结合域可以是scfv、fab或f(ab)2。在一些情况下,第一肽序列和第二肽序列的长度为4至30个氨基酸、5至20个氨基酸、6至10个氨基酸、8至11个氨基酸或10至20个氨基酸。在一些情况下,第一肽序列或第二肽序列的长度为至少约4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个氨基酸。在一些实施方案中,翻译包括体外翻译。

rna显示系统的优点可以是,编码核酸与其编码的肽翻译连接。如本文所用,术语“翻译连接”是指由于核糖体肽基转移酶的催化活性,在肽翻译期间,编码核酸与其编码的肽的连接。在一些情况下,编码核酸分子可以在肽的翻译过程中,通过其3'末端(例如,在肽的c-末端)直接或间接连接至编码的肽。肽和核酸可以使用肽受体来翻译连接。如本文所用,术语“肽受体”是指由于核糖体肽基转移酶功能的催化活性而可以被添加到正在生长的(新生的)肽链的c-末端的分子。以嘌呤霉素为例的肽受体可以含有连接至氨基酸或其类似物或衍生物(例如,o-甲基酪氨酸;也参见ellman等人,meth.enzymol.202:301,1991,其通过引用并入本文)的核苷酸或类似核苷酸的部分,如腺苷或腺苷类似物(例如,在n-6氨基位置二甲基化的腺苷),其中连接是,例如,酯、酰胺或酮连接。肽受体也可以含有亲核试剂,其可以是,例如,氨基、羟基或巯基。肽受体还可以包括核苷酸模拟物、氨基酸模拟物或组合的核苷酸-氨基酸结构的模拟物。

肽受体可以位于编码核酸分子的3'末端。因此,肽受体分子可以紧接着肽编码序列的最终密码子而定位,或者可以通过接头(例如,间插的核苷酸序列,可以是dna或rna)与最终密码子分开。在一些情况下,肽编码序列的3'末端或接头(若存在)包括翻译暂停位点。肽受体可以共价结合至核酸的肽编码序列,或可以非共价连接,例如,通过使用第二核苷酸序列杂交,该第二核苷酸序列在肽编码序列的3'端或附近选择性杂交并且其自身与肽受体分子结合,或在肽编码序列的3'端或附近和第二核苷酸序列的第一端或附近桥接并选择性杂交,其中肽受体在第二核苷酸序列的第二端或附近连接。

示例性的肽受体是嘌呤霉素,其类似于酪氨酰腺苷,并且作用是将生长的肽附接至其编码mrna(参见美国专利号6,281,344)。嘌呤霉素是可以作为链终止剂的抗生素。作为氨酰基-trna的模拟物,嘌呤霉素可以通过结合翻译复合物a位点、接受不断增长的肽链并从核糖体脱落(以kd=10-4m;trautandmonro,j.mol.biol.10:63,1964;smith等人,j.molbiol.13:617,1965)而充当蛋白质合成的通用抑制剂。嘌呤霉素可以与生长的肽链形成稳定的酰胺键,因此比形成例如稳定性较差的酯键的其他肽受体产生更稳定的融合体。肽基-嘌呤霉素分子可以在新生肽(即,仍结合在翻译复合物中的肽)的c末端与嘌呤霉素的o-甲基酪氨酸部分之间含有稳定的酰胺键。o-甲基酪氨酸可以通过稳定的酰胺键与嘌呤霉素的修饰腺苷部分的3'-氨基连接。因此,本文公开了用于将编码核酸和编码肽翻译连接的方法,并且其包括,例如,使用肽受体(如嘌呤霉素)实现连接,该肽受体可以在编码核酸的3'末端或附近连接,以使其在翻译过程中可以进入核糖体复合物,并被掺入到生长的(新生的)肽的c末端,从而终止翻译并连接编码核酸和编码肽。

可用于翻译连接编码核酸和编码肽的额外肽受体包括,例如,在mrna的3'端的类似trna的结构,以及以类似于嘌呤霉素的方式起作用的其他化合物,例如,包括与腺嘌呤或类似腺嘌呤的化合物连接的氨基酸残基的化合物(例如,苯丙氨酰基-腺苷、酪氨酰腺苷和丙氨酰腺苷),以及酰胺连接的化合物,如苯丙氨酰基-3'-脱氧-3'-氨基腺苷、丙氨酰基-3'-脱氧-3'-氨基腺苷和酪氨酰-3'-脱氧-3'-氨基腺苷。类似功能性腺嘌呤的化合物的示例是具有3'氨基酸附接的7-脱氮-腺苷(杀结核菌素)(参见krayevsky和kukhanova,prog.nucl.acidsres.23:2-51,1979,其通过引用并入本文)。此类肽受体可以含有天然存在的l-氨基酸或含有其类似物或衍生物,只要该肽受体可以将编码核酸和编码肽翻译连接。组合的类似trna的3'结构-嘌呤霉素缀合物也可以用作肽受体。

体外区域化

本文所述的含有靶结合部分的组合物可以通过体外区域化制备,作为rna显示的替代策略。

可以使用许多基于基因与其编码的蛋白质/肽之间的物理连接的高通量显示选择方法(griffiths,a.d.和tawfik,d.s.(2000).curropinbiotechnol11,338-53)。这些方法提供选择结合任何给定分析物的蛋白质或肽的方法。本公开内容提供了用于对较大的分子文库(例如,包括肽的靶结合部分的文库)进行区域化的体外系统,并提供了从此类文库中选择和分离具有给定活性(例如,结合抗体)的靶结合部分的方法。在本文提供的方法中,唯一的肽序列可以与单个隔室中的唯一核酸序列连接,使得唯一的核酸序列可以在合并后用于鉴定肽序列。在一些情况下,连接肽序列和核酸序列的方法可以是将编码肽的核酸序列区域化为一个单独的隔室,并进行体外转录和翻译以产生肽的两个或更多个拷贝。在一些实施方案中,核酸序列是单个分子。在一些实施方案中,单个分子包括序列的一个或多个克隆拷贝。在一些实施方案中,核酸是单个分子的两个或更多个克隆拷贝。在一些实施方案中,核酸包括序列的两个或更多个克隆拷贝。在一些实施方案中,单个分子的两个或更多个克隆拷贝可以连接至固体支持物,例如,珠子。如本文所用,“克隆拷贝”是指在扩增过程中源自单分子模板的拷贝。在一些实施方案中,核酸可以是rna,并且在这种情况下,仅在体外进行翻译。并且核酸序列可以连接至在每个端含有官能团的支架。在隔室中产生两个或更多个肽拷贝后,肽的两个拷贝可以通过支架的两个官能团连接至支架。肽可以包括可以与支架上的官能团反应以形成共价键的官能团。

在一些实施方案中,隔室包括核酸序列,其中核酸序列进一步连接至支架。在一些实施方案中,支架具有第一连接位点和第二连接位点,其中第一连接位点连接至第一肽序列,并且第二连接位点连接至第二肽序列。接头可以是任何类型的合适接头。例如,接头可以是共价的或非共价的。例如,接头可以是键或分子。又例如,接头可以是交联剂或结合对缀合物。肽可以通过核酸序列的体外转录和翻译(或仅体外翻译)产生。

在一些实施方案中,本文提供了多个隔室,多个隔室中的每个隔室包括连接至支架的唯一核酸序列。

通过体外区域化产生的与编码部分连接的靶结合部分还可以合并在一起,用于下游应用。

在一些实施方案中,本文提供了一种方法,其包括(a)在多个容器的每个容器中表达由核酸编码的第一肽序列和由核酸编码的第二肽序列,其中多个容器中的每个容器包括支架,支架包括由间隔区隔开的第一连接位点和第二连接位点;以及(b)使第一肽序列与第一连接位点结合,并且使第二肽序列与第二连接位点结合,其中与第一连接位点结合的第一肽序列和与第二连接位点结合的第二肽序列间隔一定距离,以使第一肽序列和第二肽序列同时结合至包括抗体的抗原结合域的单个分子,从而形成多个靶结合部分。在一些情况下,核酸通过接头连接至支架。在一些情况下,核酸的5'端或3'端通过接头连接至支架。在一些情况下,核酸是单个核酸分子。核酸可以在产生多个容器之前或之后连接至支架。在一些情况下,核酸分子是双链或单链的。在一些情况下,核酸分子是dna、rna或其组合。表达可以包括转录和/或翻译。在一些情况下,模板是dna,则表达包括转录和翻译。在一些情况下,模板是rna,则表达包括翻译。在一些情况下,第一肽序列和第二肽序列包括相同的序列。在一些情况下,第一肽序列的序列与第二肽序列的序列至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、至少约99%或100%相同。在一些情况下,该方法还包括合并来自容器的多个多核苷酸条形码化的靶结合部分。在一些情况下,容器是液滴。例如,液滴是油包水液滴。

该方法可以还包括对多个靶结合部分中的靶结合部分条形码化。在一些情况下,条形码化包括将条形码附接至靶结合部分。在一些实施方案中,支架在表达前附接至条形码化的多核苷酸。在一些实施方案中,支架附接至编码第一肽序列的核酸和/或编码第二肽序列的核酸。在一些实施方案中,支架在表达前附接至编码第一肽序列的核酸和/或编码第二肽序列的核酸。

如本文所用,隔室可以是容器或液滴。

在一些情况下,本文提供的方法包括将组合物分区至隔室中,使得在一些隔室中,一个隔室中仅可以有一个核酸序列。核酸序列可以被转录和/或翻译为肽序列。在一些实施方案中,至少50%、60%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的隔室含有零或仅一个核酸序列。所采用的分区或隔室的数量可以根据应用而变化。例如,分区或隔室的数量可以是约5、10、50、100、250、500、750、1000、1500、2000、2500、5000、7500或10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、10000000、20000000或更多。分区或隔室的数量可以是至少约1、5、10、50、100、250、500、750、1000、1500、2000、2500、5000、7500或10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、10000000、20000000或更多。分区或隔室的数量可以小于约5、10、50、100、250、500、750、1000、1500、2000、2500、5000、7500或10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、10000000或小于约20000000。分区或隔室的数量可以为从5至约10000000、从5至约5000000、从5至约1000000、从10至约10000、从10至约5000、从10至约1000、从约1000至约6000、从约1000至约5000、从约1000至约4000、从约1000至约3000或从约1000至约2000。

分区到隔室的核酸分子的数量可以为约1、2、3、4、5、10、50、100、250、500、750、1000、1500、2000、2500、5000、7500或10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、10000000、20000000或更多。分区到隔室的核酸分子的数量可以为至少约1、5、10、50、100、250、500、750、1000、1500、2000、2500、5000、7500或10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、10000000、20000000或108、109、1010、1011、1012、1013、1014、1015、1016或更多。分区到隔室的核酸分子的数量可以小于约2、5、10、50、100、250、500、750、1000、1500、2000、2500、5000、7500或10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000、500000、600000、700000、800000、900000、1000000、2000000、3000000、4000000、5000000、10000000、20000000或108、109、1010、1011、1012、1013、1014、1015或小于1016。分区到隔室的核酸分子的数量可以为从5至约10000000、从5至约5000000、从5至约1000000、从10至约10000、从10至约5000、从10至约1000、从约1000至约6000、从约1000至约5000、从约1000至约4000、从约1000至约3000或从约1000至约2000。在一些实施方案中,每个核酸分子具有唯一的序列。在一些实施方案中,两个或更多个核酸分子可以具有相同的序列。

在一些实施方案中,分区是使用微流体装置被动形成的乳液。这些方法可以涉及挤压、滴落、喷射、尖端流(tip-streaming)、尖端多次断流(tip-multi-breaking)或类似方法。被动微流体液滴产生可以通过改变两种不同流体的竞争力来调节,以控制颗粒的数量、大小和直径。这些力可以是两种溶液混合时的毛细管力、粘度和/或惯性力。

在一些实施方案中,隔室是标准微孔板中的孔,通过分选辅助分离。在一些实施方案中,分选仪是荧光激活细胞分选仪(facs)。此外,与fluidigmc1的情况相同,分区可以在分离的微流体腔室内与自动文库生成偶联。

在一些实施方案中,分区是亚纳升(subnanoliter)孔,并且颗粒被半透膜密封。

在一些实施方案中,分区是通过微流体芯片的主动控制形成的微流体液滴。在主动控制中,液滴的产生可以通过施加外力(如,电力、磁力或向心力)来操纵。微流体芯片中控制液滴主动操纵的流行方法是通过调整两种混合溶液(如油和水)的流体速度来改变内力。

裂分-合并合成

靶结合部分或多核苷酸条形码化的靶结合部分也可以使用裂分-合并合成制造。

在一些情况下,包括两个或更多个结合元件的多核苷酸条形码化的靶结合部分通过裂分-合并来合成。在这种方法中,例如,可以提供具有两个结合元件引发剂的支架,其中支架还可以连接多核苷酸引发剂。可以使用不同的化学构建块以组合方式从两个结合元件引发剂合成两个相同的结合元件。在合成两个结合元件时,可以使用短核苷酸片段作为构建块,从多核苷酸引发剂合成多核苷酸链。具有唯一序列的每个短核苷酸片段对应于唯一的化学构建块。由于结合元件和多核苷酸链可以同时合成,因此多核苷酸链的完整序列可以用于确定每个构建块的附加顺序,因此鉴定整个结合元件的身份。在一些情况下,结合元件是肽。构建块可以是至少5、10、15、20或更多个不同的氨基酸。每个氨基酸可以对应一个短的dna序列,反之亦然。在裂分-合并合成之后,多核苷酸序列可以用于确定结合元件的肽序列。在一些其他情况下,结合元件是类肽,并且类肽序列可以使用本文所述的裂分-合并来合成。在一些其他情况下,结合元件可以是除了肽或类肽以外的化学物质,并且也可以使用本文所述的裂分-合并合成来合成。

条形码

如本文所述,编码部分鉴定或对应于靶结合部分。例如,编码部分可以鉴定或对应于靶结合部分的肽或类肽序列。

本文所述的编码部分可以用作条形码。在一些实施方案中,整个编码部分用作条形码。在一些实施方案中,编码部分的一部分用作条形码。条形码或条形码序列可以是由多核苷酸组成的天然或合成核酸序列,其允许对多核苷酸和具有相同条形码序列的其他序列(例如,与多核苷酸连接的肽序列)进行明确鉴定。条形码可以是任何合适的长度,如长度为2至100个核苷酸。条形码可以具有随机序列或预先确定的序列。条形码序列可以包括至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少25、至少30、至少40、至少45、至少50、至少55、至少60、至少65、至少70、至少75、至少80、至少85、至少90、至少95或至少100个连续核苷酸的序列。条形码序列可以包括至少约5、10、15、20、25、30、35、40、45、50、100、200、300、400、500、600或更多个连续核苷酸的序列。条形码序列可以包括核苷酸的随机组装序列。条形码序列可以是简并序列。条形码序列可以是已知序列。条形码序列可以是预定义的序列。条形码可以包括一个或多个条形码段,其中一个或多个条形码段是连续的或由一个或多个预定义序列隔开。条形码可以是单链或双链核酸。

条形码的长度可以在2至36个核苷酸,或4至36个核苷酸,或6至30个核苷酸,或8至20个核苷酸,或2至20个核苷酸或4至20个核苷酸,或6至20个核苷酸的范围内。在一些实施方案中,条形码的长度可以在3至10个核苷酸,或10至50个核苷酸,或50至100个核苷酸的范围内。在某些方面,一组内的条形码的解链温度在彼此10℃之内,彼此5℃之内或彼此2℃之内。在某些方面,一组内的条形码的解链温度不在彼此10℃之内,彼此5℃之内或彼此2℃之内。在其他方面,条形码是最小交叉杂交组的成员。例如,此类组的每个成员的核苷酸序列可以与该组的每个其他成员的核苷酸序列充分不同,以使得在严格的杂交条件下,没有成员可以与任何其他成员的互补序列形成稳定的双链体。在一些实施方案中,最小交叉杂交组的每个成员的核苷酸序列与每个其他成员的核苷酸序列相差至少两个核苷酸。条形码技术在winzeler等人(1999)science285:901;brenner(2000)genomebiol.1:1kumar等人(2001)naturerev.2:302;giaever等人(2004)proc.natl.acad.sci.usa101:793;eason等人(2004)proc.natl.acad.sci.usa101:11046;以及brenner(2004)genomebiol.5:240中描述。

在一些情况下,条形码序列可以在条形码序列的5'和/或3'侧与预定义序列侧接。在一些情况下,条形码序列的长度可以为至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少25、至少30、至少40、至少45、至少50或更多个核苷酸。在一些情况下,条形码序列的长度可以为2至4、3至10个核苷酸、5至10、6至12、10至15、15至20、20至30、30至40、40至50或10至50个核苷酸。侧接条形码的预定义序列的长度可以为至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少25、至少30、至少40、至少45、至少50或更多个核苷酸。在一些情况下,侧接条形码序列的预定义序列的长度可以为2至4、3至10个核苷酸、5至10、6至12、10至15、15至20、20至30、30至40、40至50或10至50个核苷酸。

在一些实施方案中,多个条形码中的每个条形码具有至少2个核苷酸。例如,多个条形码中的每个条形码的长度可以为至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。在一些实施方案中,多个条形码中的每个条形码具有至多约1000个核苷酸。例如,多个条形码中的条形码的长度可以为至多约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。在一些实施方案中,多个条形码中的每个条形码具有相同的核苷酸长度。例如,多个条形码中的条形码的长度可以为2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸。在一些实施方案中,多个条形码中的一个或多个条形码具有不同长度的核苷酸。例如,多个条形码中的一个或多个第一条形码可以具有约或至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸,并且多个条形码中的一个或多个第二条形码可以具有约2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、60、70、80、90、100、200、500或1000个核苷酸,其中一个或多个第一条形码的核苷酸的数量不同于一个或多个第二条形码。

条形码群体中的条形码可以具有至少10、15、20、25、30、35、40、45、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000或更多不同的序列。例如,群体中的条形码可以具有至少约2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000、10,000、15,000、20,000、25,000、30,000、35,000、40,000、45,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000、500,000、600,000、700,000、800,000、900,000、1,000,000或更多不同的序列。

使用方法

本文提供了使用本文所述的组合物的方法。根据一个方面,本文提供了鉴定可以结合从健康样品或患病样品获得的分析物的靶结合单元或部分的方法。根据另一方面,本文提供了使用鉴定的靶结合单元或部分对从受试者获得的样品中的分析物进行概况分析的方法。在各种实施方案中,分析物是抗体。

根据一些实施方案,本文提供的方法包括:使抗体的混合物与靶结合部分群体接触,其中群体中的每个靶结合部分均包括具有第一结合区和第二结合区的靶结合单元,其中第一结合区和第二结合区被间隔区隔开并且间隔一定距离,使得第一结合区和第二结合区同时结合至混合物中的单个抗体分子。在一些情况下,靶结合单元还包括具有第一结合区的第一肽和/或类肽序列和具有第二结合区的第二肽和/或类肽序列。在一些情况下,第一结合区和第二结合区具有相同的序列。在一些情况下,第一结合区和第二结合区具有被单个分子识别的相同结构。

根据一些实施方案,本文提供了用于选择一组肽的方法,其包括:(a)提供包括第一阵列和第二阵列的阵列的两个或更多个拷贝;(b)从患病受试者获得第一抗体混合物并从健康受试者获得第二抗体混合物;(c)使第一混合物与第一阵列接触,并且使第二混合物与第二阵列接触,其中每个阵列具有至少104个离散区,其中每个离散区具有唯一类型的靶结合部分,所述靶结合部分具有第一结合区和第二结合区,其中第一结合区和第二结合区被间隔区隔开并且间隔一定距离,使得第一结合区和第二结合区同时结合至混合物中的单个抗体分子;(d)去除第一阵列和第二阵列上的未结合的抗体级分;(e)定量在第一阵列和第二阵列的每个离散区上的结合抗体的量;以及(f)鉴定第二阵列中未与第一阵列上的抗体结合的肽。

根据一些其他实施方案,本文提供了选择一组肽的方法,其包括:(a)提供第一溶液和第二溶液;(b)从患病受试者获得第一抗体混合物并从健康受试者获得第二抗体混合物;(c)使第一混合物与第一溶液接触,并使第二混合物与第二溶液接触,其中第一溶液和第二溶液中的每一个包括多个多核苷酸条形码化的靶结合部分,多个多核苷酸条形码化的靶结合部分中的每个多核苷酸条形码化的靶结合部分包括(i)核酸序列,该核酸序列通过接头连接至(ii)靶结合单元,该靶结合单元包括含有第一结合区的第一肽序列和含有第二结合区的第二肽序列;其中第一结合区和第二结合区被间隔区隔开,并间隔一定距离,以使第一肽序列和第二肽序列同时结合至包括抗体的抗原结合域的单个分子;(d)在第一溶液和第二溶液中捕获多个抗体结合的多核苷酸条形码化的靶结合部分;(e)对从第一溶液和第二溶液中捕获的核酸序列进行测序;以及(f)选择该组肽。

在阵列上鉴定

在一些应用中,靶结合部分的群体在固体支持物上提供。在这种情况下,使用靶结合部分的方法可以类似于使用肽阵列的方法。例如,肽微阵列(也称为肽芯片或肽表位微阵列)是在固体表面,例如,玻璃或塑料芯片上显示的肽的集合。肽微阵列的测定原理类似于elisa方案。肽(例如,数以万计的多份拷贝)可以与具有显微镜载玻片大小和形状的玻璃芯片的表面连接。这种肽芯片可以直接与多种不同的生物样品温育,如纯化的酶、抗体、患者或动物血清或细胞裂解物,然后通过标记依赖的方式进行检测,例如,通过靶向结合蛋白质或修饰底物的一抗。在几个洗涤步骤后,可以应用具有所需特异性的二抗(例如,抗igg人/小鼠或抗磷酸酪氨酸或抗myc)。二抗可以通过荧光标记进行标记,该荧光标记可以被荧光扫描仪检测。可以使用的其他标记依赖的检测方法包括,但不限于,化学发光、比色或放射自显影。在一些情况下,靶结合部分的群体被固定在固体支持物上。固体支持物可以具有至少约5、至少约6、至少约7、至少约8、至少约9、至少约10、至少约20、至少约30、至少约40、至少约50、至少约60、至少约70、至少约80、至少约90、至少约100、至少约103、至少约104、至少约105或至少约106、至少约107、至少约108、至少约109、至少约1010、至少约1011、至少约1012、至少约1013、至少约1014、至少约1015、至少约1016、至少约1017、至少约1018、至少约1019、至少约1020或更多个离散区。在一些情况下,每个离散区具有来自固定在其上的群体的不同靶结合部分。在一些情况下,来自群体的不同靶结合部分包括相同的结合区。在一些情况下,来自群体的不同靶结合部分包括相同的肽和/或类肽序列。在一些情况下,每个离散区具有该不同靶结合部分的两个或更多个拷贝。该方法可以还包括去除混合物中未结合的抗体。例如,去除可以包括用缓冲液洗涤固体支持物的表面。该方法可以还包括定量结合在每个离散区处的抗体的量。定量可以包括检测荧光信号、电化学信号、化学发光信号、生色信号或其组合。本文中可以使用各种方法来定量结合抗体的量,例如,通过具有可检测标记的抗体结合剂。抗体结合剂可以是多核苷酸、多肽(例如,蛋白质、酶和糖蛋白)、适体、拟肽或小分子(例如,糖和脂质)。可检测标记可以是光学标记。在一些情况下,光学标记可以选自小分子染料、荧光分子或蛋白质、量子点、比色试剂、生色分子或蛋白质、拉曼标记、发色团及其任何组合。在一些情况下,可检测标记或光学标记可以是荧光分子或蛋白质。可检测标签可以产生信号签名。信号签名的类型可以变化。例如,可检测标记可以包括光学分子或标记,从而产生光学签名。光学签名的示例可以包括,但不限于,荧光色(例如,一个或多个激发光谱下的发射光谱)、可见光、无色或无光、颜色(例如,由可见光波长定义的颜色)的签名、拉曼签名及其任何组合。在一些实施方案中,光学签名可以包括一种或多种荧光色、一种或多种可见光、一种或多种无色或无光、一种或多种颜色的签名、一种或多种拉曼签名或其任何组合。例如,光学标记可以包括多个(例如,至少2个或更多个)荧光色(例如,荧光染料)。光学签名可以通过光学成像或光谱学检测。

在一些情况下,该方法还包括从受试者获得血液样品。在一些情况下,该方法还包括从血液样品制备血清样品,其中血清样品包括抗体混合物。在一些情况下,受试者包括患病受试者和/或健康受试者。在一些情况下,该方法还包括从患病受试者获得第一血清样品并从健康受试者获得第二血清样品,其中定量包括定量在第一固体支持物上的第一血清样品中和在第二固体支持物上的第二血清样品中结合在每个离散区处的抗体的量。在一些情况下,该方法还包括对结合在第一固体支持物上的每个离散区处的抗体的量和结合在第二固体支持物上的每个离散区处的抗体的量进行比较。在一些情况下,该方法还包括选择离散区的一组肽,这些肽在结合在第一固体支持物和第二固体支持物上的抗体的量上具有差异。

在溶液中鉴定

在一些应用中,溶液中提供了靶结合部分的群体。在一些情况下,靶结合部分群体中的每一个与编码部分连接。编码部分可以是多核苷酸。例如,多核苷酸是脱氧核糖核酸(dna)、核糖核酸(rna)或其组合。在一些情况下,多核苷酸是单链dna、单链rna、双链dna、双链rna或双链dna-rna杂种。在一些情况下,编码部分包括鉴定靶结合部分的序列的核酸序列。在一些情况下,该核酸序列编码两个或更多个靶结合部分的肽序列。在一些情况下,靶结合部分的群体包括至少约100、至少约103、至少约104、至少约105、至少约106、至少约107、至少约108、至少约109、至少约1010、至少约1011、至少约1012、至少约1013、至少约1014、至少约1015、至少约1016、至少约1017、至少约1018、至少约1019、至少约1020或更多个不同类型的靶结合部分。如本文所用,来自群体的每种类型的靶结合部分包括相同(或唯一)的靶结合区。在一些情况下,来自群体的每种类型的靶结合部分包括相同的肽和/或类肽序列。在一些情况下,编码部分对于群体中的每种类型的靶结合部分是唯一的。在一些情况下,该方法还包括捕获、富集或分离群体中的靶结合部分的抗体结合级分。如本文所用,“捕获”、“富集”、“分离”或等同词语可以互换使用,并且可以指从其余群体中纯化出级分。可以使用各种方法来捕获、富集或分离抗体或与抗体结合的靶结合部分,例如,使用免疫球蛋白结合蛋白质,如蛋白a。除蛋白a外,其他免疫球蛋白结合蛋白质,如蛋白g、蛋白a/g和蛋白l可以用于纯化、固定或检测免疫球蛋白。在一些情况下,该方法还包括扩增靶结合部分的抗体结合级分的编码部分。在一些情况下,该方法还包括定量抗体结合级分的编码部分或编码部分的拷贝。在一些情况下,定量包括对靶结合部分的抗体结合级分的编码部分或编码部分的拷贝进行测序。在一些情况下,该方法还包括从受试者获得血液样品。在一些情况下,该方法还包括从血液样品制备血清样品,其中血清样品包括抗体混合物。在一些情况下,受试者包括患病受试者和/或健康受试者。在一些情况下,该方法还包括从患病受试者获得第一血清样品并从健康受试者获得第二血清样品,其中定量包括定量在第一血清样品中靶结合部分的抗体结合级分的量和在第二血清样品中靶结合部分的抗体结合级分的量。在一些情况下,该方法还包括对第一血清样品中的靶结合部分的抗体结合级分的量和第二血清样品中的抗体结合级分的量进行比较。可以观察到第一血清样品和第二血清样品中的靶结合部分的抗体结合级分的量之间的差异。在一些情况下,该方法还包括选择一组肽,其中所述组中的每个肽在第一血清样品和第二血清样品中的靶结合部分的抗体结合级分的量上具有差异。在一些情况下,在第一血清样品中而不是在第二血清样品中大量鉴定到所述组中的每个肽,或者在第二血清样品中而不是在第一血清样品中大量鉴定到所述组中的每个肽。在一些情况下,该方法还包括通过rna显示来制备各自与编码部分连接的靶结合部分群体。并且在这种情况下,靶结合部分群体中的每一个还包括嘌呤霉素部分或其变体。

在一些实施方案中,第一肽和/或类肽序列的序列与第二肽和/或类肽序列的序列至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或100%相同。在一些情况下,第一肽序列、第二肽序列和间隔区通过肽键连接。在一些情况下,第一肽和/或类肽序列、第二肽和/或类肽序列以及间隔区通过非肽键连接,例如,以支链的形式。在一些情况下,靶结合部分包括两个或更多个靶结合单元。在一些情况下,第一结合区和/或第二结合区的长度为4至30个残基、5至20个残基、6至10个残基、8至11个残基或10至20个残基。在一些情况下,第一肽/类肽序列和/或第二肽/类肽序列的长度为至少5个残基。在一些情况下,间隔区包括聚合物。在一些情况下,间隔区包括预先设计的氨基酸序列。在一些情况下,每个靶结合部分的间隔区包括相同的氨基酸序列。间隔区可以是多肽、多核苷酸或聚乙二醇。在一些情况下,间隔区包括折叠的多肽、二级结构和/或三级结构。在一些情况下,折叠的多肽包括卷曲螺旋结构或β片层。在一些情况下,卷曲螺旋结构由两条分离的肽链形成,其中两条分离的肽链中的每条折叠成α-螺旋体。在一些情况下,卷曲螺旋结构由单个肽链形成,该肽链包括折叠成α-螺旋体的至少两个区域。在一些情况下,单个肽链包括折叠成α-螺旋体的四个区域。在一些情况下,卷曲螺旋结构由第一肽链、第二肽链和第三肽链形成,其中第二肽链与第一肽链的第一部分相互作用,并且第三肽链与第一肽链的第二部分相互作用。在一些情况下,第二肽链和第三肽链连接至双链多核苷酸的相对端。在一些情况下,间隔区包括双链脱氧核糖核酸。在一些情况下,抗体混合物是单克隆抗体的混合物、多克隆抗体的混合物或其组合。在一些情况下,抗体混合物包括生物标志物。

抗体概况分析

本文提供的靶结合单元或部分可以用于对样品中的抗体进行概况分析。例如,靶结合单元或部分可以用于区分患病或健康受试者的血清抗体库。

在一些实施方案中,本文提供了一种用于对来自受试者的抗体混合物进行概况分析的方法,该方法包括:使抗体混合物与具有至少10个离散区的阵列接触,其中每个离散区具有唯一类型的靶结合部分,其中每个唯一类型的靶结合部分均包括第一结合区和第二结合区,其中第一结合区和第二结合区被间隔区隔开并且间隔一定距离,使得第一结合区和第二结合区同时结合至混合物中的单个抗体分子。在一些情况下,该方法还包括去除混合物中抗体的未结合级分。在一些情况下,该方法还包括检测阵列上混合物中抗体的结合级分,其中在其上结合有抗体的每个离散区处观察到信号,从而在阵列上产生信号模式。在一些情况下,该方法还包括鉴定受试者的疾病。在一些情况下,该疾病是自身免疫疾病、癌症或传染病。

在一些实施方案中,每个唯一类型的靶结合部分还包括具有第一结合区的第一肽和/或类肽序列和具有第二结合区的第二肽和/或类肽序列。在一些情况下,第一结合区和第二结合区具有相同的序列。在一些情况下,第一结合区和第二结合区具有被单个分子识别的相同结构。在一些情况下,第一肽和/或类肽序列的序列与第二肽和/或类肽序列的序列至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或100%相同。在一些情况下,第一肽序列、第二肽序列和间隔区通过肽键连接。在一些其他情况下,第一肽和/或类肽序列、第二肽和/或类肽序列,以及间隔区通过非肽键连接。在一些情况下,靶结合部分包括两个或更多个结合区。在一些情况下,第一肽和/或类肽序列,或第二肽和/或类肽序列的长度为至少5个残基。在一些情况下,间隔区包括聚合物。在一些情况下,间隔区包括相同的氨基酸序列。间隔区可以是多肽、多核苷酸或聚乙二醇。在一些情况下,间隔区可以不具有结构。在一些其他情况下,间隔区包括折叠的多肽、二级结构和/或三级结构。折叠的多肽可以包括卷曲螺旋结构或β片层。在一些情况下,卷曲螺旋结构由两条分离的肽链形成,其中两条分离的肽链中的每条折叠成α-螺旋体。在一些情况下,卷曲螺旋结构由单个肽链形成,该肽链包括折叠成α-螺旋体的至少两个区域。在一些情况下,单个肽链包括折叠成α-螺旋体的四个区域。在一些情况下,卷曲螺旋结构由第一肽链、第二肽链和第三肽链形成,其中第二肽链与第一肽链的第一部分相互作用,并且第三肽链与第一肽链的第二部分相互作用。在一些情况下,第二肽链和第三肽链连接至双链多核苷酸的相对端。在一些情况下,间隔区包括双链脱氧核糖核酸。抗体混合物可以是任何类型的抗体。例如,抗体混合物是单克隆抗体的混合物、多克隆抗体的混合物或其组合。在一些情况下,抗体混合物包括生物标志物。

附接至固体支持物

可以使用各种方法将靶结合部分附接于固体支持物。例如,在各种实施方案中,靶结合部分可以通过接头附接至固体支持物。接头可以由靶结合部分上的第一反应基团和固定在固体支持物上的第二反应基团形成。在一些情况下,靶结合部分的反应基团在支架上。在一些情况下,支架是多核苷酸,并且靶结合部分的反应基团与该多核苷酸缀合。在一些情况下,支架是多肽,并且靶结合部分的反应基团与该多肽缀合。可以使用各种方法将反应基团缀合至多核苷酸或多肽。

可以使用各种合适的反应基团。此类合适的反应基团可以包括但不限于,例如,氨基、羟基、羧基、羧酸盐、醛、酯、醚(例如,硫醚)、酰胺、胺、腈、乙烯基、硫化物、磺酰基、磷酰基、或类似的化学反应基团。其他合适的反应基团包括,但不限于,马来酰亚胺、n-羟基琥珀酰亚胺、磺基-n-羟基琥珀酰亚胺、次氮基三乙酸、活化的羟基、卤代乙酰基(例如,溴乙酰基、碘乙酰基)、活化的羧基、酰肼、环氧树脂、氮丙啶、磺酰氯、三氟甲基二氮丙啶、吡啶二硫化物、n-酰基咪唑、咪唑氨基甲酸酯、乙烯基砜、琥珀酰亚胺基碳酸酯、芳香叠氮化物、酸酐、重氮基醋酸酯、二苯甲酮、异硫氰酸酯、异氰酸酯、酰亚胺酯、氟苯。

在一些实施方案中,反应基团之一是亲电部分,并且第二反应基团是亲核部分。亲核部分或亲电部分可以附接至靶结合部分。然后反应基团可以用于将靶结合部分与固体支持物偶联的反应中。合适的亲电部分可以用于与亲核部分反应以形成共价键。这种亲电部分包括,但不限于,例如,羰基、磺酰基、醛基、酮基、受阻酯基、硫酯基、稳定的亚胺基、环氧基、氮丙啶等。

亲核试剂和亲电试剂之间的反应产物可以掺入最初存在于例如亲核部分中的原子。在一些实施方案中,亲电试剂是具有亲核部分的醛或酮,包括反应产物,如肟、酰胺、腙、还原的腙、糖腙(carbohydrazone)、硫代糖腙、磺酰腙(sufonylhydrazone)、缩氨基脲、硫代缩氨基脲或类似官能团,取决于所使用的亲核部分以及与亲核部分反应的亲电部分(例如,醛、酮等)。与羧酸的键合可以称为碳酰肼或异羟肟酸。与磺酸的键合可以称为磺酰肼或n-磺酰基羟胺。所得的键合随后可以通过化学还原来稳定。

在一些实施方案中,反应基团之一是亲电试剂,例如,醛或酮,并且第二反应基团是亲核部分。亲核部分或亲电部分都可以附接至靶结合部分;然后将剩余的反应基团附接至固体支持物。可以与醛和酮反应形成共价键的合适亲核部分包括,例如,脂族或芳族胺,如乙二胺。在其他实施方案中,反应基团是—nr1—nh2(酰肼)、—nr1(c═o)nr2nh2(氨基脲)、—nr1(c═s)nr2nh2(硫代氨基脲)、—(c═o)nr1nh2(羰酰肼)、—(c═s)nr1nh2(硫代羰酰肼)、—(so2)nr1nh2(磺酰肼)、—nr1nr2(c═o)nr3nh2(卡巴肼)、—nr1nr2(c═s)nr3nh2(硫代卡巴肼)或—o—nh2(羟胺),其中每个r1、r2和r3为独立地h,或具有1-6个碳原子的烷基,优选为h。在一些情况下,反应基团为酰肼、羟胺、碳酰肼或磺酰肼。

本文使用的反应基团化学法不限于上述列举的化学法。举例来说,在其他实施方案中,第一和第二反应基团之间的反应可以通过亲偶极体反应进行。例如,第一反应基团可以是叠氮化物,并且第二反应基团可以是炔烃。或者,第一反应基团可以是炔烃,并且第二反应基团可以是叠氮化物。叠氮化物和炔烃官能团的独特反应性可以使它们成为将多肽选择性偶联至阵列和其他固体支持物的有用反应物。有机叠氮化物,特别是脂族叠氮化物和炔烃可以在常见的反应化学条件下稳定。因为huisgen环加成反应涉及选择性环加成反应(参见,例如,huisgen,1,3-dipolarcycloadditionchemistry,(ed.padwa,a.,1984),p.1-176),而不是亲核取代,因此带有叠氮化物和含炔烃的侧链的非天然编码氨基酸的掺入可以允许所得多肽以极高的选择性被修饰。叠氮化物和炔烃官能团均可以对天然存在的多肽中发现的20种常见氨基酸呈惰性。然而,当紧密接近时,可以显露出叠氮化物和炔烃基团的“弹簧加载”性质,并且它们可以通过huisgen[3+2]环加成反应选择地且有效地反应,生成相应的三唑。参见,例如,chin等人,science301:964-7(2003);wang等人,j.am.chem.soc.,125,3192-3193(2003);chin等人,j.am.chem.soc.,124:9026-9027(2002)。涉及含叠氮化物或炔烃的多肽的环加成反应可以在室温、水性条件下,通过在催化量的还原剂(用于将cu(ii)原位还原为cu(i))的存在下添加cu(ii)(例如,以催化量的cuso4的形式)进行。参见,例如,wang等人,j.am.chem.soc.125,3192-3193(2003);tornoe等人,j.org.chem.67:3057-3064(2002);rostovtsev,angew.chem.int.ed.41:2596-2599(2002)。还原剂包括,但不限于,抗坏血酸盐、金属铜、奎宁、对苯二酚、维生素k、谷胱甘肽、半胱氨酸、fe2+、co2+和应用电势。

其他可以使用的反应化学法包括,但不限于,staudinger连接和烯烃复分解化学法(参见,例如,mahal等人,(1997)science276:1125-1128)。

在一些实施方案中,靶结合部分和固体支持物之间的附接是非共价附接。例如,具有合适酸性基团的靶结合部分将与带有羟基或其他带负电荷基团的固体支持物形成强的缔合。在该体系的其他变体中,彼此具有强亲和力的其他类型的部分可以掺入靶结合部分和固体支持物上的反应基团中。例如,靶结合部分可以通过合适的反应基团与生物素偶联,而固体支持物可以用亲和素包被,导致靶结合部分和固体支持物之间的强非共价结合。

可以使用替代的非共价偶联体系。

适用于本公开内容的固体支持物(例如,阵列)不是限制性的。本公开内容无意限于任何特定类型的固体支持材料或阵列构型。

固体支持物可以是平的或平面的,或可以具有基本不同的构型。例如,固体支持物可以以颗粒、珠、线、沉淀、凝胶、溶胶-凝胶、片、管、球、容器、毛细管、垫、切片、薄膜、板、浸量尺、载玻片等形式存在。磁珠或颗粒,如磁性乳胶珠和氧化铁颗粒,是可以在本公开内容的方法中使用的固体基质的示例。磁性颗粒在例如美国专利号4,672,040中进行了描述,并且可以从例如perseptivebiosystems,inc.(framinghammass.)、cibacorning(medfieldmass.)、bangslaboratories(carmelind.)和bioquest,inc.(atkinsonn.h.)购买。选择固体支持物以使信噪比最大化,主要是使背景结合最小化,以便于洗涤和降低成本。此外,某些固体支持物如珠,可以容易地用于常规的流体处理系统,如微孔板。

固体支持物的示例包括玻璃或其他陶瓷、塑料、聚合物、金属、准金属、合金、复合材料、有机物等。例如,固体支持物可以包括选自以下的材料:硅、二氧化硅、石英、玻璃、可控孔玻璃、碳、氧化铝、二氧化钛、氧化钽、锗、氮化硅、沸石和砷化镓。多种金属,如金、铂、铝、铜、钛及其合金,也可以用作固体支持物。此外,许多陶瓷和聚合物也可以用作固体支持物。可以用作固体支持物的聚合物包括但不限于以下:聚苯乙烯;聚四氟乙烯(ptfe);聚偏二氟乙烯;聚碳酸酯;聚甲基丙烯酸甲酯;聚乙烯基乙烯;聚乙烯亚胺;聚醚醚酮;聚甲醛(pom);聚乙烯基苯酚;聚丙交酯;聚甲基丙烯酰亚胺(pmi);polyatkenesulfone(pas);聚丙烯;聚乙烯;聚甲基丙烯酸羟乙酯(hema);聚二甲基硅氧烷;聚丙烯酰胺;聚酰亚胺和嵌段共聚物。在一些情况下,用于阵列的基质包括硅、二氧化硅、玻璃和聚合物。固体支持物可以由单一材料(例如,玻璃)、材料混合物(例如,共聚物)或多层不同材料(例如,涂有小分子单层的金属、涂有bsa的玻璃等)组成。

固体支持物的构型可以是任何合适的形式,例如,可以包括珠、球、颗粒、粒斑、凝胶、溶胶-凝胶、自组装单层(sam)或表面(可以是平的,或可以具有形状特征)。术语“固体支持物”包括半固体支持物。固体支持物的表面可以是平面的、基本平面的或非平面的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀的特性。可以以孔、凹陷或其他容器、器皿、特征或位置的形式配置固体支持物。可以将多个固体支持物配置为在多个位置的阵列,可寻址以用于机器人递送试剂或者可通过检测手段寻址,包括通过激光或其他照射和ccd的扫描、共聚焦或偏转光收集。

例如,在一些实施方案中,固体支持物可以是载玻片的形式。载玻片可以用任何材料制成。在一些情况下,载玻片可以包括塑料或玻璃基体。载玻片可以用于支持化合物(例如,多肽)的固相沉积,并可以制备成包含非常大量的可寻址位置,例如,数千个位置。将化合物放在载玻片上进行分析的过程可以称为“打印”。载玻片系统可以利用荧光染料标记来检测相互作用,并且可以使用自动化机械来创建,该自动化机械能够沉积非常小的斑点并以高精度将它们放置在彼此非常接近的位置。例如,斑点直径可以在100微米范围内,并且可以在标准的1″×3″玻璃载玻片上放置10,000-30,000个斑点。载玻片阵列可能倾向于具有大量且非常高密度的可寻址坐标。

在一些实施方案中,载玻片或其他固体支持物可以包括自组装单层(sam),其可由于sam分子在表面界面的亲和相互作用和/或共价键合而形成。sam的组装方式可以类似于肥皂泡或细胞膜的双层结构,但在固体界面形成单分子层。sam可以由具有与末端基团连接的界面结合基团的分子组装而成。sam可以是分子的集合,如烷烃硫醇、硅烷、脂肪酸或膦酸酯。sam组装的驱动力可以是界面结合基团与表面基团的亲和相互作用。通过末端基团与外部环境的相互作用,可以进一步增强分子在表面的极化取向。驱动组装的相互作用可以是,例如,疏水相互作用、亲水相互作用、离子吸引、螯合等。

在一些实施方案中,固体支持物为珠(与颗粒同义)的形式,例如,在液相阵列系统(有时称为珠阵列)中使用。这些系统可以采用微孔板(有时称为“微量滴定盘”),它具有任何数量的容纳液体体积的孔。微孔配置的示例包括但不限于96孔板、384孔板和1536孔板。每个孔可以容纳并行分析中正在使用的特定组件,例如,珠。珠可以由任何基质材料制成,包括生物的、非生物的、有机的、无机的、聚合物、金属或任何这些的组合。珠的表面可以被化学修饰并经受任何类型的处理或涂层,例如,含有允许与靶结合部分发生结合相互作用的反应基团的涂层。

在一些实施方案中,珠可以以促进其快速分离和/或纯化的方式生产。例如,磁珠可以通过施加磁场来操纵,以将磁珠与平板孔内的液相迅速隔离。

在一些实施方案中,固体支持物包括溶胶-凝胶或由溶胶-凝胶组成。溶胶-凝胶技术是众所周知的,并且在例如《柯克-奥斯莫化工大全》(第三版和第四版,特别是第20卷),martingrayso执行编辑,wiley-interscience,johnwileyandsons,ny(例如,第22卷)及其中引用的参考文献中都有描述。溶胶可以是胶体颗粒(通常是纳米级元件)在液体如水或溶剂中的分散体。溶胶颗粒可以足够小以保持悬浮在液体中,例如,通过布朗运动。凝胶可以是具有亚微米尺寸的互连孔的粘弹性体。通过制备溶胶、溶胶凝胶化和除去悬浮溶胶的液体,溶胶-凝胶可以用于制备玻璃、陶瓷、复合材料、塑料等。该过程可以用于许多相对低温的过程中,以用于构造纤维、薄膜、气凝胶等(在本公开内容中,任何一种都可以是固体支持物)。在一些实施方案中,进行胶体颗粒分散体的凝胶化。在一些实施方案中,进行醇盐或金属盐前体的水解和缩聚。在一些实施方案中,进行醇盐前体的水解和缩聚,然后在室温下老化和干燥。

可以制备固相支持物的表面以产生合适的反应基团,可以将接头附接至其上,或者可以直接附接靶结合部分。通过机械、物理、电或化学方法将如上所列的反应基团放置在基质上的技术(参见,例如,美国专利号4,681,870)可以使用。

除了使靶结合部分和固体支持物上的化学部分直接反应之外,还可以使用其他将多肽或多核苷酸连接至本公开内容的阵列的牵系机制。此类牵系方法包括:化学牵系、生物素介导结合、与固体支持物基体的交联(例如,uv或荧光激活交联)以及使用“可溶性”基体(如peg),该基体可以通过etoh或其他溶剂沉淀以回收结合材料(也参见wentworth,p.,1999,trendsinbiotechnolgy17:448452)。

测序

如本文所述,在一些实施方案中,在溶液中提供靶结合部分用于肽鉴定。在一些情况下,靶结合部分与编码部分连接,其中编码部分鉴定或对应于靶结合部分。编码部分可以鉴定或对应于与靶结合部分相连的肽序列。

本文提供的肽鉴定方法包括使抗体的混合物与多个靶结合部分接触,其中每个靶结合部分包括第一肽和第二肽,其中第一肽和第二肽由间隔区隔开,使得第一肽和第二肽结合至单个抗体分子。在一些实施方案中,多个靶结合部分中的每个靶结合部分可以与编码部分连接。接触后,可以捕获与抗体结合的靶结合部分。存在多种方法来捕获抗体结合的靶结合部分,例如,使用免疫球蛋白结合蛋白。

与被捕获的靶结合部分连接的编码部分可以被扩增并进行测序。

在本公开内容中可以使用各种测序方法。在一些实施方案中,本文描述的方法采用下一代测序技术(ngs),其中克隆扩增的dna模板或单个dna分子在流动池中以大规模并行方式测序(例如,如在volkerding等人clinchem55:641-658[2009];metzkermnaturerev11:31-46[2010]中所述)。除了高通量序列信息外,ngs还可以提供数字定量信息,因为每个序列读取都是可计数的“序列标签”,代表单个克隆dna模板或单个dna分子。这种定量使ngs扩展了对游离dna分子进行计数的数字pcr概念(fan等人,procnatlacadsciusa105:16266-16271[2008];chiu等人,procnatlacadsciusa2008;105:20458-20463[2008])。ngs的测序技术包括焦磷酸测序、可逆染料终止子合成测序、寡核苷酸探针连接测序和实时测序。

一些测序技术可商购获得,如来自affymetrixinc.(sunnyvale,calif.)的杂交测序平台和来自454lifesciences(bradford,conn.)、illumina/solexa(hayward,calif.)和helicosbiosciences(cambridge,mass.)的合成测序平台,以及来自appliedbiosystems(fostercity,calif.)的连接测序平台,如下所述。除了使用helicosbiosciences的合成测序进行的单分子测序外,本公开内容的方法还包括其他单分子测序技术,并且包括pacificbiosciences的smrttm技术、iontorrenttm技术和纳米孔测序(例如,oxfordnanoporetechnologies的)。尽管自动sanger方法被认为是“第一代”技术,但本公开内容的方法也可以采用sanger测序,包括自动sanger测序。本公开内容的方法还包括其他测序方法,包括使用正在发展的核酸成像技术,例如,原子力显微术(afm)或透射电子显微术(tem)。

在一些实施方案中,该方法采用illumina的合成测序和基于可逆终止子的测序化学法对数百万个dna片段进行大规模并行测序(例如,如bentley等人,nature6:53-59[2009]中所述)。illumina的测序技术依赖于模板dna(例如,编码部分或其部分)与平面、光学透明表面的附接,该表面上结合有寡核苷酸锚。模板dna可以被末端修复,以生成5'-磷酸化的钝端,并且klenow片段的聚合酶活性可以用于向钝端的磷酸化dna模板的3'端添加单个a碱基。该添加可以制备用于与寡核苷酸衔接子连接的dna模板,该寡核苷酸衔接子在其3'端具有单个t碱基的突出端以提高连接效率。衔接子寡核苷酸可以与流动池的锚互补。在有限稀释条件下,可以将衔接子修饰的单链模板dna添加到流动池中,并通过与锚杂交而固定。可以延伸所附接的dna模板并进行桥扩增,以创建具有数亿个簇的超高密度测序流动池,每个簇含有约1,000个相同模板的拷贝。在一些实施方案中,在对编码部分或其部分进行簇扩增之前,使用核酸扩增(例如pcr)进行扩增。或者,可以使用无扩增的文库制备物,并且可以仅使用簇扩增来富集模板dna(例如,编码部分或其部分)(kozarewa等人,naturemethods6:291-295[2009])。模板可以使用四色dna合成测序技术进行测序,该技术采用具有可移除荧光染料的可逆终止子。使用激光激发和全内反射光学器件可以实现高灵敏度的荧光鉴定。测序读取可以使用任何可用的数据分析管线软件来分析。第一次读取完成后,可以原位再生模板,以从片段的相对端进行第二次读取。因此,可以根据该方法使用dna模板的单端或双端测序。

编码部分的序列可以用于鉴定靶结合部分的肽序列的序列同一性。在一些实施方案中,编码部分是编码肽序列的核酸序列,并且在这种情况下,可以通过将核酸序列翻译为氨基酸序列来获得肽序列。在一些实施方案中,编码部分起条形码的作用,但可以不编码靶结合部分的肽,并且在这种情况下,每个唯一的肽序列是预先设计的,并被预先分配唯一的核酸序列。例如,可以制备靶结合部分的参考文库,每个靶结合部分包括唯一的预先设计的肽序列,并且每个靶结合部分可以与已知序列的唯一编码部分连接。在对样品中的编码部分进行测序后,根据参考文库可以将序列用于鉴定肽序列。

受试者与疾病

本文提供的组合物和方法可以用于鉴定或定量来自患有疾病/病况的受试者的样品中的生物标志物。生物标志物可以是抗体或其片段。在一些实施方案中,血液样品从患有疾病的受试者获得。在一些实施方案中,血清样品从患有疾病的受试者获得。在一些实施方案中,抗体混合物从患有疾病的受试者获得。在一些实施方案中,抗体混合物从作为对照的健康受试者获得。在一些实施方案中,该疾病是癌症。在一些其他实施方案中,该疾病是自身免疫疾病。在一些实施方案中,该疾病是传染病。

本文使用的术语“受试者”可以指个体、宿主或患者。在一些实施方案中,受试者是人。在一些实施方案中,受试者是哺乳动物。在一些其他实施方案中,受试者可以是任何动物受试者,包括实验动物、家畜和家庭宠物。受试者可以被诊断为或疑似为疾病的高危者。在一些情况下,受试者不一定被诊断为或疑似为疾病的高危者。

受试者可以是,例如,哺乳动物、人、孕妇、老年人、成人、青春期少年、青春期前少年、儿童、幼儿、婴儿、新生儿或不足四周的新生儿。受试者可以是患者。在一些情况下,受试者可以是人。在一些情况下,受试者可以是儿童(即青春期年龄以下的年轻人)。在一些情况下,受试者可以是婴儿。在一些情况下,受试者可以是配方奶喂养的婴儿。在一些情况下,受试者可以是参加临床研究的个体。在一些情况下,受试者可以是实验动物,例如,哺乳动物或啮齿动物。在一些情况下,受试者可以是肥胖或超重受试者。

癌症可以包括实体瘤和恶性血液病。癌症包括但不限于妇科癌、卵巢癌、输卵管癌、腹膜癌、乳腺癌、宫颈癌、子宫内膜癌、前列腺癌、睾丸癌、胰腺癌、食道癌、头颈癌、胃癌、膀胱癌、肺癌(例如,腺癌、nsclc和sclc)、骨癌(例如,骨肉瘤)、结肠癌、直肠癌、甲状腺癌、脑和中枢神经系统癌、胶质母细胞瘤、神经母细胞瘤、神经内分泌癌、横纹肌癌、角化棘皮瘤、表皮样癌、精原细胞瘤、黑素瘤、肉瘤(例如,脂肉瘤)、膀胱癌、肝癌(例如,肝细胞癌)、肾癌(例如,肾细胞癌)、骨髓疾病(例如,aml、cml、骨髓增生异常综合征和早幼粒细胞白血病)和淋巴疾病(例如,白血病、多发性骨髓瘤、套细胞淋巴瘤、all、cll、b细胞淋巴瘤、t细胞淋巴瘤、霍奇金淋巴瘤、非霍奇金淋巴瘤荷马、毛细胞淋巴瘤)。癌症包括但不限于卵巢癌、乳腺癌、宫颈癌、子宫内膜癌、前列腺癌、睾丸癌、胰腺癌、食道癌、头颈癌、胃癌、膀胱癌、肺癌、骨癌、结肠癌、直肠癌、甲状腺癌、脑和中枢神经系统癌、胶质母细胞瘤、神经母细胞瘤、神经内分泌癌、横纹肌癌、角化棘皮瘤、表皮样癌、精原细胞瘤、黑素瘤、肉瘤、膀胱癌、肝癌、肾癌、骨髓瘤、淋巴瘤及其组合。

此外,本文提供的受试者可能患有包括良性或恶性肿瘤在内的病况(例如,肾上腺、肝脏、肾脏、膀胱、乳腺、胃、卵巢、结直肠、前列腺、胰腺、肺、甲状腺、肝、宫颈、子宫内膜、食道和子宫的癌;肉瘤;胶质母细胞瘤;以及各种头颈部肿瘤);白血病和淋巴恶性肿瘤;其他病症,如神经元、神经胶质、星形细胞、下丘脑和其他腺体、巨噬细胞、上皮、基质和囊胚层的病症;以及炎症性、血管生成性、免疫系统的病症和病原体引起的病症。尽管“受试者”或“患者”优选地是人,但如在此所用的,术语被明确认为包括任何哺乳动物物种。

在一些实施方案中,受试者可以患有肿瘤病况。肿瘤病况可以选自包括,但不限于,肾上腺肿瘤、与aids相关的癌症、腺泡状软组织肉瘤、星形细胞肿瘤、膀胱癌(鳞状细胞癌和移行细胞癌)、骨癌(釉质瘤、动脉瘤性骨囊肿、骨软骨瘤、骨肉瘤)、脑和脊髓癌、转移性脑瘤、乳腺癌、颈动脉体瘤、子宫颈癌、软骨肉瘤、脊索瘤、肾嫌色细胞癌、透明细胞癌、结肠癌、结直肠癌、皮肤良性纤维组织细胞瘤、促结缔组织增生性小圆形细胞瘤、室管膜瘤、尤因氏肿瘤、骨外粘液样软骨肉瘤、骨纤维发生不全、骨纤维异常增殖、胆囊和胆管癌、妊娠滋养细胞疾病、生殖细胞瘤、头颈癌、胰岛细胞肿瘤、卡波济肉瘤、肾癌(肾母细胞瘤、乳头状肾细胞癌)、白血病、脂肪瘤/良性脂肪瘤、脂肪肉瘤/恶性脂肪瘤、肝癌(肝母细胞瘤、肝细胞癌)、淋巴瘤、肺癌(小细胞癌、腺癌、鳞状细胞癌、大细胞癌等)、髓母细胞瘤、黑素瘤、脑膜瘤、多发性内分泌肿瘤、多发性骨髓瘤、骨髓增生异常综合征、神经母细胞瘤、神经内分泌肿瘤、卵巢癌、胰腺癌、乳头状甲状腺癌、甲状旁腺肿瘤、小儿癌、外周神经鞘瘤、嗜铬细胞瘤、垂体瘤、前列腺癌、后部葡萄膜黑素瘤、罕见血液系统疾病、肾脏转移癌、横纹肌瘤、横纹肌肉瘤、肉瘤、皮肤癌、软组织肉瘤、鳞状细胞癌、胃癌、滑膜肉瘤、睾丸癌、胸腺癌、胸腺瘤、甲状腺转移癌和子宫癌(宫颈癌、子宫内膜癌和平滑肌瘤)。

在某些实施方案中,增殖性疾病包括实体瘤,包括但不限于,肾上腺、肝脏、肾脏、膀胱、乳腺、胃、卵巢、宫颈、子宫、食道、结直肠、前列腺、胰腺、肺(小细胞和非小细胞)、甲状腺的癌和肉瘤、胶质母细胞瘤和各种头颈部肿瘤。在其他实施方案中,疾病是小细胞肺癌(sclc)和非小细胞肺癌(nsclc)(例如,鳞状细胞非小细胞肺癌或鳞状细胞小细胞肺癌)。在一个实施方案中,肺癌可以是难治的、复发的或对铂类药物(例如,卡铂、顺铂、奥沙利铂、托泊替康)和/或紫杉烷(例如,多西紫杉醇、紫杉醇、拉罗他赛或卡巴他赛)耐药。

在一些实施方案中,疾病可以是具有神经内分泌特征或表型的肿瘤,包括神经内分泌肿瘤。由分散的内分泌系统引起的真正的或规范的神经内分泌肿瘤(net)相对罕见,每100,000人中有2-5例发生,但侵袭性很高。神经内分泌肿瘤发生在肾脏、泌尿生殖道(膀胱、前列腺、卵巢、子宫颈和子宫内膜)、胃肠道(结肠、胃)、甲状腺(甲状腺髓样癌)和肺部(小细胞肺癌和大细胞神经内分泌癌)。

关于恶性血液病,疾病可以是b细胞淋巴瘤,包括低级/nhl滤泡细胞淋巴瘤(fcc)、套细胞淋巴瘤(mcl)、弥漫性大细胞淋巴瘤(dlcl)、小淋巴细胞(sl)nhl、中级/滤泡nhl、中级弥散性nhl、高级免疫母细胞nhl、高级淋巴母细胞nhl、高级小非裂细胞nhl、巨大肿块nhl、waldenstrom巨球蛋白血症、淋巴浆细胞样淋巴瘤(lpl)、套细胞淋巴瘤(mcl)、滤泡淋巴瘤(fl)、弥漫性大细胞淋巴瘤(dlcl)、伯基特氏淋巴瘤(bl)、艾滋病相关淋巴瘤、单核细胞b细胞淋巴瘤、血管免疫母细胞淋巴结病;小淋巴细胞、滤泡、弥漫性大细胞、弥散性小裂细胞、大细胞免疫母细胞淋巴母细胞瘤;小、非裂、伯基特和非伯基特、滤泡、主要大细胞淋巴瘤;卵泡、主要小裂细胞淋巴瘤;以及滤泡、混合的小裂和大细胞淋巴瘤。

自身免疫疾病的示例包括,但不限于,贲门失弛缓症、阿迪森氏病、成年斯蒂尔氏病、无丙种球蛋白血症、斑秃、淀粉样变性、强直性脊柱炎、抗-gbm/抗-tbm肾炎、抗磷脂综合征、自身免疫性血管性水肿、自身免疫性家族性自主神经功能障碍、自身免疫性脑脊髓炎、自身免疫性肝炎、自身免疫性内耳病(aied)、自身免疫性心肌炎、自身免疫性卵巢炎、自身免疫性睾丸炎、自身免疫性胰腺炎、自身免疫性视网膜病、自身免疫性荨麻疹、轴突和神经元性神经病(aman)、baló病、白塞病、良性粘膜类天疱疮、大疱性类天疱疮、castleman病(cd)、乳糜泻、查加斯病、慢性炎性脱髓鞘性多发性神经病(cidp)、慢性复发性多灶性骨髓炎(crmo)、churg-strauss综合征(css)或嗜伊红细胞性肉芽肿病(egpa)、瘢痕性类天疱疮、cogan综合征、冷凝集素病、先天性心脏传导阻滞、柯萨奇心肌炎、crest综合征、克罗恩病、疱疹性皮炎、皮肌炎、德维克氏病(视神经脊髓炎)、盘状狼疮、dressler综合征、子宫内膜异位、嗜酸细胞性食管炎(eoe)、嗜酸细胞性筋膜炎、结节性红斑、原发性混合性冷球蛋白血症、伊文氏综合征、纤维肌痛、纤维化肺泡炎、巨细胞动脉炎(颞动脉炎)、巨细胞心肌炎、肾小球肾炎、goodpasture综合征、肉芽肿伴多血管炎、graves病、guillain-barre综合征、桥本甲状腺炎、溶血性贫血、henoch-schonlein紫癜(hsp)、妊娠疱疹或妊娠性类天疱疮(pg)、化脓性汗腺炎(hs)(反常性痤疮)、低丙种球蛋白血症、iga肾病、igg4相关性硬化病、免疫性血小板减少性紫癜(itp)、包涵体肌炎(ibm)、间质性膀胱炎(ic)、青少年关节炎、青少年糖尿病(1型糖尿病)、青少年肌炎(jm)、川崎病、lambert-eaton综合征、白细胞破坏性脉管炎、扁平苔藓、硬化性苔藓、木样结膜炎、线性iga病(lad)、狼疮、慢性莱姆病、美尼尔病、显微镜下多血管炎(mpa)、混合结缔组织病(mctd)、蚕蚀性角膜溃疡、mucha-habermann病、多灶性运动神经病(mmn)或mmncb、多发性硬化症、重症肌无力、肌炎、嗜睡症、新生儿狼疮、视神经脊髓炎、中性粒细胞减少症、眼瘢痕性天疱疮、视神经炎、复发性风湿病(pr)、pandas、副肿瘤性小脑变性(pcd)、阵发性睡眠性血红蛋白尿症(pnh)、parry-romberg综合征、睫状体平坦部炎(周边葡萄膜炎)、parsonnage-turner综合征、天疱疮、周围神经病、静脉周围性脑脊髓炎、恶性贫血(pa)、poems综合征、结节性多发性动脉炎、多腺综合征i型、多腺综合征ii型、多腺综合征iii型、风湿性多肌痛、多发性肌炎、心肌梗死后综合征、心包切开术后综合征、原发性胆汁性肝硬化、原发性硬化性胆管炎、孕酮性皮炎、银屑病、银屑病关节炎、纯红细胞再生障碍(prca)、坏疽性脓皮病、雷诺现象、反应性关节炎、反射性交感神经营养不良、复发性多发性软骨炎、不宁腿综合征(rls)、腹膜后纤维化、风湿热、类风湿性关节炎、结节病、施密特综合征、巩膜炎、硬皮病、干燥综合征、精子和睾丸自身免疫、僵人综合征(sps)、亚急性细菌性心内膜炎(sbe)、susac综合征、交感性眼炎(so)、takayasu动脉炎、颞动脉炎/巨细胞性动脉炎、血小板减少性紫癜(ttp)、tolosa-hunt综合征(ths)、横断性脊髓炎、1型糖尿病、溃疡性结肠炎(uc)、未分化结缔组织病(uctd)、葡萄膜炎、血管炎、白癜风、vogt-koyanagi-harada病和韦格纳肉芽肿病(或肉芽肿伴多血管炎(gpa))。

传染病的示例包括,但不限于,急性弛缓性脊髓炎(afm)、边虫病、炭疽、巴贝西虫病、肉毒中毒、布鲁氏菌病、鼻疽伯克霍尔德菌病(鼻疽病)、类鼻疽伯克霍尔德菌病(类鼻疽)、弯曲杆菌病(弯曲杆菌)、碳青霉菌耐药性感染(cre/crpa)、软下疳、基孔肯雅病毒感染(基孔肯雅)、衣原体、鱼肉毒、艰难梭菌感染、产气荚膜梭菌病(ε毒素)、球孢子菌真菌感染(谷热病)、creutzfeldt-jacob病(传染性海绵状脑病,cjd)、隐孢子虫病(crypto)、环孢子虫病、登革热、白喉、大肠杆菌感染(大肠杆菌)、东部马脑炎(eee)、埃博拉出血热(ebola)、艾利希体症、脑炎(虫媒病毒或副感染)、肠病毒感染(非小儿麻痹症肠道病毒)、肠病毒感染d68(ev-d68)、贾第鞭毛虫病(贾第鞭毛虫)、淋球菌感染(淋病)、腹股沟肉芽肿、流感嗜血杆菌病(b型hib或h型流感)、汉坦病毒肺综合征(hps)、溶血性尿毒症综合征(hus)、甲型肝炎(hepa)、乙型肝炎(hepb)、丙型肝炎(hepc)、丁型肝炎(hepd)、戊型肝炎(hepe)、疱疹、带状疱疹、带状疱疹vzv(带状疱疹)、组织胞浆菌感染(组织胞浆菌病)、人免疫缺陷病毒/艾滋病(hiv/aids)、人乳头瘤病毒(hpv)、流感(flu)、铅中毒、军团病(军团菌病)、麻风病(hansens病)、钩端螺旋体病、李斯特菌病(李斯特菌)、莱姆病、性病淋巴颗粒瘤感染(lvg)、疟疾、麻疹、脑膜炎(病毒脑膜炎)、脑膜炎球菌病(细菌脑膜炎)、中东呼吸系统综合征冠状病毒(mers-cov)、腮腺炎、诺如病毒、麻痹性贝类中毒(麻痹性贝类中毒,鱼肉毒)、虱病(虱子,头虱和体虱)、盆腔炎(pid)、疫咳(百日咳)、鼠疫(腺鼠疫、败血性鼠疫、肺鼠疫)、肺炎球菌病(肺炎)、脊髓灰质炎(小儿麻痹症)、波瓦桑脑炎、鹦鹉热、pthiriasis(蟹;阴虱侵扰)、脓疱疹疾病(小痘、猴痘、牛痘)、q热、狂犬病、蓖麻毒素中毒、立克次体病(洛基山斑疹热)、风疹(德国麻疹)、沙门氏菌肠胃炎(沙门氏菌)、疥疮感染(疥疮)、鲭鱼中毒、严重急性呼吸系统综合征(sars)、志贺氏菌肠胃炎(志贺氏菌)、天花、耐甲氧西林的葡萄球菌感染(mrsa)、葡萄球菌食物中毒(staph食物中毒)、万古霉素中介葡萄球菌感染(visa)、耐万古霉素葡萄球菌感染(vrsa)、a群链球菌疾病(strepa)、b群链球菌疾病(strep-b)、链球菌中毒性休克综合征(stss,tss)、梅毒(原发性、继发性、早期潜伏性、晚期潜伏性或先天性)、破伤风感染(下颌)、毛发病感染(毛发病)、结核病(tb)、肺结核(潜伏性)(ltbi)、土拉菌病(兔热病)、伤寒、斑疹伤寒、阴道病(酵母菌感染)、水痘(鸡痘)、霍乱弧菌病(霍乱)、弧菌病(弧菌)、病毒性出血热(埃博拉、拉萨病毒、马尔堡病毒)、西尼罗河病毒、黄热病、耶尔森氏菌感染(耶尔森氏菌)和寨卡病毒感染(寨卡z)。

试剂盒

本公开内容还涉及用于实施本文所述方法的组合物和试剂盒或试剂系统。

本公开内容的组合物可以在试剂盒中提供,用于肽/类肽鉴定。在溶液中鉴定的情况下,试剂盒还可以包括用于扩增和/或测序的试剂,例如,引物和缓冲剂。在阵列上鉴定的情况下,可以在试剂盒中提供一个或多个阵列。试剂盒中提供的阵列可以包括本文所述的靶结合部分。试剂盒可以包括一个或多个本文所述的靶结合部分。试剂盒可以包括一个或多个多核苷酸条形码化的靶结合部分。试剂盒可以包括一种或多种组分,以供用户制备靶结合部分或多核苷酸条形码化的靶结合部分。试剂盒可以包括靶结合单元。试剂盒还可以包括附加试剂,以供用户使用靶结合部分进行分析物鉴定。试剂盒中的一种或多种试剂可以提供在一个或多个容器中。在一些情况下,可以在混合物中提供一种或多种试剂。

当前公开的组合物可以在用于抗体概况分析的试剂盒中提供。在这种情况下,试剂盒可以包括一组特定的肽序列,这些肽序列已知能够区分来自患者的样品和来自健康受试者的样品。

试剂盒可以包括试剂组合,该试剂组合包括根据本文公开的方法进行测定所需的要素。试剂系统可以以商业包装的形式呈现,在试剂相容性允许的情况下作为组合物或混合物呈现,在测试装置配置中呈现,或作为测试试剂盒呈现。试剂盒可以包括容纳必要试剂的一个或多个容器、装置等的包装组合。试剂盒可以包括关于一种或多种测定的执行的书面说明。本公开内容的试剂盒可以适合于任何配置的测定,并且可以包括用于进行本文所述的各种测定形式中的任一种的组合物。试剂盒可以包括组合物,该组合物包括用于扩增所述编码部分的核酸序列的引物组,以及在适用时用于纯化与抗体结合的靶结合部分的试剂,或用于纯化血液样品的试剂。试剂盒可以包括多个引物组以扩增多个序列。试剂盒可以包括其他试剂和/或信息,以用于在溶液中或阵列上的肽鉴定和/或在样品中的抗体概况分析(例如,缓冲液、核苷酸、说明书)。试剂盒还可以包括多个含有适当缓冲剂和试剂的容器。

附图的详细说明

图1示出了本公开内容中描述的靶结合部分的两个示例性构型。如(a)所示,靶结合部分可以具有支链或构型。如(b)所示,靶结合部分可以具有直链或构型。在两种构型中,靶结合部分均包括一个或多个靶结合单元,或两个或多个结合元件。在构型(a)中,用于连接结合元件的主链是支架。在构型(b)中,支架和结合元件包括在同一链中。两个结合元件被间隔区隔开,使得它们可以同时结合至包括抗体的抗原结合域的单个分子。

图2示出了靶结合单元的两个示例性构型。靶结合单元可以是用于靶结合的最小单元。靶结合单元包括两个结合元件(例如,肽或类肽)。

图3示出了间隔区的四个示例结构。如(a)所示,间隔区是非结构化的肽。如(b)所示,间隔区包括两个折叠成α-螺旋体的肽链,并且两个肽链进一步相互作用以形成卷曲螺旋结构。如(c)所示,间隔区包括两个卷曲螺旋结构,并且在这种情况下,结构化的两个卷曲螺旋由单个肽链的不同区域折叠。如(d)所示,间隔区包括由三条肽链形成的卷曲螺旋结构,该三条肽链包括一条较长的肽链和两条较短的肽链。两条较短的肽链可以进一步连接至双链多核苷酸的两个相对端。

图4示出了具有许多离散区的阵列的示例。每个离散区具有附接于其上的唯一类型的靶结合部分的一个或多个拷贝。例如,靶结合部分的一个或多个拷贝具有靶结合区的相同序列,或具有结合元件的相同序列。在本例中,间隔区是双链多核苷酸。

图5a-图5c示出了通过体外区域化产生多核苷酸条形码化的靶结合部分的示例方案。如图5a所示,编码部分(ivc01-001)可以在液滴中区域化,该液滴具有第一可溶性引物和具有多个第二引物拷贝的珠,用于产生编码部分的克隆拷贝。编码部分可以编码结合元件和可以折叠成α-螺旋体(lz-a)的肽接头。如图5b所示,编码部分的多个克隆拷贝附接于珠。如图5c所示,编码部分的每个克隆拷贝被连接至支架,该支架具有在每个末端连接的α-螺旋体(lz-b)。lz-a和lz-b可以相互作用形成亮氨酸拉链。有关更多细节,请参见实施例6。

图6a-图6b示出了示例结构,其可用于通过裂分-合并合成来产生多核苷酸条形码化的结合元件。如图6a所示,本领域已知的结构可用于产生多核苷酸条形码化的化学文库。例如,dna可以从3'端合成(如箭头所示),并且化学构建块可以从游离nh2基团合成。如图6b所示,在本公开内容中设计的具有两个游离nh2基团的结构可以用于产生具有两个相同结合元件的多核苷酸条形码化的化学文库。这种多核苷酸条形码化的化学文库包括多核苷酸条形码化的靶结合部分的文库。

图7a-图7e示出了产生靶结合部分文库的示例性实验程序(例如,如实施例3中所述的用于产生hop的文库)。

图8a示出了产生靶结合部分文库的示例性实验程序(例如,如示例11中所述的用于产生hop和pehop的文库)。

图8b示出了在图8a所示程序的不同步骤期间产生的产物的实验凝胶图像,并证明可以使用图8a所述的程序制备所需大小(536bp)的核酸模板的文库。核酸模板是可以进一步转录成rna的dna,该rna用于生成pehop的文库。

图9示出了变性聚丙烯酰胺凝胶图像,该图像显示了通过在rna展示的不同步骤中进一步处理d14的dna产物(536bp)以制备rna-肽融合分子而产生的具有所需大小的产物的存在,如实施例11所述。

图10a示出了使用rna显示来产生多核苷酸-肽融合分子的示意图。

图10b示出了多核苷酸条形码化的靶结合部分的示例。dna或rna模板可以连接至刚性间隔区。可以使用本发明中所述的各种间隔区,例如,双链dna或由两条肽链形成的卷曲螺旋。刚性间隔区的两端可以进一步与两个结合元件(例如,肽)连接。结合元件可以由dna或rna模板编码。

图10c示出了具有柔性间隔区的多核苷酸条形码化的靶结合部分的示例,该柔性间隔区可以被进一步操纵以产生刚性间隔区。编码唯一结合元件序列的dna或rna模板可以与编码相同唯一结合元件序列的其他dna或rna模板融合(步骤3*)。在步骤(4)中,使用rna显示,融合的模板可用于产生多核苷酸-肽融合分子(例如,多核苷酸条形码化的靶结合部分)。多核苷酸-肽融合分子包括肽柔性间隔区。肽柔性间隔区可以被操纵成为刚性间隔区,例如,通过添加额外的肽链以与肽柔性间隔区形成卷曲螺旋结构。

实施例

实施例1:靶结合部分的设计

在此,我们描述了一系列制备和使用靶结合部分和/或多核苷酸条形码化的靶结合部分以及其他相关分子结构的方法,以对样品中的分析物(例如,抗体)进行概况分析。为了简化“实施例”部分中的描述,将“pirm”用作“结合元件”的示例,“hop”用作具有至少两个通过间隔区连接的结合元件的靶结合部分的示例,“pehop”用作多核苷酸条形码化的靶结合部分的示例。因此,如“实施例”部分所述,可以将pirm组装成可溶性低聚物,我们称其为同低聚pirm(hop)。在每个hop中,多个pirm(通常是所有pirm)可以结合相同的免疫受体(例如,抗体的抗原结合域)。在一些实施方案中,hop中的2个pirm可以结合相同抗体分子的2个相同fab域。在一些实施方案中,hop中的所有pirm具有相同的结构。当hop与序列反映pirm序列的多核苷酸(例如,dna或rna)稳定缔合时,所得分子称为多核苷酸条形码化的hop(pehop)。

支链(pe)hop与线性(pe)hop

hop可以采用支链构型或线性构型。在支链构型中,存在可溶的支架分子,其包括多个pirm附接位点。在一些实施方案中,支架是高分子量聚合物或树枝状聚合物。在线性构型中,间隔区和pirm可以是一个连续线性聚合物的部分。在pirm和间隔区均为多肽的情况下,连续线性聚合物可以是连续线性多肽。

非折叠的pirm和折叠的pirm

pirm可以是非折叠的。例如,当使用具有随机产生的序列的短(例如,<40-aa)肽作为pirm时,pirm很可能是非折叠的、非结构化的且柔性的。或者,pirm可以被折叠和结构化。例如,抗体域(例如,单链fv或vh域)可以是pirm。通常用于设计亲和试剂的其他蛋白质类型,如darpin、亲和体、亲和素也可以用作pirm。

基于肽的pirm可以含有非天然氨基酸

使用包括rna显示在内的体外翻译系统将非天然氨基酸位点特异性地掺入肽和蛋白质中,可用于制备含有至少一种非天然氨基酸的pirm。

多核苷酸序列的域水平描述

在“实施例”部分,有时在域水平下描述多核苷酸序列。每个域的名称对应于特定的多核苷酸序列。例如,域“a”可以具有5’-tattccc-3’的序列,域“b”可以具有5’-agggac-3’的序列,并且域“c”可以具有5’-gggaaga-3’的序列。在这种情况下,具有由域a、b和c串联而成的序列的多核苷酸可以写为[a|b|c}。符号“[”表示5’端,符号“}”表示3’端,并且符号“|”分隔域名称。星号表示序列互补性。例如,域“b*”是域“b”的反向互补序列。

实施例2:使用rna显示(线性、二聚体)制备单个pehop物种

该实施例示出了如何使用rna显示,用两个拷贝的抗体结合肽序列制备pehop。

步骤a:可以通过标准的dna合成和基因组装来制备编码hop的名为gblock01的dna模板。gblock01将含有t7启动子序列、核糖体结合位点和hop的编码序列(包括氨基酸间隔区和两个基于肽的prim拷贝)。间隔区将具有cc-b序列,其可以与肽cc-a形成卷曲螺旋。gblock01可以商购获得,如以gblock的形式购自integrateddnatechnology。

步骤b:gblock01可以使用常规pcr扩增。此类pcr的产物可以通过运行1%琼脂糖凝胶电泳来检测。

步骤c:pcr产物可以通过agencourtampurexp珠纯化。

步骤d:可以通过使用t7rna聚合酶(如hiscribet7高产量rna合成试剂盒,neb#e2040s)进行体外转录,以合成高产量的mrna转录物。

步骤e:mrna转录物可以通过agencourtampurexp珠进一步纯化。纯化的rna的浓度可以通过260nm的uv吸收获得。

步骤f:为了将嘌呤霉素部分附接至mrna的3'端,可以使用衔接子。可以通过使名为rtl1的修饰寡核苷酸与名为dbco.f.puro的修饰寡核苷酸(序列见表1)反应形成rtl1-dbco.f.puro来形成衔接子。例如,可以以1:1的比例混合100μmrtl1和100μmdbco。缀合反应可以在37℃下进行过夜。

步骤g:rtl1-dbco.f.puro衔接子可以随后通过凝胶萃取法纯化。具体而言,可以将缀合反应产物在含有7m尿素的15%聚丙烯酰胺凝胶上解析,并从凝胶上切下含有缀合rtl1-dbco.f.puro的条带,并在-80℃冷冻20分钟。之后,可以将样品以15,000g离心10分钟。可以取出上清液,并使用微旋转g25柱(ge27-5325-01sigma)进一步纯化。

步骤h:纯化的rtl1-dbco.f.puro可以与上述制备的纯化的mrna转录物在55℃下以3:1的比例混合5分钟,以进行有效退火。

步骤i:在退火反应之后,可以使用t4rna连接酶1(neb#m0204s)在rtl1-dbco.f.puro和mrna转录物之间进行连接反应,在37℃下持续1小时。这种连接的产物可以命名为mrna-rtl1-dbco.f.puro。

步骤j:可以通过agencourtampurexp进一步纯化连接反应,以去除不与mrna转录物杂交的rtl1-dbco.f.puro。纯化的mrna-rtl1-dbco.f.puro的浓度可以从260nm的uv吸收获得。

步骤k:mrna-rtl1-dbco.f.puro可以通过使用purexpress体外蛋白质合成试剂盒(neb#6800)进行体外翻译,以形成mrna-肽缀合物。具体而言,可以将10μl溶液a、7.5μl溶液b、1μlrnaseout重组核糖核酸酶抑制剂(批号1872556,invitrogen)与纯化的mrna-rtl1-dbco.f.puro在37℃下混合2小时。通过将盐加入翻译反应使得mg++的最终浓度为60mm并且k+的最终浓度为600mm,可以促进mrna和新生肽之间的融合。加入盐后,可将反应在-80°冷冻过夜,以进一步促进融合。该翻译的肽是线性二聚体hop的示例,并且此处描述的mrna-肽融合体是线性二聚体pehop的示例。可以使用熟练的生物化学家已知的各种方法进一步纯化pehop。纯化的pehop可以用反转录酶和dntp处理,以将mrna转化为cdna:mrna双链体。在此过程中,rtl1部分可以作为rt引物。

步骤l:任选地,可以通过标准重组蛋白表达技术产生肽cc-a(序列参见表1)。cc-a肽可以与上述mrna-肽融合物混合,并且将会在两个pirm之间形成带有氨基酸间隔区(具有cc-b序列)的卷曲螺旋,并为间隔区提供增强的刚性。

表1-实施例2-5中使用的序列

实施例3.制备dsdna分子文库,该分子编码线性二聚体hop(程序化dna复制)的文库

为了使用rna显示来制备线性二聚pehop文库,可以首先创建此类hop的编码序列文库(例如,核酸模板文库)。可以从许多商业供应商,如agilent、twistbiosciences和customarray获得编码103至105个基于肽的pirm(每个通常小于200nt)的寡核苷酸文库。然而,将它们转化为各自含有pirm编码序列的两个相同拷贝是长(例如,>500bp)dsdna的文库并非易事。此实施例显示了实现此目的的方法。该过程可以称为程序化dna复制(图7a-图7e)。

步骤a:首先,可以从整合dna技术(idt)获得在有义链上含有序列[b|e|mid|f}的名为gblock02的gblock。具体而言,[mid|f}编码卷曲螺旋的一条链,我们称之为cc-b(所有域的序列参见表1)。

步骤b:用于扩增gblock02并引入脱氧尿苷的一对引物可以商购获得。正向引物命名为sg0020。它具有序列[b},并含有几个脱氧尿苷(du)修饰。反向引物命名为sg0013,并具有序列[f*}。这对引物可以用于使用taq扩增gblock02。

步骤c:pcr产物(图7a的sg01-001)可以通过user酶混合物(neb#m5508)在37℃下处理30分钟,以产生长的3'突出端(域b*),如sg01-002中所示。

步骤d:从customarray或twistbiosciences可以获得10,000个各自具有序列[e*|a|p|b}的寡核苷酸物种(统称为sg0012_文库)的混合物。注意,p的序列是可变的,并且每个寡核苷酸物种具有唯一p序列。p序列可以随机地或基于生物序列设计。p的示例为5’-gactacaaagacgatgacgataaa-3’。sg0012_文库可以与sg01-002退火,其中sg0012_文库的域b与sg01-002的新暴露域b*杂交。

步骤e:phi29dna聚合酶(neb#m0269s)可以用于将杂交产物转化为dsdna文库(sg01-003)。

步骤f:可以使用引物sg0011和sg0013(参见表1)扩增dsdna文库,以形成sg01-004。

步骤g:然后可以使用t7核酸外切酶(neb#m0263s)处理sg01-004,以去除底部链。硫代磷酸酯修饰可以保护顶部链(sg01-005)不被降解。

步骤h:sg01-005可以用ampurebead纯化。可以将纯化的sg01-005用user酶混合物(neb#m5508)在37℃下处理30分钟,以去除5'含有硫代磷酸酯的区域,并生成限定的产物(sg01-006)。

步骤i:然后,名为sg0014的5'磷酸化夹板(具有序列[a*|e|f*})和名为sg0008的可光裂解的寡核苷酸(具有序列[e*|a},在域e*和域a之间具有可光裂解的接头)可以从idt获得。可以以1:1.5的比例对sg0014和sg0008进行退火,并且可以将具有约10nmsg0014的退火产物添加至sg01-006,使得sg0014的域f*与sg01-006的域f结合。

步骤j:可以使用ampure珠去除未结合至sg01-006的sg0014和sg0014:sg0008双链体。然后可以将纯化的产物在50ml连接缓冲液中稀释,并且可以施加uv照射以裂解sg0008。sg0008的残余物将自发地与sg0014分离。然后可以将产物在约50℃下温育,使得sg01-006可以被环化以形成sg01-007。

步骤k:使用amiconultra3k(emdmillipore)过滤器将混合物在4℃浓缩。将浓缩的dna在t4dna连接酶(neb#m0202)存在下,于室温进行30分钟的连接反应,以形成环状ssdnasg01-008。然后将反应在65℃温育10分钟,以使t4dna连接酶失活。

步骤l:将连接产物在大量过量的具有序列[f|e*|a}的竞争寡聚物sg0015的存在下加热至95℃持续5分钟,其将加入反应以结合游离的寡聚物sg0014。然后,使用ampure珠进行spri纯化,以去除所有游离的短寡聚物,如sg0014和sg0015。然后将反应用大肠杆菌核酸外切酶i(neb#m0293s)处理,以利用其3’-5’单链核酸外切酶活性降解所有单链dna。

步骤m:然后将寡聚物sg0014再次添加至反应中用作引物。然后,将会使用dna聚合酶(如klenow片段(exo-))在sg0014上延伸,并形成带切口的双链环状dna,其将被t4dna连接酶进一步处理以形成环状dsdnasg01-009。

步骤n:然后将sg01-009用nt.bstnbi酶(neb#0607s)处理,以产生切口的基因片段。然后,将使用phi29dna聚合酶(neb#m0269s)来延伸产物,以形成全长dsdna,其顶部链具有序列[a|p|b|e|mid|f|e*|a|p|b}(sg01-010)。

步骤o:将在两个封闭寡聚物sg0009(具有序列[e*|a})和sg0006(具有序列[e*|b*})的存在下,使用含有脱氧尿苷(du)修饰sg0007(基本具有序列[a})和sg0004(基本具有序列[b*})的两种修饰引物对sg01-010进行pcr扩增。两个封闭寡聚物均应具有3'反向dt修饰。在pcr反应中,sg0007和sg0004的浓度均为约400nm;而sg0009和sg0006的浓度均为约40nm。pcr条件如下:(1)变性温度2分钟;(2)封闭温度5分钟;(3)引发温度1分钟;(4)延伸温度1分钟;转到(1),再循环1次。变性温度为约95℃;封闭温度为约60℃;引发温度为约50℃;延伸温度为约72℃。根据缓冲液条件和所用的酶,可以优化精确的温度。这种pcr反应的一个基本原理是:在封闭温度下,封闭寡聚物将结合在dna模板的中部,而不是dna模板的末端,因为单独的域a和b不能在封闭温度下稳定地结合其互补序列,但在引发温度下,单独的域a和b确实稳定地结合其互补序列;并且在此温度下,引物将在动力学上与封闭寡聚物竞争与dna模板的末端结合,从而开始引发。pcr反应可以允许进行2个循环。

步骤p:将pcr产物用user酶(neb#m5508)在37℃下处理30分钟,以产生具有长3’粘性末端的sg01-011。然后,将两个ssdnasg0010(具有序列[c|a})和\sg0005(具有序列[d*|b*})添加至sg01-011。然后,将温度升至60℃5分钟,并且缓慢冷却至室温,以允许两个ssdna与user处理的产物退火。然后将t4dna连接酶(neb#m0202)添加至反应,以连接基因片段。然后将反应在65℃温育10分钟,以使t4dna连接酶失活。最后,将使用phi29酶(neb#m0269s)延伸产物,以形成具有序列[c|a|p|b|e|mid|f|e*|a|p|b|d}的dsdna(sg01-012)。该最终产物可以使用标准方法进行pcr扩增。

实施例4:使用rna显示生成线性、二聚体pehop文库

使用实施例2所述的rna显示方法,可以将实施例3中创建的dna文库sg01-012制成pehop文库。

实施例5:使用rna显示生成线性、多聚体pehop文库

上面的示例示出了如何创建pehop文库,其中每个hop恰好含有两个pirm。在这里,我们示出了创建线性pehop文库的示例,其中每个hop包括两个以上的pirm。

单链环状dnasg01-008可以与具有序列[d*|f*}的引物xc0001的退火,并且退火产物可以通过phi29dna聚合酶延伸,以启动滚环扩增(rca)反应。rca产物将通过ampure珠纯化,并将与具有序列[c|mid5}的ssdnaxc0002退火,其中域mid5是域mid的前约20个碱基。退火产物将通过phusiondna聚合酶延伸。该产物将通过ampure珠进一步纯化,并用引物xc0003(具有t7启动子序列)和xc0004(具有序列[d*})进行pcr扩增。

pcr产物的长度将不同,并且可以用琼脂糖凝胶电泳解析。具有所需长度的产物可以通过琼脂糖凝胶纯化来纯化。例如,这里每个[a|p|b|mid|f}重复的长度为约536bp。因此,具有约10次重复的产物将为约5.5kb。因此,如果需要约10次重复,可以切除对应于约5.5kb的凝胶部分,并洗脱内容物。凝胶纯化的dna模板可以进一步进行pcr扩增,并用于体外转录以产生mrna转录物,继而如实施例1所述将其用于mrna显示中,以产生pehop文库。

间隔区(在这种情况下为cc-b肽)的长度和序列可以根据需要进行调节。

实施例6:使用体外区域化生成线性、二聚体pehop文库

此实施例伴随图5描述。双链dna模板文库(ivc01-001)各具有t7启动子、核糖体结合位点以及与lz-a融合的基于肽的pirm(我们称为抗体结合肽或abp)的编码序列,将用标准的基因合成方法制备。如前所述,abp序列是可变的。lz-a可以与lz-b形成稳定的亮氨酸拉链。含有ivc01-001、引物修饰的磁珠(ivc01-003)和引物ivc01-002的溶液将被乳化,以产生油包水液滴,使得大量液滴仅含有1个ivc01-001分子(参见图5a)。这里引物ivc01-002和ivc01-004可以用于扩增ivc01-001。引物ivc01-002具有5'叠氮化物修饰,将用于以下所述的缀合反应。乳液将经受pcr。结果,ivc01-001的多个拷贝将与磁珠共价连接(图5b)。这种乳液pcr方法产生的珠子各自含有dsdna的多个克隆拷贝,已被用于许多测序技术中,如roche454和solid。

接下来,将乳液去乳化,并且将珠上的ivc01-001分子共价缀合至支架分子(图5c)。这里支架由两个dna寡核苷酸ivc01-005和ivc01-006组成,它们可以杂交形成约30bp的dsdna。ivc01-005和ivc01-006的3'端均被lz-b肽共价修饰。此外,ivc01-005还具有5'dbco修饰,可与dsdna上的叠氮基团(通过ivc01-002引入)反应形成共价键。

将珠洗涤,重悬于体外转录和翻译混合物中,并再次乳化以形成油包水液滴(参见tawfik和griffiths,1998,naturebiotechnology,第16卷,第652页)。在这些液滴中,ivc01-001将被转录并翻译以形成包括abp和lz-a的融合肽。lz-a域将在支架上与lz-b形成稳定的亮氨酸拉链,从而产生hop。然后可以将乳液去乳化,并可以洗涤珠。

最后,可以通过多种方法从珠释放珠上的ivc01-001(现在与hop共价连接)。例如,引物ivc01-002可以在前约5个碱基内含有脱氧尿苷,在这种情况下,可以通过用user酶混合物处理,将hop修饰的ivc01-001从珠释放出来。释放的hop修饰的ivc01-001分子将是可溶的pehop文库。

实施例7:体外转录

本文提供了用于试剂盒(thermofisher)的示例方案。sp6、t3和t7噬菌体rna聚合酶广泛用于从dna模板体外合成rna转录物。模板通常在要转录的序列上游具有双链19-23个碱基的启动子。然后将模板与相应的rna聚合酶、rntp和转录缓冲液混合,并将反应混合物在37℃温育10分钟至1小时。rna聚合酶首先结合其双链dna启动子,然后将两条dna链分离,并以3'至5'链为模板在dna模板末端合成互补的5'至3'(失控转录)。

转录的起始是体外转录反应的限速步骤;转录的延伸非常迅速。噬菌体rna聚合酶对其各自的启动子具有高特异性。许多多用途克隆载体含有两个或多个位于多克隆位点两侧的独立噬菌体启动子。由于rna聚合酶具有很高的启动子特异性,因此模板的任一条链都可以转录,与相对链上的启动子几乎没有“串扰”。试剂盒还可以用于转录从pcr产生的dna模板。事实上,来自pcr的dna无需任何预处理或纯化即可直接用于maxiscript试剂盒。

实施例8:体外翻译

最常用的无细胞翻译系统由兔网织红细胞、小麦胚芽和大肠杆菌的提取物组成。全部可以制备为含有翻译外源rna所需的所有大分子组分(70s或80s核糖体、trna、氨酰基-trna合成酶、起始、延伸和终止因子等)的粗提取物。为了确保有效翻译,每种提取物可以补充氨基酸、能量源(atp、gtp)、能量再生系统(针对真核生物系统的磷酸肌酸和肌酸磷酸激酶,和针对大肠杆菌裂解物的磷酸烯醇丙酮酸和丙酮酸激酶),以及其他辅因子(mg2+、k+等)。

有两种基于起始遗传物质的体外蛋白质合成方法:rna或dna。标准翻译系统,如网织红细胞裂解物和小麦胚芽提取物,使用rna为模板;而“偶联”和“连接”系统从dna模板开始,该模板被转录为rna,然后进行翻译。

实施例9:使用裂分-合并合成生成线性、二聚体pehop文库

使用裂分-合并方法创建dna编码的小分子文库已被报道。例如,clark等人(2009natchembiol.,第5卷,第647页)详细描述了如何制备具有远超5x106个物种的dna编码的小分子文库。可以使用类似的策略创建pehop文库。例如,“aop-headpiece”(参见clark等人的补充图2,在此复制为图6a)可以被相似的分子取代,但具有两个可以在其上构建其他部分的氨基。两个氨基可以被约30-bpdsdna制成的间隔区部分隔开(图6b)。这种间隔区的示例由修饰的寡核苷酸snp01-001和snp01-002形成,在图6b示出。这两个寡核苷酸都可以在3'端具有胺修饰。此外,5'端snp01-002可以通过各种化学键与aop-headpiece中原始发夹状结构的环缀合。例如,aop-headpiece的氨基可以被叠氮化物基团取代,并且snp01-002的5'端可以被dbco基团修饰,该dbco基团可以通过无铜点击化学与叠氮基团形成共价键。

实施例10:使用hop或pehop文库进行疾病诊断

这里提供的实施例是一种为特定疾病开发诊断测试的策略。

阶段1:使用pehop文库来鉴定能区分来自患病受试者和健康受试者的血清的一组肽

(1)制备至少有105个成员的pehop文库(每个成员有很多拷贝)

(2)收集约100名疾病患者的血清样品(称为“疾病血清”)和约100名未患病受试者的血清样品(称为“非疾病血清”)

(3)对于每个血清样品,将其与pehop文库的等分试样混合,去除不结合血清中抗体的pehop,并对结合抗体的pehop的编码序列进行测序

(4)鉴定一组约50个肽,这些肽频繁与疾病血清结合,而很少与非疾病血清结合。

阶段1(替代策略):使用hop阵列来鉴定能区分来自患病和健康受试者的血清的一组肽

(1)制备至少有104个离散区的高密度hop阵列,每个离散区具有肽序列

(2)收集约100名疾病患者的血清样品(称为“疾病血清”)和约100名未患病受试者的血清样品(称为“非疾病血清”)

(3)对于每个血清样品,将其应用于hop阵列,去除未结合的抗体,并定量每个特征上的剩余抗体

(4)鉴定一组约50个肽,这些肽频繁与疾病血清结合,而很少与非疾病血清结合。

阶段2:使用该组

(1)打印具有约50个特征的低密度hop阵列,每个特征是阶段1中鉴定的组中的一个肽序列。

(2)使hop阵列与来自未知疾病状态的受试者的血清样品接触,洗去未结合的抗体,定量来自每个特征的保留抗体以形成概况,其中概况表明受试者的疾病状态。

实施例11:生成hop或pehop文库

在该示例中,描述了生成hop或pehop文库的修饰过程。其中一些步骤与先前实施例(实施例3-5)中描述的步骤相似。

dna复制的构建

被命名为sg0017_f-中部-e-b的gblock基因片段含有编码氨基酸间隔区的序列,是从integrateddnatechnologies(idt)订购的。使用正向引物sg0020_b引物_du(在其5'端含有脱氧尿苷(du))和反向引物sg0013_f*引物进行pcr(在图8a中命名为d1)。pcr条件如下:初始变性(95℃30秒),20个循环(95℃30秒、51℃30秒和68℃30秒),最后在68℃延伸5分钟。pcr产物用user酶(neb#m5508)在37℃处理30分钟。然后,添加含有编码flag肽的序列的寡聚物(sg0012_[e*|a|p|b}_hplc),以与经user处理的产物在上链5'端退火(图8a)。反应通过phi29dna聚合酶(neb#m0269s)在30℃延伸30分钟。然后,使用正向引物sg0011_[a*g*|du|e*|a}(磷酸化修饰的寡聚物)和反向引物sg0013_f*引物进行pcr(在图8a中命名为d4),pcr产物用t7核酸外切酶处理,随后用user酶处理,以产生单链基因片段。使用circligasessdna连接酶(epicentre#cl4115k)将该单链dna进一步环化(在图8a中命名为d7)。还添加了五个订书钉(staple)寡聚物,以促进该环化反应,并且使用核酸外切酶v(neb#m0345s)除去未环化的产物。然后,通过首先将单链环状产物(图8a中的d7)与sg0014_[a*|e|f*}退火,然后使用nebnext第二链合成酶混合物(neb#e6112)进行延伸和连接,来发展出双链环状产物。该连接的双链环化产物通过使用nt.bstnbi酶(neb#r0607s)形成切口,并通过使用bst2.0dna聚合酶(neb#m0537s)进一步延伸(在图8a中命名为d12)。延伸后,如图8a所示,复制编码flag肽的序列。为了进一步引入包括t7启动子、核糖体结合位点、异读框终止密码子等的序列,继续进行dna复制和其他几个步骤。首先,延伸产物通过pcr扩增,其中在每条链的5'端引入脱氧尿苷(du)。具体而言,使用sg0007_a引物_du(0.2μm)和sg0004_b*引物_du(0.2μm)分别作为正向和反向引物进行pcr反应。还向反应中添加两个在3'端含有反向dt的阻滞剂(sg0009_[e*|a}阻滞剂和sg0006_[e*|b*}阻滞剂),但其浓度低得多(20nm)。特定的pcr条件如下:初始变性(95℃30秒),10个循环(95℃30秒、64℃1分钟以允许阻滞剂结合,以及50℃1.5分钟以允许引物结合,然后在72℃30秒),最后在72℃延伸5分钟。将pcr产物进一步用user酶(neb#m5508)处理,然后与sg0010[c|a}引物(含有t7启动子和核糖体结合位点)和sg0005[d*|b*}引物(含异读框终止密码子)退火。使用nebnext第二链合成酶混合物(neb#e6112)连接并延伸退火产物。最后,使用正向引物sg0001_t7_f和反向引物sg0002_框终止_r通过pcr将该延伸产物扩增。使用8m尿素变性5%聚丙烯酰胺凝胶电泳来分析最终产物(在图8a中命名为d14)以及其他中间产物(图8b)。dna复制构建体的全长为536bp,其含有t7启动子的序列、核糖体结合位点以及针对包括氨基酸间隔区和两个flag肽的hop的编码序列,在图8b中标记为d14(536bp)。

mrna与嘌呤霉素-接头dna的连接。

通过使用hiscribet7高产量rna合成试剂盒(neb#e2040s)来合成dna复制的mrna转录物。从idt订购rtl1接头(含有叠氮基)和嘌呤霉素接头(含有二芳基环辛炔部分(dbco)),并采用嘌呤霉素(dbco):rtl1(3:1)的比例,通过混合两个接头并在37℃下温育过夜来进行两个接头之间的缀合反应。rtl1接头和mrna3'-端之间的退火反应是通过将rtl1-puro(dbco)缀合产物与mrna以3:1的比例混合进行的。将反应在55℃下温育5分钟,随后缓慢冷却至室温。使用t4rna连接酶(#nebm0204s)将反应在37℃下温育1小时,从而将mrna与rtl1-puro(dbco)dna接头连接。此外,rtl1接头也直接退火并连接至mrna,作为下游拉下(pull-down)测定的对照。最后,使用8m尿素变性5%聚丙烯酰胺凝胶电泳来分析所有连接的产物(图9)。通过图9的泳道3和泳道4中的大小变化来确认连接产物(分别命名为d14(rna)-rtl1和d14(rna)-rtl1-puro)。

无细胞翻译

将mrna-嘌呤霉素缀合物与purexpress体外蛋白质合成试剂盒(neb#6800)的溶液a和溶液b混合,并将混合物在37℃温育2小时。通过在4℃温育10分钟来终止反应。为了增强融合肽的形成,将翻译后产物在高盐(分别为kcl和mgcl2的最终浓度分别为600mm和60mm)存在下于-20℃温育过夜。

mrna-蛋白质融合物的拉下

将edta和尿素分别以125mm和4m的最终浓度添加至翻译后产物。然后将样品加热至95℃,持续5分钟,并且随后使用agencourtampurexp珠(beckmancoulter,#a63881)进行纯化。纯化后,将小鼠中产生的单克隆biom2抗体(sigmaaldrich,#f9291)添加至溶液,并将反应在室温温育30分钟。然后用1x磷酸盐缓冲盐水(pbs)缓冲液将dynabead磁珠(invitrogen,myonestreptavidinc1)洗涤三次。将洗涤的珠添加至含有mrna-蛋白质融合物和单克隆抗-flag抗体的混合物。将反应在室温温育30分钟,然后将珠用1xpbs洗涤两次,并用95%甲酰胺洗脱。通过在95℃加热样品5分钟并使用磁力分离器(permagenlabware)分离mrna-蛋白质融合物和珠,获得最终的mrna-蛋白质融合物。融合蛋白的大小移动如图9所示(泳道5)。

表2-实施例11中使用的序列

起点商标作为专业知识产权交易平台,可以帮助大家解决很多问题,如果大家想要了解更多知产交易信息请点击 【在线咨询】或添加微信 【19522093243】与客服一对一沟通,为大家解决相关问题。

此文章来源于网络,如有侵权,请联系删除

相关标签:
tips