能够实现反馈的合成基因、靶点种子匹配盒及其应用的制作方法

专利2022-05-09  265


能够实现反馈的合成基因、靶点种子匹配盒及其应用
1.优先权声明
2.本申请根据35u.s.c.
§
119(e)要求于2018年8月30日提交的美国临时申请第62/725,126号和于2019年6月13日提交的美国临时申请第62/861,044号的权益,其全部内容通过引用并入本文。
3.有关序列表的电子递交声明
4.提供了根据37c.f.r.
§
1.821提交的ascii文本格式的序列表,名称为5470

844wo_st25.txt,大小为17,375字节,于2019年8月22日生成并通过efs

web提交,代替纸质副本。特此通过引用将该序列表并入本说明书以获得其公开内容。
5.政府支持声明
6.本发明是在美国国立卫生研究院(national institutes of health)授予的授权号为4t32hd040127

15的政府支持下完成的。政府对此发明享有一定的权利。
技术领域
7.本发明涉及用于在靶组织中提供转基因表达之目的的能够实现反馈的(feedback

enabled)合成基因、多核苷酸靶点盒(polynucleotide target cassette)、载体和药物组合物及其制备方法和使用方法,该转基因表达能够被内源性调控以治疗如剂量敏感性智力障碍等疾病。


背景技术:

8.许多以智力障碍为特征的神经发育疾病是由基因中的突变介导的,这些基因必须被紧密调控(参见表1)。内源性基因产物的表达通过已知和迄今未知的分子机制在靶组织和非靶组织中被仔细调控。目前通过基因治疗载体对靶组织中基因产物的过度表达以及表达不足的基因治疗存在负面结果,调控不当或不完全。因此,本领域需要具有改善的表达调控的载体。本发明通过提供用于在靶点组织中提供转基因表达之目的的能够实现反馈的合成基因、多核苷酸靶点盒、载体和药物组合物克服了本领域的缺点,该转基因表达能够被内源性调控以治疗如剂量敏感性智力障碍等疾病。


技术实现要素:

9.本发明部分地基于开发用于在靶组织中提供转基因表达之目的的能够实现反馈的合成基因、多核苷酸靶点盒、载体和药物组合物,该转基因表达能够被内源性调控以治疗疾病例如剂量敏感性智力障碍诸如例如雷特综合征(rtt)。本发明的一部分是在雷特综合症研究基金(rett syndrome research trust)的支持下完成的。
10.因此,本发明的一个方面涉及一种包括多核苷酸的合成基因,该多核苷酸包含编码目的蛋白或核酸的编码区和一个或多个调控区,其中该多核苷酸还包含一个或多个核酸区段,每个核酸区段包含被鉴定为内源性mirna结合位点的种子匹配区(seed match)以及挨着所述种子匹配区的5'侧翼序列和3'侧翼序列,其中所述一个或多个核酸区段被插入所
述多核苷酸的调控区中,使得当所述合成基因被递送至表达内源性mirna的细胞时所述目的蛋白或核酸的表达相对于当不包含一个或多个核酸区段的合成基因被递送至表达内源性mirna的细胞时目的蛋白或核酸的表达降低。
11.本发明的另一方面涉及包含本发明的合成基因的载体和药物组合物。
12.本发明的另一方面涉及用于向本发明的合成基因提供剂量依赖性抑制反馈的多核苷酸靶点盒。
13.另一方面涉及一种制备合成基因的方法,包括将多核苷酸靶点盒插入到合成基因的调控区中的步骤。
14.本发明的另一方面涉及一种制备合成基因的方法,包括将一个或多个包含种子匹配区以及5'侧翼序列和3'侧翼序列的核酸区段插入到合成基因的多核苷酸的调控区中的步骤。
15.本发明的另一方面涉及一种鉴定待插入合成基因中的一个或多个种子匹配区和侧翼序列的方法,包括以下步骤:鉴定种子匹配区和侧翼序列,以及将所述种子匹配区和侧翼序列插入合成基因的调控区中。
16.本发明的另一方面涉及一种向受试者递送合成基因的方法,包括向受试者施用本发明的合成基因、载体或药物组合物。
17.本发明的另一方面涉及治疗与内源性基因的异常表达相关的疾病的方法,包括施用本发明的合成基因、载体或药物组合物,从而治疗该疾病。
18.本发明的另一方面涉及治疗受试者中与内源性基因的异常表达或由内源性基因编码的突变蛋白的表达相关的疾病的方法,包括通过遗传学手段在受试者的细胞中敲减(knocking down)内源性基因,以及施用本发明的合成基因、载体或药物组合物,从而治疗所述疾病。
19.在以下对本发明的描述中更详细地阐述了本发明的这些方面和其他方面。
20.附图简述
21.图1显示了描述mecp2驱动的mirna如何可以减弱外源性mecp2的毒性过表达的反馈环。
22.图2显示了样品微阵列数据。所选择的数据对mecp2

空与野生型(wt)组织中的mirna表达水平进行了定量。
23.图3显示了(与盐水处理的ko小鼠相比)盐水处理的wt小鼠中平均表达水平增加的mirna。指示了(在3种组织类型中的至少1种中)具有统计学显著增加的表达的mirna(*)。(在任何组织中)也响应于aav9/egfp而被上调的假阳性击中物指示为(**)。n=2次重复筛选/生物样品;n=3只小鼠/处理组。
24.图4显示在颈髓(cc)或髓质中与内源性mecp2表达关联地表达增加的mirna。每个数据点是对于单只小鼠2次重复筛选的平均值。彼此显著不同的组用红色方框表示。n=3只小鼠/处理组。
25.图5显示了(与盐水处理的ko小鼠相比)aav/mecp2处理的ko小鼠中平均表达水平增加的mirna。(在3种组织类型中的至少1种中)具有统计学显著增加表达的mirna指示为(*)。(在任何组织中)也响应于aav9/egfp而被上调的假阳性击中物指示为(**)。n=2次重复筛选/生物样品;n=3只小鼠/处理组。
26.图6显示了(与盐水处理的wt小鼠相比)aav/mecp2处理的wt小鼠中平均表达水平增加的mirna。(在3种组织类型中的至少1种中)具有统计学显著的表达增加的mirna表示为(*)。(在任何组织中)响应于aav9/egfp而被上调的假阳性击中物表示为(**)。n=2次重复筛选/生物样品;n=3只小鼠/处理组。
27.图7显示了wt或ko小鼠中与外源性mecp2表达相关联地表达增加的mirna。
28.图8显示了将mir

494

3p靶点插入到“v2”病毒基因组中略微(不显著)降低了mecp2

egfp( )细胞(相对于mecp2

空的细胞)中的外源性mecp2表达。在2016年的初步研究将mir

494

3p鉴定为阳性击中物后,将3个串联靶点插入mep426

hmecp2

myc

rdh1pa病毒基因组(mir

132、mir

19和mir

22的靶点已删除)的3'utr中。将修饰的病毒基因组包装到aav9(aav9/v2

t1)中,并注射到嵌合mecp2egfp

融合/空的小鼠体内。与在邻近的mecp2

egfp空的细胞中观察到的相比,mecp2

egfp( )细胞中的转基因表达略有降低。
29.图9显示了与总的mecp2表达相关联地被上调的mirna。mecp2(

)组显示了盐水和aav9/egfp处理的ko小鼠的数据点。mecp2( )组显示了盐水、aav9/mecp2和aav9/egfp处理的wt小鼠以及aav9/mecp2处理的ko小鼠的数据点。方框指示显著性差异。
30.图10的分图a

e显示了rtt特异性组reg1如何紧密地调控wt浦肯野(purkinje)细胞中的总mecp2表达。浦肯野细胞位于脑池内注射位点附近,并且易受超生理性转基因表达的影响。将对于每个细胞核的校正后的总细胞荧光(抗mecp2信号)相对于myc(

)浦肯野细胞核的平均mecp2信号归一化。分图a中呈现了对指定宿主定量的所有myc( )核取平均值的归一化mecp2信号。在z堆栈(z

stack)内的细胞之间,然后在单个小鼠的z堆栈之间进行迭代平均,同样导致总mecp2表达的显著降低。分图a和b显示用已公布的对照(aav9/mep426

minimecp2

myc

rdh1pa;gadalla等人,2017)处理后,转导的浦肯野细胞中的平均总mecp2表达(mini 内源性全长蛋白)是未转导的浦肯野细胞的5倍。用于神经元敲减的阳性对照组(以mir

124

3p的3个靶为特征)将过表达降低了一半(p=0.06)。reg1盒也使过表达降低了一半(p=0.02)。分图c显示了总mecp2强度的直方图,显示reg1使总mecp2强度的分布变窄,指示更紧密的调控。分图d显示了转导的浦肯野细胞的平均总mecp2强度与局部转导效率,其中每个数据点代表单一z堆栈内的浦肯野细胞的平均强度和转导效率。趋势线连接来自单只小鼠的多个z堆栈。reg1盒限制总mecp2表达,即使在小脑区域也具有高转导效率。相比之下,阴性对照组允许的总mecp2表达在具有高局部转导效率的区域中大大超过生理水平。分图e显示reg1盒允许转基因在neun 细胞中表达。相比之下,神经元敲减的阳性对照降低了neun 细胞的百分比。数据为平均值
±
sem。
31.图11显示了初步数据,其中reg1表现为在对杂合嵌合雌性小鼠脑池内施用aav9/mini

mecp2

reg1后降低肝脏的转基因表达。在所示的所有图像中使用相同的增益设置(gain setting)。比例尺表示20μm。每个象限描述一只小鼠,通过id号(id#)指示。
32.图12总结了用于设计rtt特异性组(在别处称为“reg1”)和广泛适用组(在别处称为“reg2”或“univt”)的策略。分图a示出了用于设计rtt特异性靶点组的表达数据,该靶点组用于在体内安全地调控外源性mecp2表达。相同的表达数据提供了为了设计reg2的目的处理utr数据集的选择标准,如分图b所示。分图c

g显示了用于将2491个人靶标的列表缩小成在reg2中特征化的六个保守靶点的步骤。这些靶点中的5个被预测结合mecp2驱动的mirna(参见表1)。因为let

7靶点碱基与许多let

7mirna种子区配对,所以reg2组可能结合
多达11个mirna。
33.图13显示在php.b介导的minimecp2基因转移后,reg2降低了wt脑中转基因的表达水平。图中的首字母缩写包括:ca1

3,海马区。ctx,皮质;mid,中脑;sub,脑下脚(subiculum);th,丘脑。将实验图像的增益设置为与对照图像的增益设置匹配。每个象限描述一只小鼠,通过id号(id#)指示。
34.图14显示了在代表性小脑平铺块扫描图像内浦肯野细胞中的minimecp2表达被reg2依赖性抑制。在左侧(对照:(

reg2)),箭头指向对照载体处理的小鼠的几个小脑叶中的myc( )浦肯野神经元。在reg2处理的小鼠中,大部分浦肯野细胞为myc(

)。在右侧(实验:( reg2)),箭头指示minimecp2表达局限于前庭小脑区域。因为reg2处理的小鼠具有宽范围的浦肯野细胞层,即为0%myc( )或100%myc( )(限于前庭小脑区域),所以不建议对相邻的myc( )和myc(

)浦肯野细胞中总mecp2表达进行定量分析。每个2
×
2平铺块扫描图(tile scan)描述一只小鼠。
35.图15a

15c显示reg2允许在多个脑部区域中广泛但严密控制的表达。所示图像的放大率高于图13所示图像的放大率。针对reg2处理的小鼠所指示的myc( )细胞的百分比(a)可能低估了实际的转导细胞百分比,因为许多myc( )细胞的抗myc免疫荧光信号几乎不高于检测限。在所检查的3个区域中,海马表现出%myc( )细胞下降幅度最大(reg2与对照处理的小鼠)。图15a中描绘的图例也适用于图15c和图16。图15b显示了丘脑、海马和髓质的代表性图像。操作reg2图像的增益设置,以便可以容易地看到抗myc信号。图15c显示reg2增强了丘脑中明显的神经元取向。数据为平均值
±
sem。比例尺表示20μm。*p≤0.05.
36.图16显示reg2可以改善肝脏中的minimecp2调控。该图指示了小鼠之间%myc( )肝细胞的变异性,而未显示代表性图像。数据为平均值
±
sem。p>0.05。左侧的条形图组对应于图15a中所示的图例。
37.图17显示了盐水处理的ko小鼠和病毒处理的ko小鼠的初步存活数据。在4

5周龄时对小鼠进行脑池内注射。尽管reg2对转基因表达具有强的抑制作用,但reg2似乎并未减弱php.b/minimecp2(1e11 vg/小鼠)介导的中位生存期的延长。此外,reg2处理导致较少的早期死亡。指示了每组中仍然存活的小鼠的数目。处理的小鼠中具有正常后肢的相应百分比列于表6中。
38.发明详述
39.下面将更详细地解释本发明。该描述并不旨在成为可实现本发明的所有不同方式的详细目录,也不旨在成为可添加到本发明中的所有特征的详细目录。例如,关于一个实施方案说明的特征可并入到其他实施方案中,且关于具体实施方案说明的特征可从该实施方案中删除。此外,根据本公开,对本文提出的多种实施方案的多种变化和添加对于本领域技术人员将是明显的,这些变化和添加不偏离本发明。因此,以下说明旨在说明本发明的一些具体实施方案,而不是穷尽地指定其所有置换、组合和变化。
40.除非上下文另外指示,否则明确意指本文描述的本发明的多种特征可以以任何组合使用。此外,本发明还设想了,在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。为了说明,如果本说明书陈述复合物包含组分a、b和c,则明确意指a、b或c中的任一个或其组合可以单独地或以任何组合被省略和放弃。
41.除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普
通技术人员通常理解的相同含义。本文在对本发明的描述中使用的术语仅用于描述具体实施方案的目的,而不旨在限制本发明。
42.除非另外具体指明,否则核苷酸序列在本文中仅通过单链以5'至3'方向从左到右呈现。核苷酸和氨基酸在本文中以iupac

iub生物化学命名委员会推荐的方式表示,或者(对于氨基酸)以单字母代码或三字母代码表示,都符合37c.f.r.
§
1.822和既定用法。
43.除非另外指明,本领域技术人员已知的标准方法可用于重组和合成基因、多肽、抗体或其抗原结合片段的产生,核酸序列的操作,转化细胞的产生,载体构建体的构建,以及数据集的产生和分析。这些技术是本领域技术人员已知的。参见,例如,sambrook等人,molecular cloning:a laboratory manual 2nd ed.(cold spring harbor,ny,1989);f.m.ausubel等人current protocols in molecular biology(green publishing associates,inc.and john wiley&sons,inc.,new york)。
44.本文提及的所有出版物、专利申请、专利、核酸序列、氨基酸序列和其他参考文献均通过引用全文并入。
45.定义
46.如在本发明的说明书和所附权利要求书中所使用的,单数形式“一(a、an)”和“该(the))”也旨在包括复数形式,除非上下文另外清楚地指示。
47.如本文所用的,“和/或”是指并涵盖一个或多个相关所列项目的任一个和所有可能的组合,以及当以备选方式(“或”)解释时没有组合。
[0048]“任选的(optional)”或“任选地(optionally)”是指随后描述的事件或情况可以发生或可以不发生,并且该描述包括事件或情况发生的实例以及事件或情况没有发生的实例。
[0049]
此外,本发明还设想,在本发明的一些实施方案中,可以排除或省略本文阐述的任何特征或特征的组合。
[0050]
此外,当涉及可测量值,例如本发明的化合物或剂的量、剂量、时间、温度等时,本文所用的术语“约”意指包括所指定的量的
±
10%、
±
5%、
±
1%、
±
0.5%或甚至
±
0.1%的变化。
[0051]
如本文所用,连接词“主要由
……
组成”应解释为涵盖所列举的材料或步骤和“实质上不影响所要求保护的发明的基本特征和新颖特征的那些材料或步骤”。因此,本文所用的术语“主要由
……
组成”不应被解释为等同于“包括/包含”。
[0052]
应用于本发明的多核苷酸或多肽序列的术语“主要由
……
组成(以及语法变体)”是指多核苷酸或多肽由所列举的序列(例如seq id no)和所列举的序列的5'和/或3'或n

末端和/或c

末端上或在两个末端之间(例如结构域之间)总共十个或更少(例如1、2、3、4、5、6、7、8、9或10个)的额外核苷酸或氨基酸组成,使得该多核苷酸或多肽的功能没有被实质性改变。总共10个或更少的额外核苷酸或氨基酸包括额外核苷酸或氨基酸加在一起的总数。应用于本发明的多核苷酸的术语“实质上改变(materially altered)”是指与由所列举的序列组成的多核苷酸的表达水平相比,表达所编码的多肽的能力增加或降低至少约50%或更多。应用于本发明多肽的术语“实质上改变”是指与由所列举的序列组成的多肽的活性相比,生物活性增加或降低至少约50%或更多。
[0053]
本文所用的术语“序列同一性”具有其在本领域中的标准含义。如本领域已知的,
可以使用许多不同的程序来鉴定多核苷酸或多肽是否与已知序列具有序列同一性或相似性。序列同一性或相似性可以使用本领域已知的标准技术测定,包括但不限于:smith&waterman,adv.appl.math.2:482(1981)的局部序列同一性算法,;needleman&wunsch,j.mol.biol.48:443(1970)的序列同一性比对算法;pearson&lipman,proc.natl.acad.sci.usa85:2444(1988)的相似度搜索方法;这些算法(wisconsin遗传学软件包中的gap、bestfit、fasta和tfasta,遗传学计算机组,575science drive,madison,wi)的计算机化实现;devereux等人,nucl.acid res.12:387(1984)描述的best fit序列程序,优选使用默认设置,或通过检验确定。
[0054]
有用的算法的一个实例是pileup。pileup使用渐进式成对比对从一组相关序列产生多序列比对。其还可以绘制示出用于创建该比对的聚类关系(clustering relationship)的树。pileup使用简化的feng&doolittle,j.mol.evol.35:351(1987)的渐进比对方法();该方法类似于higgins&sharp,cabios 5:151(1989)描述的方法()。
[0055]
有用算法的另一个实例是altschul等人,j.mol.biol.215:403(1990)和karlin等人,proc.natl.acad.sci.usa 90:5873(1993)描述的blast算法。特别有用的blast程序是从altschul等人meth.enzymol.,266:460(1996);blast.wustl/edu/blast/readme.html.获得的wu

blast

2程序。wu

blast

2使用几个优选地设置为其默认值的搜索参数。这些参数是动态值并且是由程序自身根据目的特定序列的组成和针对其搜索目的序列的特定数据库的组成来建立的;然而,可以调整这些值以增加灵敏度。
[0056]
另外一种有用的算法是如altschul等人,nucleic acids res.25:3389(1997)报道的加空位的blast。
[0057]
通过匹配相同残基的数目除以比对区域中“较长”序列的残基总数来确定氨基酸序列同一性的百分比值。“较长”序列是比对区域中具有最多实际残基的序列(忽略wu

blast

2为最大化比对得分而引入的空位)。
[0058]
以类似方式,将核酸序列同一性百分比定义为候选序列中与本文具体公开的多核苷酸中的核苷酸相同的核苷酸残基的百分比。
[0059]
比对可以包括在待比对的序列中引入空位。此外,对于含有比本文具体公开的多核苷酸更多或更少核苷酸的序列,应当理解在一个实施方案中,序列同一性的百分比将基于相对于核苷酸总数相同核苷酸的数目来确定。因此,例如,在一个实施方案中,比本文具体公开的序列短的序列的序列同一性将使用较短序列中的核苷酸数目来确定。在百分比同一性计算中,未向序列变异的各种表现形式,例如插入、缺失、取代等指定相对权重。
[0060]
在一个实施方案中,仅对相同性进行正评分( 1),而对包括空位在内的所有形式的序列变异赋予值“0”,这避免了对如下所述用于序列相似性计算的权重标度(weighted scale)或参数的需要。序列同一性百分比可以例如通过将匹配的相同残基的数目除以比对区域中“较短”序列的残基总数并乘以100来计算。“较长”序列是在比对区域中具有最多实际残基的序列。
[0061]
如本文所用,“分离的(isolated)”核酸或核苷酸序列(例如,“分离的dna”或“分离的rna”)意指与天然存在的生物体或病毒的至少一些其他组分分离的或基本上不含天然存在的生物体或病毒的至少一些其他组分核酸或核苷酸序列,所述至少一些其他组分例如通常发现与核酸或核苷酸序列缔合的细胞或病毒结构成分或其他多肽或核酸。
[0062]
同样地,“分离的”多肽意指与天然存在的生物体或病毒的至少一些其他组分分离的或基本上不含天然存在的生物体或病毒的至少一些其他组分的或与其分离的多肽,所述至少一些其他组分例如通常发现与多肽缔合的细胞或病毒结构组分或其他多肽或核酸。
[0063]
术语“内源性”是指在环境中天然存在的组分,即,基因、核酸、mirna、蛋白质、细胞或在受试者中表达的其他天然组分,其不同于引入的组分即“外源性(exogenous)”组分。
[0064]
如本文所用,术语“异源性”是指来源于外来物种的核苷酸/多肽,或者如果是来自相同物种的核苷酸/多肽,该核苷酸/多肽通过有意的人为干预对其组成和/或基因座的天然形式进行了实质性修饰。
[0065]
如本文所用,术语“核酸”是指从5'至3'末端读取的脱氧核糖核苷酸或核糖核苷酸碱基的单链或双链聚合物。“核酸”还可任选地含有非天然存在的或修饰的核苷酸碱基。术语“核苷酸序列”或“核酸序列”是指核酸的有义链和反义链,既可以是单个单链也可以是双链体。术语“核糖核酸”(rna)包括rnai(抑制性rna)、dsrna(双链rna)、sirna(小干扰rna)、shrna(短/小发夹rna)、mrna(信使rna)、mirna(微小rna)、trna(装载或卸载相应的酰化氨基酸的转运rna)、长链非编码rna(lncrna)、核糖体rna(rrna)、核小rna(snrna)、核仁小rna(snorna)和crna(互补rna),并且术语“脱氧核糖核酸”(dna)包括cdna和基因组dna以及dna

rna杂交体。
[0066]
微小rna是一类非编码小rna,其起源于由mirna基因编码的初级mirna(pri

mirna)转录物。pri

mirna转录物被加工成较小的19

24个核苷酸的rna,它们可以通过例如翻译抑制或切割介导的沉默反应调控基因表达。
[0067]
本领域技术人员应将术语“核酸区段”、“核苷酸序列”或更普遍地“区段(segment)”理解为功能性术语,其包括基因组序列、核糖体rna序列、转运rna序列、信使rna序列、调控小rna、操纵子序列和表达或可被调整为表达蛋白质、多肽或肽的较小的工程化核苷酸序列。本公开的核酸也可以通过本领域已知的方法完全或部分合成。因此,可以使用所选宿主优选的密码子合成本公开的全部或部分核酸。这种物种优选的密码子可以例如由在特定宿主物种中表达的蛋白质中最频繁使用的密码子来确定。核苷酸序列的其他修饰可导致具有稍微改变的活性的突变体。
[0068]
如本文关于核酸所用的术语“片段”是指相对于参考核酸在长度上减少的核酸,其包含与参考核酸的相应部分相同或几乎相同(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续核苷酸的核苷酸序列、主要由该核苷酸序列组成和/或由该核苷酸序列组成。在适当的情况下,这样的核酸片段可以包括在其作为组成部分的更大的多核苷酸中。在一些实施方案中,核酸片段包含至少约5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400、450、500或更多个连续核苷酸、主要这些连续核苷酸组成或由这些连续核苷酸组成。在一些实施方案中,核酸片段包含少于约5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400、450或500个连续核苷酸、主要由这些连续核苷酸组成或由这些连续核苷酸组成。
[0069]
如本文关于多肽所用的术语“片段”是指相对于参考多肽在长度上减少的多肽,其包含与参考多肽的相应部分相同或几乎相同(例如90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同)的连续氨基酸的氨基酸序列、主要由该氨基酸序列组成和/或
由该氨基酸序列组成。在适当的情况下,这样的多肽片段可以包括在其作为组成部分的更大的多肽中。在一些实施方案中,多肽片段包含至少约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400、450、500或更多个连续氨基酸、主要由这些连续氨基酸组成或由这些连续氨基酸组成。在一些实施方案中,多肽片段包含少于约2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、300、350、400、450或500个连续氨基酸、主要由这些连续氨基酸组成或由这些连续氨基酸组成。
[0070]
如本文关于核酸所用的术语“功能片段”或“活性片段”是指编码多肽的功能片段的核酸。
[0071]
如本文关于多肽所用的术语“功能片段”或“活性片段”是指保留全长多肽的至少一种生物活性(例如,上调或下调基因表达的能力)的至少约20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%、99.5%或更多的多肽片段。在一些实施方案中,功能片段实际上具有的至少一种生物活性的水平比全长多肽更高。
[0072]
如本文所用,应用于多核苷酸或多肽序列的术语“修饰的”是指序列由于一个或多个缺失、添加、取代或其任意组合而不同于野生型序列。
[0073]
如本文所用,“分离”或“纯化”(或语法等价物)病毒载体意指病毒载体至少部分地与起始材料中的至少一些其他组分分离。
[0074]
术语“增强”和“增加”是指指定参数增加至少约1.25倍、1.5倍、2倍、3倍、4倍、5倍、6倍、8倍、10倍、12倍或甚至15倍。
[0075]
如本文所用,术语“抑制”和“降低”或其语法上的变体是指指定水平或活性减少或缩减至少约15%、25%、35%、40%、50%、60%、75%、80%、90%、95%或更多。在具体实施方案中,抑制或降低导致极小或基本上检测不到的活性(至多为不明显的量,例如小于约10%或甚至5%)。
[0076]
如本文所用,“表达”是指多核苷酸从dna模板转录(例如转录成mrna或其他rna转录物)的过程和/或转录的mrna随后翻译成肽、多肽或蛋白质的过程。转录物可以称为“转录产物”,且编码的多肽可以称为“翻译产物”。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸衍生自基因组dna,则表达可包括真核细胞中mrna的剪接。表达产物本身,例如,产生的核酸或蛋白质,也可以表述为“被表达”。表达产物可表征为细胞内的、细胞外的或分泌的。术语“细胞内”意指在细胞内的东西。术语“细胞外”意指在细胞外的东西。如果一种物质在细胞外、在细胞上或细胞内的某个地方以明显程度出现,则该物质是由细胞“分泌”的。
[0077]
如本文所用,术语“合成基因”是指通过精心的人为设计非天然产生的核酸序列,所述合成基因除其他组分外还包含目的蛋白或核酸的编码区,以及用于编码区表达的调控区。合成基因的结构和功能成分可以从不同原材料和/或多种原材料中并入。合成基因可以被外源性递送至受试者,其中与相应的内源性基因相比,它是外源性的。当在细胞中表达时,合成基因的产物可称为合成产物(例如,“合成的rna”或“合成的多肽”)。在某些条件下,合成基因也可互换地称为“转基因(transgene)”。
[0078]
如本文所用,术语“转基因的”和/或“转基因”是指含有包含一种或多种外源性核酸的基因的功能性编码区的核酸序列。外源性核酸可以稳定地整合到基因组内,使得该多核苷酸在连续细胞分裂时被传代。外源性核酸可以单独或作为重组表达盒的一部分整合到基因组中。“转基因的”可以用来指其基因型已经由于外源性核酸的存在而改变的任何物质。
[0079]
术语“反馈(feedback)”是指由于一种物质所执行的一些结果、效果或功能而被提供给该相同物质的分子编码信息。该物质可以是任何类型的小分子或大分子,包括但不限于基因或基因的转录产物或翻译产物如rna和蛋白质。术语“反馈环(feedback loop)”是指执行一种功能、效果和/或结果的分子的环,于是该功能、效果和/或结果的信息被返回到接收源。例如,一个基因(例如,mecp2)的表达的功能、效果和/或结果可以通过mirna(当这些mirna由于该基因的表达的功能、效果和/或结果而表达时)与衍生自该基因的mrna结合而产生反馈。反馈环可以是抑制性/负向的(即抑制进一步的功能、效果和/或结果的持续),或者是正向的(增强持续)。能够接收反馈的物质被称为“能够实现反馈(feedback

enabled)的”。取决于核酸的表达水平和/或功能或基因的转录产物或翻译产物的抑制和/或增强强度而可变的反馈可被称为“剂量依赖性”反馈和/或“剂量依赖性反馈环”。
[0080]
术语“多肽”、“肽”和“蛋白质”可互换地用来指任何长度的氨基酸的聚合物。术语“核酸”、“核酸序列”和“多核苷酸”可互换地用来指任何长度的核苷酸的聚合物。如本文所用,术语“核苷酸序列”、“多核苷酸”、“核酸序列”、“核酸分子”和“核酸片段”是指单链或双链的任选地含有合成的、非天然的和/或改变的核苷酸碱基的rna、dna或rna和dna的聚合物。
[0081]
如本文所用,术语“目的基因”或“目的核酸”和/或“目的蛋白”是指在特定环境条件下所需的基因/核酸/蛋白质。
[0082]
术语“调控元件”是指控制核酸序列表达的一些方面的遗传元件。例如,启动子是促进可操作连接的编码区的转录起始的调控元件。其他调控元件是剪接信号、多聚腺苷酸化信号、终止信号等。核酸序列或多核苷酸中存在一个或多个调控元件的区域称为“调控区”。
[0083]
如本文所用,术语编码区是指多核苷酸例如基因编码多肽的部分。
[0084]
如本文关于核酸所用的术语“可操作地连接(operably linked)”是指两个或更多个核酸之间的功能性连接。例如,启动子序列可以被描述为与异源核酸序列“可操作地连接”,因为启动子序列启动和/或介导异源核酸序列的转录。在一些实施方案中,可操作地连接的核酸序列是连续的和/或位于同一阅读框中。
[0085]
如本文所用,术语“结合位点”是指充当组分之间的结合位置的任何常规结构特征。当应用于核酸或多核苷酸时,术语“结合位点”可指但不限于一级、二级或三级结构的特定基序中的核苷酸序列,其中该基序提供相互作用分子的结合位置,该相互作用分子可包含其他核酸或蛋白质。当应用于肽、多肽或蛋白质时,术语“结合位点”可指但不限于一级、二级,三级或四级结构的特定基序中的氨基酸序列,其中该基序提供相互作用分子的结合位置,该相互作用分子可包含其他核酸或蛋白质。
[0086]
如本文所用,术语“种子匹配区”具体指较长内源性mrna序列内的核苷酸的子集,该子集根据经验鉴定为、已验证为或推定预测为识别相关的靶核苷酸序列,所述识别通过
mirna物质与含有所述种子匹配区的相应mrna的互补结合。术语“种子(seed)”或“种子区域(seed region)”是指较长的内源性mirna序列内的核苷酸的子集,该子集根据验鉴定为、已验证为或推定预测为对于该mirna物质识别并互补结合mrna物质的靶种子匹配区相关的核苷酸序列。通常,mrna的种子匹配区编码在其各自的3引发(3')非翻译区(3'utr)内,但可存在于其他位置。“验证的”或“经验鉴定的”种子匹配区被定义为本领域中当前已知的和将来鉴定的种子匹配区。“推定的”或“预测的”种子匹配区被定义为根据经验尚未被知晓或定义的种子匹配区。
[0087]
术语“5引发(5')侧翼序列”和/或“3'侧翼序列”是指在源序列内的目的序列(即,5'侧翼末端,和/或3'侧翼末端)的任一端上与指定序列(例如,种子匹配区)紧密邻接(即“挨着(neighboring)”)的序列中的核苷酸子集。在一些情况下,5'侧翼序列可能会提供额外的与匹配mirna的沃森

克里克(wc)互补结合。5'和3'侧翼序列一起促进种子匹配区间的间隔,通过两个或更多个mirna与相邻种子匹配区结合促进协作性抑制(grimson等人,2007)。5'和3'侧翼序列还可提供与有效种子匹配区相关的高腺苷酸

尿嘧啶核苷酸(au)%核苷酸背景(grimson等人,2007)。
[0088]
术语“3'utr”是指mrna紧跟着翻译终止密码子的部分。通常,mrna分子从dna序列转录,且随后被翻译成肽、多肽或蛋白质。mrna分子序列的几个区域,包括5'帽、5'非翻译区(5'utr)、3'utr和多聚腺苷酸化(polya)尾没有被翻译成蛋白质。通常,3'utr含有可以在转录后影响基因表达的调控区。
[0089]
如本文所用,术语“基因剂量敏感性的(gene

dose sensitive)”或“剂量敏感性的(dose sensitive)”疾病是指这样的疾病或病症,其中起始、表现、进展、症状、表型和其他相关现象是可变的,这种变化由参与疾病或病症的起始、表现、进展、症状、表型或其他相关现象的核酸(例如基因)或该基因的转录产物或翻译产物(例如rna物质或蛋白质)的相对功能性表达水平导致,并且与所述相对功能性表达水平相符。例如,如果疾病的表型随特定基因的不同表达水平而改变,则该疾病可被描述为剂量敏感性的。再举例,当基因突变以产生影响疾病的起始、表现、进展、症状、表型或其他相关现象的蛋白的功能减退或亢进时,该疾病也可称为剂量敏感性的。
[0090]
如本文所用,术语“智力障碍(intellectual ability disorder)”是指影响受试者的神经发育智力功能、心智能力、认知能力和/或适应功能,即受试者的包括推理、计划、思考和交流能力在内的“智力”的一组疾病、障碍或残疾。术语“智力障碍”可与“智力残疾(intellectual disability)”互换使用。可能与智力障碍一起存在的其他症状包括但不限于言语异常、癫痫发作、头小畸形、张力减退、磨牙症和/或刻板症。在其起始、表现、进展、症状、表型或其他相关现象方面变化的智力障碍可以被称为“剂量敏感性智力障碍”,并且它们的致病基因可以被称为“调节智力的剂量敏感性基因”。
[0091]
如本文所用,术语“靶组织”和“脱靶组织”是指受试者表达指定的目的核酸或蛋白的身体区域、器官、组织、结构和/或细胞。“靶组织”是受试者的那些区域、器官、组织、结构和/或细胞,其中在通常的健康和/或患病情况下表达目的内源性核酸或蛋白。“脱靶组织”是受试者的那些区域、器官、组织、结构和/或细胞,其中在典型的健康和/或患病情况下目的内源性核酸或蛋白不表达。
[0092]“载体”是指用作媒介物的化合物,以将外来遗传物质携带到另一个细胞中,在所
述另一个细胞中外来遗传物质可以被复制和/或表达。含有外源性核酸的克隆载体称为重组载体。核酸载体的实例是质粒、病毒载体、粘粒、表达盒和人工染色体。重组载体通常含有复制起点、多克隆位点和选择标记。核酸序列通常由插入片段(重组核酸或转基因)和作为载体“骨架”的较大序列组成。载体将遗传信息转移至另一细胞的目的通常是在靶细胞中分离、繁殖或表达插入片段。表达载体(表达构建体或表达盒)用于在靶细胞中表达外源性基因,并且通常具有驱动外源性基因表达的启动子序列。将载体插入靶细胞是指转化或转染细菌和真核细胞,但插入病毒载体通常称为转导。术语“载体”通常还可以用于描述用于将外来遗传物质携带到另一个细胞,例如但不限于转化的细胞或纳米颗粒的物品。
[0093]“药学上可接受的”是指无毒或在其他方面不是不希望的材料,即,可以将所述材料施用于受试者而不会引起任何不希望的生物学效应。
[0094]
如本文所用,术语“多核苷酸靶点盒(polynucleotide target cassette)”是指包含一个或多个预定种子匹配区以及挨着每个种子匹配区的5'和3'侧翼序列的核苷酸序列和/或核苷酸盒。可以通过适当选择种子匹配区来设计多核苷酸靶点盒,以在该盒被插入靶基因时防止具有不同遗传病因但具有共同靶组织的多种疾病共有的表型过表达的影响。多核苷酸靶点盒可包含任何数量的种子匹配区以及5'侧翼序列和3'侧翼序列。
[0095]
术语“治疗(treat、treating和treatment of)”(或语法上等同的术语)意指受试者病症的严重程度降低或至少部分改善或改进,和/或实现至少一种临床症状的部分缓解、减轻或减少,和/或存在病症进展的延缓和/或疾病或障碍发作的预防或延缓。
[0096]
如本文所用,术语“预防(prevent、prevents和prevention)”(及其语法等价物)是指延缓疾病或障碍的发作或减轻疾病或障碍发作时的症状。该术语并不意味着暗示疾病的完全消除,并且包括降低病症的发生率或延迟病症的发作和/或进展的任何类型的预防性治疗。
[0097]
本文所用的“治疗有效”量是足以为受试者提供一些改善或益处的量。或者,“治疗有效”量是将对受试者提供至少一种临床症状的部分缓解、减轻、降低或稳定的量。本领域技术人员将理解,治疗效果不一定是完全的或治愈性的,只要向受试者提供一些益处即可。
[0098]
如本文所用,“预防有效”量是相对于在不存在本发明方法时将发生的情况,足以阻止和/或延迟受试者中疾病、障碍和/或临床症状的发作,和/或足以减轻和/或延缓受试者中疾病、障碍和/或临床症状的发作严重性的量。本领域技术人员将理解,预防水平不一定是完全的,只要向受试者提供一些益处即可。
[0099]
术语“施用(administering和administration)”合成基因、表达盒、载体、质粒、病毒载体、转化的细胞、纳米颗粒或药物组合物至受试者包括向受试者导入或递送化合物以执行其预期功能的任何途径。施用可以通过任何合适的途径进行,包括口服、鼻内、肠胃外(静脉内、肌内、腹膜内、脑池内、鞘内、心室内或皮下)或局部。施用包括自身施用和他人施用。
[0100]
合成基因
[0101]
本发明涉及用于在靶组织中提供转基因表达之目的的能够实现反馈的合成基因、多核苷酸靶点盒、载体和药物组合物,该转基因表达能够被内源性调控以治疗例如剂量敏感性智力障碍等疾病。
[0102]
因此,本发明的一个方面涉及一种包括多核苷酸的合成基因,该多核苷酸包含编
码目的蛋白或核酸的编码区和一个或多个调控区,其中该多核苷酸还包含一个或多个核酸区段(nucleic acid segment),每个核酸区段包含被鉴定为内源性mirna结合位点的种子匹配区(seed match)以及挨着所述种子匹配区的5'侧翼序列和3'侧翼序列,其中所述一个或多个核酸区段被插入所述多核苷酸的调控区中,使得当合成基因被递送至表达内源性mirna的细胞时,目的蛋白或核酸的表达相对于不包含一个或多个核酸区段的合成基因被递送至表达内源性mirna的细胞时所述目的蛋白或核酸的表达降低。
[0103]
在一些实施方案中,编码目的核酸或蛋白的编码区包括基因或基因的活性片段的编码区,例如与智力基因剂量敏感性障碍相关的基因。与智力基因剂量敏感性障碍相关的基因包括但不限于tcf4、ube3a、dyrk1a、mef2c、nsd1、zeb2、mbd5、rps6ka3、atrx、mecp2、foxg1、akt3、slc6a1或其活性片段。在一些实施方案中,编码目的蛋白或核酸的编码区包括基因mecp2或其活性片段的编码区。
[0104]
种子匹配区可以是任意个核苷酸序列的长度,通常约3到约10个核苷酸,例如3、4、5、6、7、8、9、10或其中的任何范围。在一些实施方案中,本发明的种子匹配区的长度为约5至约10个核苷酸。在一些实施方案中,本发明的种子匹配的长度为约6至约8个核苷酸。
[0105]
本发明的合成基因可以含有一个或多个种子匹配区以及5'和3'侧翼序列。在一些实施方案中,合成基因包括至少两个种子匹配区,例如,至少2、3、4、5、6、7、8、9、10或更多个或其中的任何范围。在一些实施方案中,合成基因包括三个或更多个种子匹配区。在一些实施方案中,合成基因包括三个或更多个种子匹配区。在一些实施方案中,合成基因包括3至8个种子匹配区。在一些实施方案中,一些或全部种子匹配区位于3'utr中。
[0106]
5'侧翼核苷酸序列和/或3'侧翼核苷酸序列可以是任何长度,通常在指定序列(例如,种子匹配区)的5'和/或3'的每个末端上具有约1至约30个核苷酸。在一些实施方案中,本发明的侧翼核苷酸序列在指定序列(例如,种子匹配区)的5'和/或3'的每个末端上为约9至约13个核苷酸。在一些实施方案中,侧翼核苷酸序列在指定序列(例如,种子匹配区)的5'和/或3'的每个末端为约11个核苷酸。因此,在本发明的一些实施方案中,指定序列(例如,种子匹配区)的5'和3'侧翼序列的核苷酸总数为约7至约40个核苷酸,例如,约7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、或40个核苷酸或其中的任何范围。在一些实施方案中,特定序列(例如,种子匹配区)的5'和3'侧翼序列的核苷酸总数为约20至约25个核苷酸。在一些实施方案中,特定序列(例如,种子匹配区)的5'和3'侧翼序列的核苷酸总数为约22个核苷酸。在一些实施方案中,每个种子匹配区与下一个最接近的种子匹配区通过它们之间的3'和5'侧翼序列隔开。因此,在本发明的一些实施方案中,至少两个种子匹配区被约7至约40个核苷酸隔开。在一些实施方案中,至少两个种子匹配区被约20至约25个核苷酸隔开。在一些实施方案中,至少两个种子匹配区被约22个核苷酸隔开。
[0107]
本发明的种子匹配区以及5'和3'侧翼序列可以结合一种或多种mirna。在一些实施方案中,种子匹配区以及5'和3'侧翼序列与一种或多种mirna结合,该mirna包括mir

690、mir

124

3p、mir

451a、mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p、let
‑7‑
5p/98

5p、mir

29

3p、mir

338

3p、mir

98

5p、mir
‑7‑
5p、mir

494

3p或其任意组合。另外,尽管不希望受到理论的束缚,但是概念上可能的是,尚未被鉴定的mirna可能贡献于mecp2反馈环。含有允许特定mirna种子区与一个靶点组中的mirna种子匹配区之间的沃


克里克(wc)碱基配对的种子序列的任何mirna可帮助介导对外源性目标核酸或蛋白,即编码目标核酸或蛋白的编码区的产物的内源性调控。因此,在一些实施方案中,种子匹配区以及5'和3'侧翼序列与一种或多种mirna结合,该mirna包含允许本发明的mirna种子序列和种子匹配区之间的wc碱基配对的种子序列。在一些实施方案中,种子匹配区以及5'和3'侧翼序列结合以下mirna:mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p和let
‑7‑
5p。在一些实施方案中,种子匹配区以及5'和3'侧翼序列结合以下mirna:mir

690、mir

451a和let
‑7‑
5p。在一些实施方案中,种子匹配区以及5'和3'侧翼序列不结合以下mirna:mir

22、mir

19、mir

132和/或mir

124。在一些实施方案中,种子匹配区以及挨着该种子匹配区的侧翼5'和3'序列包含seq id no:1的核苷酸序列或与seq id no:1具有至少70%同一性(例如与seq id no:1具有至少约70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)、含有针对mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p和let
‑7‑
5p的种子匹配区的核苷酸序列、主要由上述核苷酸序列组成或由上述核苷酸序列组成。种子匹配区用下划线标出。
[0108]
seq id no:1.“reg2”的靶种子匹配区以及5'和3'侧翼序列
[0109][0110]
在一些实施方案中,种子匹配区以及挨着该种子匹配区的侧翼5'和3'序列包含seq id no:2的核苷酸序列或与seq id no:2具有至少70%同一性(例如至少约70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)的核苷酸序列、主要由其组成或由其组成,其含有针对mir

451a、let
‑7‑
5p和mir

690的种子匹配区。种子匹配区用下划线标出。
[0111]
seq id no:2.“reg1”的靶种子匹配区以及5'和3'侧翼序列
[0112][0113]
在一些实施方案中,本发明包括含有合成基因的载体。载体可以是用于将多核苷酸递送至细胞的任何合适的工具。在一些实施方案中,载体是质粒、病毒载体、表达盒、转化的细胞或纳米颗粒。
[0114]
在具体实施方案中,本发明提供一种药物组合物,其包含在药学上可接受的载体中的本发明的合成基因或载体。在一些实施方案中,本发明提供了一种药物组合物,其包含在药学上可接受的载体中的本发明的合成基因或载体、以及任选地其他药用试剂(medicinal agent)、药物(pharmaceutical agent)、稳定剂、缓冲剂、载体、佐剂、稀释剂等。对于注射,载体通常是液体。对于其他施用方法,载体可以是固体或液体。对于吸入施用,载体将是可吸入的,并且将优选为固体或液体颗粒形式。
[0115]
在具体实施方案中,本发明提供了一种用于向合成基因提供剂量依赖性抑制反馈的多核苷酸靶点盒,该盒包含一个或多个核酸片段,每个核酸片段包含被鉴定为内源性mirna的结合位点的种子匹配区以及挨着所述种子匹配的5'和3'侧翼序列。经由将多核苷
酸靶点盒插入合成基因的多核苷酸的调控区中,该盒可用来产生合成基因,从而提供对合成基因进行剂量依赖性抑制反馈的能力,其中能够结合多核苷酸靶点盒内提供的种子匹配区的mirna可调控合成基因的表达。
[0116]
多核苷酸靶点盒可包含任何数量的种子匹配区以及5'和3'侧翼序列。在一些实施方案中,多核苷酸包含至少两个种子匹配区以及5'和3'侧翼序列,例如2、3、4、5、6、7、8、9、10或更多个或其中的任何范围。在一些实施方案中,多核苷酸靶点盒包含三个或更多个种子匹配区以及5'和3'侧翼序列。在一些实施方案中,多核苷酸靶点盒包含3至8个种子匹配区以及5'和3'侧翼序列。在一些实施方案中,多核苷酸靶点盒包含结合一种或多种mirna的种子匹配区以及5'和3'侧翼序列,该mirna可帮助介导目的靶核酸或蛋白,即编码目的核酸或蛋白的编码区的产物的外源性调控,其中所述一种或多种mirna包含允许mirna种子序列与种子匹配区之间的wc碱基配对的种子序列。在一些实施方案中,多核苷酸靶点盒包含与选自以下的一种或多种mirna结合的种子匹配区以及5'和3'侧翼序列:mir

690、mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p、let
‑7‑
5p或其任意组合。在一些实施方案中,多核苷酸靶点盒包含结合以下mirna的种子匹配区以及5'和3'侧翼序列:mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p和let
‑7‑
5p。在一些实施方案中,多核苷酸靶点盒包含结合以下mirna的种子匹配区以及5'和3'侧翼序列:mir

690、mir

451a和let
‑7‑
5p。在一些实施方案中,多核苷酸靶点盒包含种子匹配区,其中所述种子匹配区的长度为约5至约10个核苷酸。在一些实施方案中,多核苷酸靶点盒包含种子匹配区,其中所述种子匹配区的长度为约6至约8个核苷酸。在一些实施方案中,所述多核苷酸靶点盒包含挨着种子匹配区的5'和3'侧翼序列,每个侧翼序列的长度为约9至约13个核苷酸。在一些实施方案中,多核苷酸靶点盒包含挨着种子匹配区的5'和3'侧翼序列,每个侧翼序列长度为约11个核苷酸。在一些实施方案中,多核苷酸靶点盒包含核苷酸序列seqidno:1或与seqidno:1具有至少70%同一性(例如至少约70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)的核苷酸序列、主要由上述核苷酸序列组成或由上述核苷酸序列组成的种子匹配区以及挨着该种子匹配区的5'和3'侧翼序列。在一些实施方案中,多核苷酸靶点盒包含核苷酸序列seqidno:2或与seqidno:2具有至少70%同一性(例如至少约70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性)的核苷酸序列、主要由上述核苷酸序列组成或由上述核苷酸序列组成的种子匹配区以及挨着种子匹配区的5'和3'侧翼序列。
[0117]
制备合成基因的方法
[0118]
本发明还提供了制备合成基因的方法,其中述合成基因表现出剂量依赖性抑制反馈。在一个实施方案中,本发明提供了一种制备包含多核苷酸的合成基因的方法,该多核苷酸包含编码目的蛋白或核酸的编码区和一个或多个调控区,该方法包括将本发明的多核苷酸靶点盒插入合成基因的调控区中的步骤。
[0119]
在一些实施方案中,本发明提供了将核酸区段插入合成基因的调控区中的方法。在一些实施方案中,本发明提供了将已知的或新鉴定的与目的mirna结合的种子匹配区插入到合成基因的多核苷酸的调控区中的方法。在一些实施方案中,本发明提供了一种制备合成基因的方法,其通过将多核苷酸靶点盒插入合成基因的多核苷酸的调控区中,从而提供对合成基因剂量依赖性抑制反馈的能力,其中能够结合多核苷酸靶点盒内提供的种子匹
配区的mirna可调控合成基因的表达。在一些实施方案中,本发明提供了一种制备合成基因的方法,包括将一个或多个包含种子匹配区以及5'和3'侧翼序列的核酸区段插入到合成基因的多核苷酸的调控区中的步骤。在一些实施方案中,该方法可包括去除在合成基因的多核苷酸的调控区内发现的一个或多个内源性种子匹配区。
[0120]
在一些实施方案中,插入合成基因中的种子匹配区以及5'和3'侧翼序列可以与在靶组织和/或脱靶组织中表达的mirna结合,从而对合成基因实现反馈,抑制合成基因在脱靶组织中的表达并提供合成基因在靶组织中的内源性调控。在一些实施方案中,本发明的合成基因不包括来自在脱靶组织中表达的mirna的种子匹配区以及5'和3'侧翼序列。在一些实施方案中,本发明的合成基因不包括针对以下mirna的种子匹配区以及5'和3'侧翼序列:mir

22、mir

19、mir

132和/或mir

124。
[0121]
在另一个实施方案中,本发明提供了制备合成基因的方法,该方法包括以下步骤:筛选mirna,该mirna在目的蛋白或核酸在细胞中表达时相对于该目的蛋白或核酸不表达时具有增加的表达;鉴定针对具有增加的表达的一种或多种mirna的种子匹配区和侧翼区;制备核酸区段,该核酸区段包含待插入到所述多核苷酸的调控区中的所述种子匹配区和侧翼区,将包含被鉴定为内源性mirna结合位点的种子匹配区以及挨着所述种子匹配的5'和3'侧翼序列的一个或多个核酸区段插入多核苷酸的调控区中,该多核苷酸包含编码目的蛋白或核酸的编码区和一个或多个调控区。
[0122]
在制备合成基因的方法的一些实施方案中,编码目的蛋白或核酸的编码区包含选自基因tcf4、ube3a、dyrk1a、mef2c、nsd1、zeb2、mbd5、rps6ka3、atrx、mecp2、slc6a1、foxg1、akt3或其活性片段的编码区。活性片段可以包括但不限于mecp2的活性片段,例如δn、δnc和/或δnic活性mecp2片段,其分别占全长mecp2的88%、52%和32%,但保留了甲基

cpg结合以及视黄酸和甲状腺激素受体相互作用的核受体共阻遏因子/沉默调节因子(ncor/smrt)的保守功能,以允许dna与ncor/smrt复合物的物理连接。这些活性片段是全长mecp2蛋白的截短物,其中δn包含在全长mecp2同种型e2的甲基cpg结合域(mbd,残基72

173)的n端处第13

71个残基的缺失,δnc包含额外的在ncor

smrt相互作用域(nid,残基272

312)的c端处第313

484个残基的缺失,且δnic另外用来自通过短柔性接头连接的sv40病毒的核定位信号替代了介于mbd和nid结构域之间的氨基酸,如tillotson等人所描述的(tillotson等人2017 nature 550(7676):398

401)),其公开内容通过引用全部并入本文。用于治疗rtt的mecp2的活性片段衍生自mecp2的e1同种型。按照惯例,本文所述的氨基酸编号基于mecp2 e2同种型氨基酸序列。
[0123]
在一些实施方案中,编码目的蛋白或核酸的编码区包含基因mecp2或其活性片段的编码区。在一些实施方案中,上述一个或多个核酸区段与选自由以下组成的组的一种或多种mirna结合:mir

690、mir

124

3p、mir

451a、mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p、let
‑7‑
5p/98

5p和mir

494

3p。在一些实施方案中,种子匹配区以及5'和3'侧翼序列结合以下mirna:mir
‑9‑
5p、mir

26

5p mir

23

3p、mir

218

5p、mir

27

3p和let
‑7‑
5p。在一些实施方案中,种子匹配以及5'和3'侧翼序列以下mirna结合:mir

690、mir

451a和let
‑7‑
5p。
[0124]
在另一方面,本发明提供了一种鉴定待插入合成基因的一个或多个种子匹配区以及5'和3'侧翼序列的方法,包括以下步骤:鉴定针对一种或多种mirna的种子匹配区以及5'
和3'侧翼序列,该mirna在目的蛋白或核酸在细胞中表达时相对于该目的蛋白或核酸在细胞中不表达时具有增加的表达;以及将所述种子匹配区以及5'和3'侧翼序列插入包含多核苷酸的合成基因的调控区中,该多核苷酸包含编码目的蛋白或核酸的编码区和一个或多个调控区。在一些实施方案中,鉴定待插入合成基因中的一个或多个种子匹配区以及5'和3'侧翼序列的方法另外包括以下步骤:在细胞中表达目的蛋白或核酸;从细胞中收集mirna;以及计算所述mirna在所述目的蛋白或核酸在细胞中表达时相对于该目的蛋白或核酸在细胞中不表达时的表达水平,从而创建所述mirna的核酸数据集。在一些实施方案中,该鉴定方法可以包括筛选核酸数据集(例如,预先存在的数据集)中在目的蛋白或核酸在细胞中表达时相对于该目的蛋白或核酸在细胞中不表达时具有增加的表达的mirna,和/或鉴定在目的蛋白或核酸在细胞中表达时相对于该目的蛋白或核酸在细胞中不表达时具有增加的表达的mirna,和/或筛选核酸数据集以获得已验证的或推定的种子匹配区以及5'和3'侧翼序列。
[0125]
如本文所用,术语“数据集(dataset)”是指从实验或计算分析获得的相关信息集(即数据)的集合,包括任何类型的数据,包括但不限于核酸序列或氨基酸序列。数据集可以根据由每个特定数据集所定义的可变参数来筛选和/或以其他方式搜索感兴趣的特定数据。在一些实施方案中,数据集是核酸数据集,即,包括核酸序列的数据集。在一些实施方案中,数据集是3'utr数据集。
[0126]
在一些实施方案中,目的蛋白或核酸是选自以下基因:tcf4、ube3a、dyrk1a、mef2c、nsd1、zeb2、mbd5、rps6ka3、atrx、slc6a1、foxg1、akt3、mecp2或其活性片段的转录或翻译产物。在一些实施方案中,目的蛋白或核酸是基因mecp2或其活性片段的转录或翻译产物。
[0127]
使用合成基因的方法
[0128]
在本发明的另一方面,提供了一种递送合成基因的方法,该方法包括向受试者施用本发明的合成基因、载体和/或药物组合物,从而向受试者递送合成基因。
[0129]
在本发明的另一方面,提供了一种治疗与靶组织中内源性基因的异常表达或靶组织中由内源性基因编码的突变蛋白的表达相关的疾病的方法,该方法包括施用编码由内源性基因编码的目的蛋白或核酸的本发明的合成基因、载体和/或药物组合物从而治疗所述疾病。在一些实施方案中,本发明可被施用至靶组织。在一些实施方案中,本发明可被施用靶组织和脱靶组织,从而抑制合成基因在脱靶组织中的表达并内源性调控合成基因在靶组织中的表达。
[0130]
在一些实施方案中,治疗疾病的方法还可包括基因敲减和/或敲除受试者中编码目的蛋白或核酸的内源性基因的步骤。在一些实施方案中,编码目的蛋白或核酸的内源性基因是mecp2。可以用本领域现在或以后鉴定的任何已知技术或方法来执行“基因敲减(knocking down、knock down of)”或“基因敲除(knocking out、knock out of)”内源性基因,包括但不限于使用rnai、转录激活子样效应子和核酸酶(tale和talen)、或规律成簇的间隔短回文重复(crispr

cas9)方法向表达内源性基因的受试者、组织和/或细胞中导入匹配的shrna、tale或talen、或crispr/cas9表达载体,从而相对于未经rnai、tale、talen或crispr/cas9处理的内源性核酸或蛋白的表达,去除或减少目的内源性核酸或蛋白的表达。这些技术和其他技术综述于boettcher和mcmanus 2015mol.cell 58(4):575

585以及以下
美国专利中:qin等人的第7,195,916号、voytas等人的第8,440,431号、zhang等人的第8,889,356号、cong等人的第8,871,445号和doudna等人的第10,000,772号,其全部内容通过引用整体并入本文。
[0131]
在本发明的另一个实施方案中,提供了一种治疗受试者中与内源性基因的异常表达或由内源性基因编码的突变蛋白的表达相关的疾病的方法,该方法包括以下步骤:在受试者的细胞中基因敲减内源性基因,以及施用编码由内源性基因编码的目的蛋白或核酸的本发明的合成基因、载体、药物组合物,从而治疗疾病。
[0132]
术语“患者”、“受试者”、“个体”等在本文可互换使用,并且是指无论是体外还是原位适合本文所述方法的任何动物或其细胞。在优选的实施方案中,患者、受试者或个体是哺乳动物。在一些实施方案中,哺乳动物是小鼠、大鼠、豚鼠、非人灵长类动物、狗、猫或驯养动物(例如马、母牛、猪、山羊、绵羊)。在一些实施方案中,患者、受试者或个体是人。在一些实施方案中,患者、受试者或个体处于患智力基因剂量敏感性障碍的风险。在一些实施方案中,患者、受试者或个体处于患雷特综合征(rett syndrome)的风险。作为另外的选择,受试者可以是实验动物和/或疾病动物模型。
[0133]
本发明的另一方面涉及一种在有需要的受试者中治疗与目的核酸或蛋白的异常表达相关的疾病的方法,包括向受试者递送治疗有效量的本发明的合成基因、载体和/或药物组合物,从而治疗受试者中与目的核酸或蛋白的异常表达相关的病症。
[0134]
在一些实施方案中,目的核酸或蛋白与智力基因剂量敏感性障碍有关。与基因剂量敏感性智力障碍相关的目的核酸或蛋白包括但不限于tcf4、ube3a、dyrk1a、mef2c、nsd1、zeb2、mbd5、rps6ka3、atrx、foxg1、akt3、slc6a1、mecp2或任何其活性片段。
[0135]
智力基因剂量敏感性障碍包括但不限于雷特综合征、mecp2重复综合征、天使人综合征、dup15q、dyrk1a单倍体不足、唐氏综合征、mef2c单倍体不足综合征、dup5q14.3、小儿巨脑畸形综合征、反向小儿巨脑畸形综合征、α

地中海贫血x连锁的智力障碍综合征、xq13.2q21.1重复、科

勒综合征、xp22.12重复、皮特

霍普金斯综合征、mowat

wilson综合征、2q22.3三倍重复、2q23.1重复、2q23.1微缺失、foxg1综合征、west综合征、巨脑

多小脑回

多指/趾

脑积水综合征、akt3重复、doose综合征、slc6a1重复和18三体综合征(trisomy 18)。在一些实施方案中,目的核酸或蛋白是mecp2或任何其活性片段,以及与mecp2相关的智力基因剂量敏感性障碍是雷特综合征和/或mecp2重复综合征。
[0136]
在某些实施方案中,将合成基因、载体和/或药物组合物递送至受试者,例如全身(例如静脉内)或直接递送至受试者的中枢神经系统(例如通过鞘内、脑池内或脑室内注射递送至脑脊液)。在一些实施方案中,合成基因、载体和/或药物组合物通过选自肠内、肠胃外、鞘内、脑池内、脑内、心室内、鼻内、耳内、眼内、眼周、直肠内、肌内、腹膜内、静脉内、口服、舌下、皮下和透皮中的递送途径来递送。在一些实施方案中,合成基因、载体和/或药物组合物通过静脉内递送。在一些实施方案中,合成基因、载体和/或药物组合物通过静脉内、脑池内、鞘内和/或脑室内递送以直接递送至脑脊液(“intracsf”)。
[0137]
本发明的一个方面是在体外将合成基因转移至细胞的方法。本发明的合成基因和/或载体可以以适当的量导入细胞。在病毒载体的实施方案中,根据适合特定靶细胞的标准转导方法可以将病毒载体以适当的感染复数导入细胞。施用的病毒载体或衣壳的滴度可以根据靶细胞类型和数量以及具体的病毒载体或衣壳而变化,并且可以由本领域技术人员
确定,而不需要过多的实验。在具体实施方案中,向细胞导入至少约102个感染单位,更优选至少约102、103、104、105、106、107、108、109、10
10
、10
11
、10
12
或10
13
个感染单位。
[0138]
可以导入本发明的合成基因和/或载体(例如病毒载体)的细胞可以是任何类型的细胞,包括但不限于神经细胞(包括外周和中枢神经系统的细胞,特别是脑细胞如神经元、少突胶质细胞、神经胶质细胞、星形胶质细胞)、肺细胞、眼部细胞(包括视网膜细胞、视网膜色素上皮细胞和角膜细胞)、上皮细胞(例如肠道和呼吸道上皮细胞)、骨骼肌细胞(包括成肌细胞、肌管和肌纤维)、膈肌细胞、树突细胞、胰腺细胞(包括胰岛细胞)、肝细胞、胃肠道细胞(包括平滑肌细胞、上皮细胞)、心脏细胞(包括心肌细胞)、骨细胞(例如骨髓干细胞)、造血干细胞、脾细胞、角质形成细胞、成纤维细胞、内皮细胞、前列腺细胞、关节细胞(包括例如软骨、半月板、滑膜和骨髓)、生殖细胞等。或者,细胞可以是任何祖细胞。作为进一步的替代方案,细胞可以是干细胞(例如,神经干细胞、肝干细胞)。此外,如以上指示的细胞可以来自任何物种来源。
[0139]
本发明的合成基因或载体(例如病毒载体)可以在体外导入细胞以用于将修饰的细胞施用于受试者的目的。在具体的实施方案中,已经从受试者中取出细胞,将本发明的合成基因和/或载体(例如病毒载体)导入其中,然后将细胞放回受试者中。从受试者中取出细胞以便离体处理,然后再导入受试者中的方法是本领域已知的(参见,例如,美国专利第5,399,346号)。或者,将本发明的合成基因和/或载体(例如,病毒载体)导入来自另一受试者的细胞中、导入培养的细胞中、或导入来自任何其他合适来源的细胞中,并且将所述细胞施用给需要其的受试者。
[0140]
用于离体基因治疗的合适细胞如上所述。施用给受试者的细胞剂量将根据受试者的年龄、状况和物种、细胞类型、细胞表达的核酸、施用方式等而变化。典型地,在药学上可接受的载体中施用每剂量至少约102至约108或约103至约106个细胞。在具体实施方案中,将有效量的用载体转导的细胞与药物载体的组合施用于受试者。
[0141]
人类受试者包括新生儿、婴儿、青少年和成人。任选地,受试者“需要”本发明的方法,例如,因为受试者患有或被认为处于患包括本文所述的那些疾病的风险或将受益于包括本文所述的那些合成基因的递送。
[0142]
在某些实施方案中,例如,一旦诊断出受试者的目的核酸或蛋白表达或活性异常,就尽可能早地在有此需要的受试者的生命中施用本发明的合成基因。在一些实施方案中,例如,在新生儿筛查确定目标核酸或蛋白的异常表达或活性后,将合成基因施用于新生儿。在一些实施方案中,例如,在产前筛查确定异常表达或活性后,将合成基因施用于子宫内的胎儿。在一些实施方案中,一旦受试者显现出与目的核酸或蛋白的异常表达或活性相关的症状,或被怀疑或诊断为具有目的核酸或蛋白的异常表达或活性,就将合成基因施用于受试者。在一些实施方案中,在受试者显现出与目的核酸或蛋白的异常表达或活性相关的症状之前,就将合成基因施用于受试者,例如,受试者被怀疑或诊断为具有异常表达或活性但尚未开始表现出症状。
[0143]
本发明的另一方面是将本发明的合成基因、载体和/或药物组合物(例如本发明的合成基因)递送至受试者的方法。在具体实施方案中,该方法包括向动物受试者递送合成基因的方法,该方法包括:向动物受试者施用有效量的根据本发明的合成基因。可以通过本领域已知的任何方法将本发明的合成基因施用于有此需要的人受试者或动物。任选地,合成
基因和/或载体的有效剂量在药学上可接受的载体中递送。
[0144]
待施用至受试者的载体的剂量将取决于施用方式、待治疗的疾病或病症、受试者个体的状况、特定病毒载体和待递送的核酸,并且可以以常规方式确定。在病毒载体的实施方案中,达到治疗效果的示例性剂量的病毒滴度是至少约102、103、104、105、106、107、108、109、10
10
、10
11
、10
12
、103、10
14
、10
15
、10
16
个转导单位或更多。剂量和病毒滴度转导单位可计算为载体或病毒基因组(vg)。
[0145]
在具体的实施方案中,可以采用多于一次施用(例如,两次、三次、四次或更多次施用)以跨不同的时间间隔(例如,每天、每周、每月、每年等)实现期望的基因表达水平。
[0146]
示例性的施用方式包括口服、直肠、经粘膜、局部、鼻内、吸入(例如经由气雾剂)、含服(例如舌下)、阴道、鞘内、眼内、透皮、子宫内(或卵内)、肠胃外(例如静脉内、皮下、皮内、肌内[包括施用至骨骼、隔膜和/或心肌]、真皮内、胸膜内、脑内和关节内)、局部(例如施用至皮肤和粘膜表面,包括气道表面和经皮施用)、淋巴内等,以及组织或器官直接注射(例如,注射至肝脏、骨骼肌、心肌、膈肌或脑)。也可以向肿瘤施用(例如肿瘤内或肿瘤附近或淋巴结内或淋巴结附近)。在任何给定情况下,最合适的途径将取决于所治疗病症的性质和严重程度以及所使用的特定载体的性质。
[0147]
在一些实施方案中,将载体施用至cns、外周神经系统或两者。
[0148]
在一些实施方案中,将载体直接施用至cns,例如脑或脊髓。直接施用可以导致高特异性地转导cns细胞,例如,其中至少80%、85%、90%、95%或更多的被转导的细胞是cns细胞。可以使用本领域已知的将载体直接施用至cns的任何方法。可将载体导入脊髓、脑干(延髓、脑桥)、中脑(下丘脑、丘脑、上丘脑、垂体、黑质、松果体)、小脑、端脑(纹状体、大脑,包括枕叶、颞叶、顶叶和额叶、皮质、基底核、海马和杏仁核)、边缘系统、新皮质、纹状体,大脑和下丘。还可以将载体施用至眼部的不同区域,例如视网膜、角膜或视神经。可以将载体递送至脑脊液(例如,通过腰椎穿刺)以更分散地施用载体。
[0149]
可以通过本领域已知的任何途径将载体施用至cns的期望区域,该途径包括但不限于鞘内、脑内、心室内、鼻内、耳内、眼内(例如,玻璃体内、视网膜下、前房)和眼周(例如,眼球筋膜下区域(sub

tenon's region))递送或其任意组合。
[0150]
递送载体可以以对组织(包括cns、外周神经系统和/或其他组织)产生更广泛、弥散转导的方式施用。
[0151]
通常,载体将在液体制剂中通过直接注射(例如,立体定向注射)施用至cns和/或其他组织中的期望区域或区室。在一些实施方案中,载体可以通过储液器(reservoir)和/或泵递送。在其他实施方案中,载体可以通过局部应用于所需区域或通过鼻内施用气雾剂制剂来提供。可通过局部施用液滴来施用至眼部或施用至耳内。作为进一步的替代方案,载体可以作为固体缓释制剂施用。例如,国际专利公布wo 01/91803描述了细小病毒和aav载体的控制释放。
[0152]
可以以常规形式(作为液体溶液或悬浮液、适于在注射前溶解或悬浮在液体中的固体形式、或作为乳剂)来制备注射剂。或者,可以以局部而不是全身的方式,例如以贮库或缓释制剂的形式施用载体。此外,可以将干燥的病毒载体递送至手术可植入的基质,例如骨移植物替代物、缝合线、支架等(例如,如美国专利第7,201,898号中描述的)。
[0153]
适于口服施用的药物组合物可以以独立的单位存在,例如胶囊剂、扁囊剂、锭剂或
片剂,其各自含有预定量的本发明组合物;粉末或颗粒;在水性或非水性液体中的溶液或悬浮液;或水包油或油包水乳液。可以通过将本发明的病毒载体复合到能够耐受动物肠道中的消化酶降解的载体上来进行口服递送。这类载体的实例包括本领域已知的塑料胶囊或片剂。这类制剂通过任何合适的制药方法制备,该方法包括使组合物与合适的载体(其可含有一种或多种如上所述的辅助成分)缔合的步骤。通常,通过将组合物与液体或细碎的固体载体或两者均匀且紧密地混合,并且随后如果需要,使所得混合物成形来制备根据本发明的实施方案的药物组合物。例如,可通过任选地与一种或多种辅助成分一起压缩或模制含有该组合物的粉末或颗粒,来制备片剂。通过在合适的机器中压缩自由流动形式的组合物,例如任选地与粘合剂、润滑剂、惰性稀释剂和/或表面活性剂/分散剂混合的粉末或颗粒来制备压缩片剂。通过在合适的机器中模制用惰性液体粘合剂润湿的粉末状化合物来制备模制片剂。
[0154]
适于含服(舌下)施用的药物组合物包括:锭剂,其在调味基质(通常为蔗糖和阿拉伯胶或黄蓍胶)中包含本发明的组合物;以及软锭剂(pastille),其在惰性基质如明胶和甘油或蔗糖和阿拉伯胶中包含所述组合物。
[0155]
适于肠胃外施用的药物组合物可以包含本发明组合物的无菌水性和非水性注射溶液,该制剂任选地与预期接受者的血液等渗。这些制剂可以含有抗氧化剂、缓冲剂、抑菌剂和溶质,其使得组合物与预期接受者的血液等渗。水性和非水性无菌悬浮液、溶液和乳液可包括悬浮剂和增稠剂。非水性溶剂的实例是丙二醇、聚乙二醇、植物油例如橄榄油、以及可注射的有机酯如油酸乙酯。水性载体包括水、醇/水溶液,乳液或悬浮液,包括盐水和缓冲介质。肠胃外载体包括氯化钠溶液、林格氏葡萄糖、右旋糖和氯化钠、乳酸化林格氏液或不挥发性油。静脉内载体包括流体和营养补充剂、电解质补充剂(例如基于林格氏右旋糖的那些)等。还可以存在防腐剂和其他添加剂,例如抗微生物剂、抗氧化剂、螯合剂和惰性气体等。
[0156]
组合物可以存在于单位/剂量或多剂量容器中,例如密封的安瓿和小瓶中,并且可以储存在冷冻干燥(冻干)条件下,仅需要在临使用前添加无菌液体载体,例如盐水或注射用水。
[0157]
临时注射溶液和悬浮液可以由前述种类的无菌粉末、颗粒和片剂制备。例如,可以提供在密封容器中的单位剂型形式的本发明的可注射的、稳定的、无菌的组合物。该组合物可以以冻干物的形式提供,该冻干剂可以用合适的药学上可接受的载体重构以形成适于注射到受试者中的液体组合物。该单位剂型可以是约1μg至约10g的本发明的组合物。当组合物基本上不溶于水时,可以包括足够量的生理学上可接受的乳化剂,以在水性载体中乳化该组合物。一种这样的有用的乳化剂是磷脂酰胆碱。
[0158]
适于直肠施用的药物组合物可以作为单位剂量的栓剂存在。这些可以通过将组合物与一种或多种常规固体载体例如可可脂混合,然后使所得混合物成形来制备。
[0159]
适于局部施用于皮肤的本发明的药物组合物可以采取软膏、霜剂、洗剂、糊剂、凝胶剂、喷雾剂、气雾剂或油的形式。可使用的载体包括但不限于凡士林、羊毛脂、聚乙二醇、醇、透皮增强剂及其两种或更多种的组合。在一些实施方案中,例如,可以通过将本发明的药物组合物与能够进入皮肤的亲脂性试剂(例如,dmso)混合来进行局部递送。
[0160]
适于经皮施用的药物组合物可以是适于与受试者的表皮保持长时间紧密接触的
独立贴剂的形式。适用于经皮施用的组合物也可以通过离子电渗递送(参见,例如,pharm.res.3:318(1986))且通常采用本发明组合物的任选缓冲水溶液的形式。合适的制剂可以包括柠檬酸盐或bis\tris缓冲液(ph 6)或乙醇/水。
[0161]
本文公开的载体可以通过任何合适的方式施用至受试者的肺,例如,通过施用包含载体的可吸入颗粒的气溶胶混悬液(受试者吸入该气溶胶混悬液)。该可吸入颗粒可以是液体或固体。包含病毒载体的液体颗粒的气溶胶可以通过任何合适的方式产生,例如使用本领域技术人员已知的压力驱动的气溶胶喷雾器或超声雾化器。参见,例如,美国专利第4,501,729号。包含载体的固体颗粒的气溶胶同样可以通过制药领域已知的技术用任何固体颗粒药物气雾剂发生器产生。
[0162]
在已经描述了本发明的情况下,将在以下实施例中更详细地解释本发明,这些实施例包括在本文中仅仅用于说明的目的,而不意图限制本发明。
实施例
[0163]
实施例1:通过mecp2表达上调的mirna的鉴定
[0164]
为鉴定mecp2超生理性表达上调的内源性mirna,对来自用毒性剂量的mecp2载体处理的小鼠的小脑和延髓rna进行筛选。向mecp2 /y和mecp2

/y小鼠脑池内注射盐水或1
×
10
12
的aav9/mep426

hmecp2

myc

rdh1pa载体基因组(vg)(出生后第28天[pnd28];10μl注射体积;n=2只小鼠/处理)。处理后2周,用致死剂量的三溴乙醇使小鼠安乐死。解剖小脑和脑干,在干冰上冷冻,并且立即转移至

80℃储存。使用qiagen mirneasy mini试剂盒从解冻的小脑和脑干中纯化总rna(合并)。将纯化的rna储存在

80℃并且随后在干冰上运输至lc科学公司以便筛选(微阵列部件编号mra

1002;mirbase 21版)。
[0165]
原始数据由lc sciences根据其技术公报(sciences,l.microrna microarray data analysis()进行处理。在初步研究中使用的小样本量排除了仅基于治疗组之间的统计学显著差异的阳性击中物的鉴定。因此,为了改善统计功效,对所有3个mecp2( )组(即,病毒处理的mecp2

/y小鼠以及盐水和病毒处理的mecp2 /y小鼠)的数据进行汇总,然后计算统计显著性。在mecp2( )小鼠中具有升高的水平的10种中度至高度表达的mirna中,一种mirna(mir

494

3p)在内源性mecp2 3'utr中具有靶点(targetscan.org;agarwal等人2015elife(4);小鼠和人),提示体内可能存在mecp2和mir

494

3p介导的负反馈环。此外,在mecp2 /y和mecp2

/y小鼠中,归一化的信号强度在mir

494

3p表达增加和外源性mecp2表达增加之间表现出引人注目的趋势。
[0166]
实施例2:因mecp2表达被上调的另外的mirna的鉴定
[0167]
将mep426

hmecp2

myc

rdh1pa病毒基因组中的3个mirna靶(即mir

22

3p、mir

19

3p和mir

132

3p)替换为mir

494

3p的靶序列(sinnett等人,2017mol.ther.methods clin.dev.(5):106

115;gadalla等人,2017mol.ther.methods clin.dev.(5):180

190))。然后将修饰的病毒基因组包装到aav9中,并注射到嵌合mecp2

egfp

融合/空雌性小鼠的脑池内。与在邻近的mecp2

egfp空细胞中观察到的反应相比,响应于mecp2

egfp表达的转基因表达略有降低(图8)。
[0168]
实施例3:上调的mirna的大规模筛选
[0169]
完成大规模筛选以解决上述初步研究的限制。更具体地,加入另外的对照组,处理
更多的小鼠,并将脑部区域精细解剖(未合并),然后进行rna纯化。用盐水,1x10
12
vg aav9/mep426

hmecp2

myc

rdh1pa,或1x10
12
vg aav9/cbh

egfp(pnd p28

p35;10μl注射体积;n=3只小鼠/处理)对mecp2 /y和mecp2

/y小鼠进行脑池内注射。处理后2

3周,用致死剂量的三溴乙醇使小鼠安乐死。解剖脊髓、小脑和脑干,在干冰上冷冻,并且立即转移至

80℃储存。然后用qiagen mirneasy mini kit从解冻的组织中纯化总rna。在rna纯化之前不合并所述脑部区域。将rna储存在

80℃并且之后在干冰上运输至lc sciences以便筛选(微阵列部件编号mra

1002;mirbase 21版)。
[0170]
原始数据由lc sciences根据其技术公报进行处理。鉴定了与内源性mecp2、aav9/mecp2或aav9/egfp处理相关而被显著上调的mirna(图2

7)。mmu

let

7e

5p、mmu

mir

451a和mmu

mir

690与外源性和内源性mecp2相关的平均表达水平增加最频繁;而遍布mecp2 /y和mecp2

/y小鼠的组织类型,与aav9/egfp相关的增加最不频繁。
[0171]
对所有处理组(mecp2(

)与mecp2( ))的分析显示,在至少一种组织类型中,mecp2表达显著上调了其他mirna(图9)。关于mir

690,mecp2(

)组和mecp2( )组的颈髓之间存在显著差异,而盐水处理的ko和wt小鼠的髓质之间也存在显著差异。关于mir

451a,mecp2(

)和mecp2( )组的髓质之间存在显著差异,而盐水处理的ko和wt小鼠的颈髓之间也存在显著差异。关于let

7e5p,mecp2(

)组和mecp2( )组的颈髓之间存在显著差异,而盐水处理的ko和wt小鼠的颈髓之间也存在显著差异。考虑到相对表达水平和可能掩盖显著性的潜在异常数据点,对于小脑,let

7e

5p可能是合理的靶点。将这三个靶点(mir

690、mir

451a和let

7e

5p)添加至mep426

δnic

rdh1pa。关于mir

124

3p,其在所有mecp2( )组的颈髓中较低,并且这与先前用盐水处理的ko和wt小鼠的颈髓中对其的分析一致。尽管存在这种相反的关系,但在整个大脑中相对高的表达意味着该靶点可能对于加帽表达(capping expression)是合理的,与注射途径无关。对于mir

132

3p,其仅在聚合分析中发现在髓质中上调。mir

124

3p和mir

132

3p是rdh1pa中已公布的靶基因。mir
‑9‑
5p、mir

26b

5p、mir

23a

3p、mir

218

5p和mir

27a

3p(以及let

7e

5p)是通用组(universal panel)的一部分。对于mir
‑9‑
5p和mir

27a

3p,它们仅在聚合分析中在颈髓中上调。关于mir

26b

5p,mecp2(

)组和mecp2( )组的颈髓之间存在显著差异,而盐水处理的ko和wt小鼠的颈髓之间也存在显著差异。图9的大多数mirna通常以高于mir

494

3p的水平表达,表明新的组设计可以产生对转基因表达的更稳健的抑制。
[0172]
利用筛选数据设计2种类型的mirna靶点组。如实施例4中进一步描述的,第一组结合了表达水平与体内mecp2表达关联性地增加的mirna。第二组设计描述如下。
[0173]
筛选来自盐水处理的小鼠和病毒处理的小鼠的rna样品以鉴定mecp2驱动的在中枢神经系统(cns)中表达的mirna。将这些mirna的靶点插入mecp2病毒基因组的3'utr允许使用内源性rna干扰机制来减弱体内外源性mecp2的毒性过表达(图1)。利用近期筛选的数据设计2种类型的mirna靶点组。第一组结合了表达水平与体内mecp2表达关联性地增加的mirna。第二组设计包括由文献和实验数据证明的靶点。重要的是,第二组中的靶点在介导智力的许多剂量敏感性基因的3'utr中是保守的。因此,该组对于在雷特综合征(rtt)以及其他神经发育障碍的小鼠模型中测试可能是理想的,并且可以在治疗环境中介导改善的转基因反馈调控。
[0174]
下面列出了完整的组序列。种子匹配区加下划线;每隔一个,种子匹配区和侧翼序
列区段是斜体的。结合位点关键区(binding site key)(按5'

3'顺序)mir
‑9‑
5p;mir

26

5p;mir

23

3p;mir

218

5p;mir

27

3p;let
‑7‑
5p:
[0175][0176]
许多以智力障碍为特征的神经发育障碍是由必须严格调控的基因中的突变介导的(参见表1)。这些基因的3'utr之间的相似性表明,不管遗传病因如何,可能存在一种体内抑制机制来帮助保护大脑免受过表达引起的智力障碍(参见表2)。
[0177]
表1.所选的介导以智力障碍为特征的疾病的剂量敏感性基因
[0178][0179]
介导相似表型(例如,智力障碍、言语异常、癫痫发作、头小畸形和/或刻板症)的缺失和相互重复障碍(deletion and reciprocal duplication disorders)包括但不限于表1中列出的那些。这些重复障碍的严重表型证明需要广泛适用的mirna靶点组来调控基因治疗后转基因的表达。
[0180]
描述表1中的缺失或突变障碍的人类和动物模型的参考文献:tcf4(agarwal 2015;dean l.2012 medical genetics summaries,bethesda md;sweetser等人1993genereviews((r)),seattle wa;de winter等人2016orphanet j.rare dis.11:37);mecp2(leonard等人2017 nat.rev.neurol.13(1):37

51;chahil and bollu 2018 statpearls:treasure island fl;seltzer and paciorkowski 2014 am.j.med.genet.c.semin.med.genet.166c(2):140

155;fuertes

gonzales等人2011 med.oral patol.oral cir.bucal.16(1):e37

41);ube3a(dagli等人1993 genereviews((r)):seattle wa;pelc等人2008neuropsychiatr.dis.treat.4(3):577

584;pelc等人2008 sleep med.9(4):434

441);dyrk1a(luco等人2016 bmc med.genet.17:15);mef2c(vrecar等人2017 j.pediatr.genet.6(3):129

141);nsd1(tatton

brown等人1993genereviews((r)):seattle wa);atrx(stevenson r.e.1993genereviews((r)):seattle wa;bouazzi等人2016 indian j.med.res.143(1):43

48);rps6ka3(miyata等人2018 brain dev.40(7):566

569;morino等人2016 medicine(baltimore)95(31):e4468;touraine等人2002eur.j.pediatr.161(4):179

187;tos等人2015 genet.couns.26(1):47

52);mbd5
(talkowski等人2011 am.j.hum.genet.89(4):551

563);zeb2(hegarty等人2015 prog.neurobiol.132:81

95)。
[0181]
描述表1中人和动物的过表达(单基因或多基因)模型的参考文献:18三体综合征(roberts等人2016 clin.anat.29(5):628

632;de queiroz等人2007j.dent.child(chic)74(1):67

72);mecp2重复综合征(miguet等人2018j.med.genet.55(6):359

371);dup15q(finucane等人1993genereviews((r)):seattle wa;copping等人2017 hum.mol.genet.26(20):3995

4010;wegiel等人2012 j.neuropathol.exp.neurol.71(5):382

397);唐氏综合征(duchon and herault 2016 front.behav.neurosci.10:104;kent and vorperian 2013 j.speech lang.hear.res.56(1):178

210;araujo等人2015 epilepsy behav.53:120

125;guedj等人2012 neurobiol.dis.46(1):190

203;carter等人2008 neuroreport 19(6):653

656);dup5q14.3(cesaretti等人2016 am.j.med.genet.a 170a(5):1352

1357);反向小儿巨脑畸形综合征(rosenfeld等人2013 mol.syndromol.3(6):247

254);xq13.2q21.1(lugtenberg等人2009 am.j.med.genet.a 149a(4):760

766;berube等人2002 hum.mol.genet.11(3):253

261);xp22.12(matsumoto等人2013 j.hum.genet.58(11):755

757;tejada等人2011 pediatrics128(4):e1029

1033);2q23.1重复(mullegama等人2014 eur.j.hum.genet.22(1):57

63);2q22.3三倍重复(yuan等人2015 mol.cytogenet.8:99)。
[0182]
表2所选介导智力的基因的3'utr中常见mirna靶点的所选列表
[0183][0184]
内源性3'utr中的靶点的完整列表可以在targetscan.org.找到。在表2的每个单元格中,列出了两个物种(人类/小鼠)的context 百分位数得分。高分表示具有有利的基因组背景(genomic context)的靶点。合成组包括被预测结合以上列出的许多内源性3'utr的mirna的靶点。在所选择的6个靶点中,4个靶点应结合mirna(mir
‑9‑
5p、mir

26b

5p、mir

27

3p和let
‑7‑
5p),这些mirna表现出与mecp2表达相关的表达增加(参见图9中的hts数据)。此外,已经公布了mecp2表达与let

7之间的相关性(urdinguio等人,2010 epigenetics 5(7):656

663;wu等人,2010proc.natl.acad.sci.u.s.a.107(42):18161

18166);tcf4表达和mir

218之间的相关性(hassan等人,2012j.biol.chem.287(50):42084

42092);以及mir

23a

3和mef2c表达之间的相关性(kalsotra等人,2014 cell rep.6(2):336

345)。未公布的hts数据显示了颈髓中mir

23a

3p表达和mecp2表达增加的趋势。其他靶点由于以下原因被排除:(1)该靶点对转基因表达具有适度的影响(即mir

494

3p;参见图8);(2)该靶未出现在上述检测的utr中(即mir

451a);(3)相应的mirna上调与aav9/egfp相关(即mir

30c

5p);或(4)该靶点已作为已公布的mecp2病毒基因组中的合成远端mecp2的成分存在(即mir

124

3p)(sinnett等人,2017;gadalla等人,2017)。x表示在人或小鼠3'utr中没有靶点。含有
‑‑
/
‑‑
的方框指示靶点仅存在于人(/
‑‑
)或鼠(
‑‑
/)的3’utr中。其余靶点在两种物种中均出现。在物种之间具有相似或相同的5'侧翼序列的靶点
用#符号表示。没有保守的5'侧翼序列的靶点用β符号表示。选择以粗体列出的靶点(及其侧翼序列)用于合成组。最后,针对mir

29

3p、mir

338

3p、mir

98

5p和mir
‑7‑
5p的靶点也可以是待插入通用靶点组中的候选对象,因为对这些mirna的结合位点存在于以上列出的许多基因中(参见targetscan.org),并且观察到这些mirna的表达增加与mecp2表达相关。
[0185]
表3评估mirna靶点及其人类基因组背景
[0186]
[0187]
[0188][0189]
表3在每个基因旁边按照它们出现在人类3'utr中的方式显示了靶点及其侧翼序列。为合成组选择的序列在“vg”(病毒基因组)旁边列出。如果对于给定mirna的2个或更多个靶点存在于人3'utr中,则选择在物种之间保守的靶序列并列于上表中。在选择用于合成组的5'侧翼序列时考虑了以下参数:(1)(targetscan预测得到的)沃森

克里克(wc)碱基配对,在信使rna(mrna)的核苷酸13

16(m13

m16)处具有优先配对(grimson等人,2007mol.cell 27(1):91

105);(2)物种间的5'侧翼序列的保守性(参见表2);(3)在targetscan上列出的context 百分位数得分;和(4)序列复杂性(商业基因合成要求整个合成组的%gc含量不低于35%)。对于所选的每个5'侧翼序列,选择来自相同utr的3'侧翼序列以插入靶点组。(3)导入一个突变(高亮和粗体)以产生t1a锚,以促进mrna

argonaute相互作用(schirle等人,2015 elife(4);schirle等人,2014 science346(6209):608

613)。由于mirna序列的相似性,let

7e

5p的靶点也可以结合其他let

7mirna。在数据聚合分析中,let

7a

5p、let

7b

5p和let

7g

5p在mecp2( )颈髓组织中表达增加。经mecp2病毒处理后,let

7c

5p、let

7d

5p和let

7g

5p在mecp2

/y
小鼠中的表达增加。此外,let

7e

5p靶点可能与mir

98

5p结合,在颈髓组织的数据聚合分析中,其表达水平有所增加。t1a锚在靶点列中用下划线标出。认为对argonaute相互作用构象优化的t9a/u在5'侧翼序列的列中用下划线标出(lewis等人,2005cell120(1):15

20)。
[0190]
与表2比较。如表4所示,管家基因的3'utr具有极少的所检测的靶点。表4的标记按照对于表2描述的。因此,介导智力的基因的靶点的保守性可能是生理学上明显的。内源性3'utr中靶点的完整列表可以在targetscan.org中找到。在表4的每个单元格中,列出了两个物种(人类/小鼠)的context 百分位数得分。高分表示具有有利的基因组背景的靶点。actb,β

肌动蛋白;atf1,转录激活因子1;dad1,抗细胞凋亡因子;dars,天冬氨酰

trna合成酶;gapdh,甘油醛
‑3‑
磷酸脱氢酶;hspa4,热休克蛋白家族a(hsp70)成员4;mrpl9,线粒体核糖体蛋白l9;polr1c,rna聚合酶i和iii亚基c;prkag1,蛋白激酶amp活化的非催化亚基γ1;rpl5,核糖体蛋白l5。
[0191]
表4管家基因的3'utr中mirna靶点的所选列表
[0192][0193][0194]
实施例4:开发rtt特异性构建体
[0195]
开发了对rtt特异的另外的构建体,在本文中称为“reg1”。该序列中的靶点对应在对脑和脊髓rna的高通量筛选中显示与mecp 2表达相关的上调的mirna。
[0196]
reg1的序列如下。种子匹配区被加下划线;每间隔一个,种子匹配区和侧翼序列区段均以斜体显示。结合位点关键区(按5'

3'顺序):mir

451a;let
‑7‑
5p;mir

690。
[0197][0198]
在wt小鼠中测试reg1,并且在wt浦肯野细胞中显示紧密调控的总mecp2表达,如图10所示。浦肯野细胞位于脑池内注射位点附近,并且易受超生理性转基因表达的影响。将每个细胞核校正后的总细胞荧光(抗mecp2信号)相对于myc(

)浦肯野细胞核的平均mecp2信号归一化。图10的分图a中的每只小鼠的平均值呈现了对于指定宿主定量的所有myc( )核取平均值的归一化mecp2信号。在z堆栈内的细胞之间,然后在单个小鼠的z堆栈之间进行迭代平均,同样导致总mecp2表达的显著降低(与对已公布的对照aav9/mep426

minimecp2

myc

rdh1pa所观察到的相比;gadalla等人,2017)。转导的浦肯野细胞中的平均总mecp2表达(mini 内源性全长蛋白)是未转导的浦肯野细胞的5倍,如图10的分图a和b中所示。用于
神经元敲减的阳性对照组(以针对mir

124

3p的3个靶为特征)将过表达降低了一半(p=0.06)。reg1盒也使过表达降低了一半(p=0.02)。图10的分图c显示了总mecp2强度的直方图,表明reg1使总mecp2强度的分布变窄,指示了更紧密的调控。因为局部转导效率在整个小脑中不等,所以图10的分图d中绘制了转导的浦肯野细胞的平均总mecp2强度与局部转导效率,其中每个数据点代表单一z堆栈内的浦肯野细胞的平均强度和转导效率。趋势线连接来自单只小鼠的多个z堆栈。reg1盒限制总mecp2表达,即使在小脑区域也具有高转导效率。相反,阴性对照组允许总mecp2表达在具有高局部转导效率的区域中大大超过生理水平。图10的分图e显示reg1盒允许neun 细胞中的转基因表达。相反,神经元敲减的阳性对照降低了neun 细胞的百分比。类似地,图11显示了初步数据,其中reg1在杂合嵌合雌性小鼠脑池内施用aav9/mini

mecp2

reg1后降低肝脏的转基因表达。
[0199]
实施例5:通用实验组设计策略与实验研究
[0200]
图12总结了用于设计rtt特异性组“reg1”和广泛适用组(在别处称为“reg2”或“univt”)的策略。图12的分图a示出了最初用于设计rtt特异性靶点组的微小rna表达数据,该靶点组用于在体内安全地调控外源性mecp2表达。相同的表达数据提供了为了设计reg2的目的处理utr数据集的选择标准,如图12的分图b所示。通过图12的分图c

g中所示的步骤,将2491个人靶点的列表缩至6个目前特征化在reg2中的保守靶点。预测这些靶点中的5个结合mecp2驱动的mirna(参见表1)。因为let

7靶点的碱基对与许多let

7mirna种子区配对,所以reg2组可能结合多达11种mirna。表5显示了可能与reg1和/或reg2中包含的mirna种子区结合的潜在mirna的非限制性列表。
[0201]
表5mecp2驱动的mirna及其在reg1和reg2中的相应靶
[0202][0203]
鉴定了mirna表达与内源性mecp2表达、外源性mecp2表达和/或总的(内源性和外源性)mecp2表达之间的相关性。此外,在概念上可能的是,存在有待鉴定的能够贡献于mecp2反馈环的mirna。含有允许mirna种子区与mirna靶组之间的沃森

克里克(wc)碱基配对的种子序列的任何mirna可以帮助介导外源性mecp2调控。
[0204]
对reg1 rtt特异性构建体和reg2广泛适用的构建体都进行了进一步的实验。图13显示在php.b介导的minimecp2基因转移后,reg2降低了体内wt脑中的转基因表达水平。图14显示了在代表性小脑平铺块扫描图内的浦肯野细胞中minimecp2表达的reg2依赖性抑制。在图13的左侧,箭头指示对照载体处理的小鼠的几个小脑叶中的myc( )浦肯野神经元。
在reg2处理的小鼠中,大部分浦肯野细胞为myc(

)。在图13的右侧,箭头指示限于前庭小脑区域的minimecp2表达。因为reg2处理的小鼠具有宽范围的0%myc( )或100%myc( )的浦肯野细胞层(限于前庭小脑区域),所以不建议对相邻的myc( )和myc(

)浦肯野细胞中的总mecp2表达进行定量分析。
[0205]
图15a

15c显示reg2允许多个脑部区域中广泛但严格控制的表达。图15a针对reg2处理的小鼠所指示的myc( )细胞的百分比很可能低估了实际的转导细胞百分比,因为许多myc( )细胞的抗myc免疫荧光信号几乎不高于检测极限。在所检查的3个区域中,海马表现出%myc( )细胞下降幅度最大(reg2与对照处理的小鼠)。图15b显示了丘脑、海马和髓质的代表性图像。图15c显示reg2增强了丘脑中的明显的神经元取向。图16显示reg2可以改善肝脏中的minimecp2调控。
[0206]
如图17所示,在盐水处理的ko小鼠和病毒处理的ko小鼠中进行初步存活研究。在4

5周龄时对小鼠进行脑池内注射。尽管reg2对转基因表达具有强的抑制作用,但reg2似乎并未减弱php.b/minimecp2(1e11 vg/小鼠)介导的中位生存期的延长。此外,reg2处理导致较少的早期死亡。指示了每组中仍然存活的小鼠的数目。表6显示了在经治疗的ko小鼠在其整个寿命期间保持正常后肢功能的百分比。用调控的载体处理的ko小鼠更可能在其整个寿命期间保持正常的后肢表型(与非调控载体相比)。
[0207]
表6在存活研究期间保持正常后肢的经处理ko小鼠
[0208][0209]
前述实施例是对本发明的说明,不应被解释为对其的限制。尽管已经参照优选实施方案详细地描述了本发明,能够但是在所附权利要求中描述和限定的本发明的范围和精神内存在变化和修改。

技术特征:
1.一种合成基因,其包括:多核苷酸,其包含编码目的蛋白或核酸的编码区和一个或多个调控区;所述多核苷酸还包含一个或多个核酸区段,每个核酸区段包含被鉴定为内源性mirna的结合位点的种子匹配区以及挨着所述种子匹配区的5'侧翼序列和3'侧翼序列;其中所述一个或多个核酸区段被插入所述多核苷酸的调控区中,使得当所述合成基因被递送至表达所述内源性mirna的细胞时所述目的蛋白或核酸的表达相对于当不包含所述一个或多个核酸区段的合成基因被递送至表达所述内源性mirna的细胞时所述目的蛋白或核酸的表达降低。2.如权利要求1所述的合成基因,其中所述编码目的蛋白或核酸的编码区包含选自基因tcf4、ube3a、dyrk1a、mef2c、nsd1、zeb2、mbd5、rps6ka3、atrx、mecp2、slc6a1、foxg1、akt3或其活性片段的编码区。3.如权利要求1所述的合成基因,其中所述编码目的蛋白或核酸的编码区包含基因mecp2或其活性片段的编码区。4.如权利要求1

3中任一项所述的合成基因,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合选自以下的一种或多种mirna:mir

690、mir

124

3p、mir

451a、mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p、let
‑7‑
5p/98

5p、mir

29

3p、mir

338

3p、mir

98

5p、mir
‑7‑
5p、mir

494

3p或其任意组合。5.如权利要求1

3中任一项所述的合成基因,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合以下mirna:mir
‑9‑
5p、mir

26

5p mir

23

3p、mir

218

5p、mir

27

3p和let
‑7‑
5p。6.如权利要求1

3中任一项所述的合成基因,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合以下mirna:mir

690、mir

451a和let
‑7‑
5p。7.如权利要求1

6中任一项所述的合成基因,其中所述种子匹配区的长度为约5个至约10个核苷酸。8.如权利要求1

6中任一项所述的合成基因,其中所述种子匹配区的长度为约6个至约8个核苷酸。9.如权利要求1

6中任一项所述的合成基因,其中挨着所述种子匹配区的所述5'侧翼序列和3'侧翼序列各自的长度为约9个至约13个核苷酸。10.如权利要求1

6中任一项所述的合成基因,其中挨着所述种子匹配区的所述5'侧翼序列和3'侧翼序列各自的长度为11个核苷酸。11.如权利要求1

6中任一项所述的合成基因,其中所述多核苷酸包含至少两个种子匹配区并且所述种子匹配区被约7个至约40个核苷酸隔开。12.如权利要求11所述的合成基因,其中所述至少两个种子匹配区被约20个至约25个核苷酸隔开。13.如权利要求11所述的合成基因,其中所述至少两个种子匹配区被22个核苷酸隔开。14.如权利要求11

13中任一项所述的合成基因,其中所述多核苷酸包含3至8个种子匹配区。15.如权利要求1

14中任一项所述的合成基因,其中所述种子匹配区以及挨着所述种子匹配区的侧翼3'和5'序列包含与seqidno:1至少70%相同的核苷酸序列。
16.如权利要求1

14中任一项所述的合成基因,其中所述种子匹配区以及挨着所述种子匹配区的侧翼3'和5'序列包含与seqidno:2至少70%相同的核苷酸序列。17.一种包含权利要求1

16中任一项所述的合成基因的载体。18.如权利要求17所述的载体,其中所述载体是质粒、病毒载体、表达盒、转化的细胞或纳米颗粒。19.一种药物组合物,其包括如权利要求1

16中任一项所述的合成基因或如权利要求17或18所述的载体以及药学上可接受的载体。20.一种用于向合成基因提供剂量依赖性抑制反馈的多核苷酸靶点盒,所述盒包含一个或多个核酸区段,所述一个或多个核酸区段包含被鉴定为内源性mirna的结合位点的种子匹配区以及挨着所述种子匹配区的5'侧翼序列和3'侧翼序列。21.如权利要求20所述的多核苷酸靶点盒,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合选自以下的一种或多种mirna:mir

690、mir

124

3p、mir

451a、mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p、let
‑7‑
5p/98

5p、mir

29

3p、mir

338

3p、mir

98

5p、mir
‑7‑
5p、mir

494

3p或其任意组合。22.如权利要求20所述的多核苷酸靶点盒,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合以下mirna:mir
‑9‑
5p、mir

26

5p mir

23

3p、mir

218

5p、mir

27

3p和let
‑7‑
5p。23.如权利要求20所述的多核苷酸靶点盒,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合以下mirna:mir

690、mir

451a和let
‑7‑
5p。24.如权利要求20

23中任一项所述的多核苷酸靶点盒,其中所述种子匹配区的长度为约5个至约10个核苷酸。25.如权利要求20

23中任一项所述的多核苷酸靶点盒,其中所述种子匹配区的长度为约6个至约8个核苷酸。26.如权利要求20

25中任一项所述的多核苷酸靶点盒,其中挨着所述种子匹配区的所述5'侧翼序列和3'侧翼序列各自的长度为约9个至约13个核苷酸。27.如权利要求20

25中任一项所述的多核苷酸靶点盒,其中挨着所述种子匹配区的所述5'侧翼序列和3'侧翼序列各自的长度为11个核苷酸。28.如权利要求20

27中任一项所述的多核苷酸靶点盒,其中所述种子匹配区以及挨着所述种子匹配区的侧翼3'和5'序列包含与seqidno:1至少70%相同的核苷酸序列。29.如权利要求20

27中任一项所述的多核苷酸靶点盒,其中所述种子匹配区以及挨着所述种子匹配区的侧翼3'和5'序列包含与seqidno:2至少70%相同的核苷酸序列。30.一种制备合成基因的方法,所述合成基因包含多核苷酸,所述多核苷酸包含编码目的蛋白或核酸的编码区和一个或多个调控区,所述方法包括将如权利要求20

29中任一项所述的多核苷酸靶点盒插入所述合成基因的调控区中的步骤。31.一种制备如权利要求1

16中任一项所述的合成基因的方法,包括以下步骤:将一个或多个各自包含被鉴定为内源性mirna结合位点的种子匹配区以及挨着所述种子匹配区的5'侧翼序列和3'侧翼序列的核酸区段插入包含编码目的蛋白或核酸的编码区和一个或多个调控区的多核苷酸的调控区中。32.如权利要求31所述的方法,其中所述编码目的蛋白或核酸的编码区包含选自基因
tcf4、ube3a、dyrk1a、mef2c、nsd1、zeb2、mbd5、rps6ka3、atrx、mecp2、slc6a1、foxg1、akt3或其活性片段的编码区。33.如权利要求31所述的方法,其中所述编码目的蛋白或核酸的编码区包含基因mecp2或其活性片段的编码区。34.如权利要求31

33中任一项所述的方法,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合与

选自以下的一种或多种mirna:mir

690、mir

124

3p、mir

451a、mir
‑9‑
5p、mir

26

5p、mir

23

3p、mir

218

5p、mir

27

3p、let
‑7‑
5p/98

5p、mir

29

3p、mir

338

3p、mir

98

5p、mir
‑7‑
5p、mir

494

3p或其任意组合。35.如权利要求31

33中任一项所述的方法,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合以下mirna:mir
‑9‑
5p、mir

26

5p mir

23

3p、mir

218

5p、mir

27

3p和let
‑7‑
5p。36.如权利要求31

33中任一项所述的方法,其中所述种子匹配区以及所述5'侧翼序列和3'侧翼序列结合以下mirna:mir

690、mir

451a和let
‑7‑
5p。37.如权利要求31所述的方法,还包括以下步骤:筛选在所述目的蛋白或核酸在细胞中表达时相对于所述目的蛋白或核酸不表达时具有增加的表达的mirna;鉴定针对具有增加的表达的一种或多种mirna的种子匹配区以及5'侧翼序列和3'侧翼序列;以及制备包含待插入所述多核苷酸的调控区的所述种子匹配区以及5'侧翼序列和3'侧翼序列的核酸区段。38.一种鉴定待插入合成基因中的一个或多个种子匹配区以及5'侧翼序列和3'侧翼序列的方法,包括以下步骤:鉴定针对在目的蛋白或核酸在细胞中表达时相对于所述目的蛋白或核酸在所述细胞中不表达时具有增加的表达的mirna的一种或多种种子匹配区以及5'侧翼序列和3'侧翼序列;以及将所述种子匹配区以及5'侧翼序列和3'侧翼序列插入包含含有编码所述目的蛋白或核酸的编码区和一个或多个调控区的多核苷酸的合成基因的调控区中。39.如权利要求38所述的方法,还包括以下步骤:筛选用于已验证的或推定的种子匹配区以及5'侧翼序列和3'侧翼序列的核酸数据集。40.如权利要求38或39所述的方法,还包括以下步骤:鉴定在目的蛋白或核酸在细胞中表达时相对于所述目的蛋白或核酸在所述细胞中不表达时具有增加的表达的mirna。41.如权利要求38

40中任一项所述的方法,还包括以下步骤:筛选在目的蛋白或核酸在细胞中表达时相对于所述目的蛋白或核酸在所述细胞中不表达时具有增加的表达的mirna的核酸数据集。42.如权利要求38

41中任一项所述的方法,还包括以下步骤:在细胞中表达所述目的蛋白或核酸;从所述细胞中收集mirna;以及计算所述mirna在所述目的蛋白或核酸在所述细胞中表达时相对于所述目的蛋白或核
酸在所述细胞中不表达时的表达水平,从而创建所述mirna的核酸数据集。43.如权利要求39、41或42中任一项所述的方法,其中所述核酸数据集为3'utr数据集。44.如权利要求38

43中任一项所述的方法,其中所述目的蛋白或核酸为选自基因tcf4、ube3a、dyrk1a、mef2c、nsd1、zeb2、mbd5、rps6ka3、atrx、slc6a1、foxg1、akt3、mecp2或其活性片段的转录产物或翻译产物。45.如权利要求38

43中任一项所述的方法,其中所述目的蛋白或核酸为基因mecp2或其活性片段的转录产物或翻译产物。46.一种将合成基因递送至受试者的方法,所述方法包括向所述受试者施用如权利要求1

16中任一项所述的合成基因、如权利要求17或18所述的载体或如权利要求19所述的药物组合物,从而将所述合成基因递送至所述受试者。47.一种治疗与内源性基因的异常表达或内源性基因编码的突变蛋白的表达相关的疾病的方法,所述方法包括施用编码由所述内源性基因编码的目的蛋白或核酸的如权利要求1

16中任一项所述的合成基因、如权利要求17或18所述的载体或如权利要求19所述的药物组合物,从而治疗所述疾病。48.如权利要求46或47所述的方法,其中所述受试者是人。49.如权利要求46

48中任一项所述的方法,其中所述受试者患有智力基因剂量敏感性障碍或处于患智力基因剂量敏感性障碍的风险。50.如权利要求46

48中任一项所述的方法,其中所述受试者患有选自由以下组成的组的疾病或处于患选自由以下组成的组的疾病的风险:雷特综合征、mecp2重复综合征、天使人综合征、dup15q、dyrk1a单倍体不足、唐氏综合征、mef2c单倍体不足综合征、dup5q14.3、小儿巨脑畸形综合征、反向小儿巨脑畸形综合征、α地中海贫血x连锁的智力障碍综合征、xq13.2q21.1重复、科

勒综合征、xp22.12重复、皮特

霍普金斯综合征、mowat

wilson综合征、2q22.3三倍重复、2q23.1重复、2q23.1微缺失、foxg1综合征、west综合征、巨脑

多小脑回

多指/趾

脑积水综合征、akt3重复、doose综合征、slc6a1重复和18三体综合征(trisomy 18)。51.如权利要求46

50中任一项所述的方法,其中所述受试者患有雷特综合征或mecp2重复综合征或处于患雷特综合征或mecp2重复综合征的风险。52.如权利要求46

51中任一项所述的方法,其中所述合成基因、载体或药物组合物通过选自由以下组成的组的递送途径来递送:肠内、肠胃外、鞘内、脑池内、脑内、心室内、鼻内、耳内、眼内、眼周、直肠内、肌内、腹膜内、静脉内、口服、舌下、皮下和透皮。53.如权利要求46

51中任一项所述的方法,其中所述合成基因经由静脉内递送。54.如权利要求46

51中任一项所述的方法,其中所述合成基因经由csf内递送。55.如权利要求46

54所述的方法,所述方法还包括通过遗传学手段在所述受试者中敲减编码所述目的蛋白或核酸的内源性基因。56.如权利要求55所述的方法,其中所述内源性基因为mecp2。57.一种治疗受试者中与内源性基因的异常表达或由内源性基因编码的突变蛋白的表达相关的疾病的方法,所述方法包括通过遗传学手段在所述受试者的细胞中敲减所述内源性基因,以及施用编码由所述内源性基因编码的目的蛋白或核酸的权利要求1至14中任一项所述的合成基因、权利要求15或16所述的载体或权利要求17所述的的药物组合物,从而
治疗所述疾病。58.如权利要求57所述的方法,其中所述疾病为雷特综合征、mecp2重复综合征、天使人综合征、dup15q、dyrk1a单倍体不足、唐氏综合征、mef2c单倍体不足综合征、dup5q14.3、小儿巨脑畸形综合征、反向小儿巨脑畸形综合征、α

地中海贫血x连锁的智力障碍综合征、xq13.2q21.1重复、科

勒综合征、xp22.12重复、皮特

霍普金斯综合征、mowat

wilson综合征、2q22.3三倍重复、2q23.1重复、2q23.1微小缺失、foxg1综合征、west综合征、巨脑

多小脑回

多指/趾

脑积水综合征、akt3重复、doose综合征、slc6a1重复和18三体综合征。
技术总结
本发明涉及用于在靶组织中提供转基因表达之目的的能够实现反馈的合成基因、多核苷酸靶点盒、载体和药物组合物及其制备方法和使用方法,该转基因的表达能够被内源性调控以治疗如剂量敏感性智力障碍等疾病。如剂量敏感性智力障碍等疾病。如剂量敏感性智力障碍等疾病。


技术研发人员:S
受保护的技术使用者:北卡罗来纳大学查佩尔希尔分校
技术研发日:2019.08.29
技术公布日:2021/6/29

转载请注明原文地址:https://doc.8miu.com/read-70.html

最新回复(0)