[보고서] ‘3세대 유전자 가위’ 논문·특허기술 전쟁 2…논문 분석

- UCB(버클리대), 제니퍼 다우드나 교수 팀의 논문 분석(2012)

생명과학자들은 최근 3세대 유전자 가위(크리스퍼/카스, CRISPR/Cas9)를 개발했다. 인간세포와 동식물세포의 유전자를 마음대로 교정 또는 편집하는데(Editing) 사용한다. 표적 DNA를 자른 후 세포 내 복구 시스템에 의해 다시 연결되는 과정에서 유전자 교정과 원하는 변이가 일어난다. 이 방식을 활용해 암과 AIDS 등뿐만 아니라 더 나아가 희귀난치병 치료나 작물•가축개량•미래식량(Clean meat) 분야에서 유전자 가위 혁명이 빠르게 확산되고 있다. 

특정 유전자 부위를 정확하게 잘라 내 그 기능을 알아내는 데에도 사용되고, 쥐를 대상으로 특정 유전자를 제거/억제하거나(Knock-out) 특정 유전자를 삽입하여(Knock-in) 희귀 병을 가진 쥐를 만들기도 하는데, 종전에는 수개월~수년이 걸렸지만 유전자 가위를 이용하면 시간과 비용을 획기적으로 줄일 수 있기 때문이다. 이렇듯 인류는 세포 안에 있는 특정 유전자나 염기를 골라서 제거하거나 정상으로 바꿀 수 있는 유전자 가위 기술을 보유했다. 

본 보고서에서는 3세대 유전자 가위에 대한 논문 공개 순으로 제니퍼 다우드나 교수 팀 – 펭 장 교수 팀 – 김진수 교수 팀의 논문의 내용을 살펴보고, 지금 벌어지고 있는 특허전쟁에 대해서는 특허 출원일 순으로 소개하되, 특허등록 여부를 같이 분석해 인사이트를 제공하고자 한다. 다만, 논문 공개시기보다 대부분 특허 출원일이 앞서 있고, 또한 특허출원서의 내용과 논문 내용이 다룰 수도 있지만, 특허기술들이 논문 연구과정에서 발견한 기술들이라는 점에서 논문을 먼저 살펴보고 특허를 나중에 살펴보기로 한다. 아울러 논문과 특허분석이기 때문에 오류가 있을 수도 있다는 점을 알려드리는 바이다. 

글 싣는 순서 

I부 – ‘3세대 유전자 가위(CRISPR/Cas9)’ 논문/특허기술 전쟁
1장. 크리스퍼/카스(CRISPR/Cas)란 
2장. 논문 분석
2-1. UCB(버클리대), 제니퍼 다우드나 교수 팀의 논문 분석(2012)

2-2. MIT, 펭 장 교수 팀의 논문 분석(2013)
2-3. 서울대, 김진수 교수 팀의 논문 분석(2013)
3장. 특허분석/특허전쟁
3-1. 다우드나 교수, 원핵생물 대상, 최초 특허출원(2012)과 출원서 공개(2014)
3-2. 김진수 교수(툴젠), 인간세포 대상, 최초 특허출원(2012)과 출원서 공개(2014)
3-3. 장 교수, 인간세포 대상, 초고속 심사 신청, 2014년 4월에 특허를 획득
3-4. 미국 특허심판원 다우드나+장 교수의 양쪽 기술을 모두 인정(2017.02)
3-5. 다우드나 교수의 그간의 노력
3-6. 유럽특허청(EPO), 최초 연구자 다우드나 교수의 특허를 승인(2017.05)
3-7. 중국 국가지식산권국(SIPO), 다우드나 교수의 특허를 승인(2017.06)
3-8. 크리스퍼 논문/특허 분쟁 관련 주요 내용
4장. Discussion
*참고 Genome editing: 유전체 교정인가 편집인가?(23 Jul 2015)

dna-
▲Image Credit: pixabay.com

2장. 논문 분석

2-1. UCB(버클리대), 제니퍼 다우드나 교수 팀의 논문 분석(2012)

미국 유씨버클리대(University of California, Berkeley) 제니퍼 다우드나(Jennifer A. Doudna) 교수와 스웨덴 우메아대(Umeå University)의 엠마뉴엘 카펜디어/(Emmanuelle Charpentier) 교수가 이끄는 공동연구팀은 박테리아의 크리스퍼 적응면역(Adaptive Bacterial Immunity)에서 중요한 역할을 하는 'Cas9' 단백질을 병원균인 화농연쇄상구균(Streptococcus pyogenes, SF370)에서 찾아 ‘CRISPR RNA/Cas9’을 인공적으로 만들어 2012년 8월 17일에 “박테리아 적응면역에서 보이는 프로그램(설계)이 가능한 두 개의 RNA로 가이드 되는 DNA 엔도뉴클레아제 효소”라는 논문을 사이언스지에 발표했다(Jinek et al., Science, 17 Aug 2012). 

논문에서 밝힌 CRISPR RNA/Cas9 시스템의 작동원리를 보자. 우선 타이프 II인 크리스퍼/카스 좌위(CRISPR/Cas loci)를 보면, 왼쪽에 Cas9, Cas1, Cas2, Csn2 단백질들을 엔코딩한 하늘색의 4개의 미생물 유전자군(Operon)이 있고, 그 다음 크리스퍼 어레이에는 하나의 선도서열에 이어지는 하나의 반복-스페이서 어레이(a repeat-spacer array)가 있는데, 반복들(Repeats)은 검정색의 직사각형들이고, 비-반복적인 서열을 가진 스페이서들(Spacers)은 다양한 색으로 칠해진 다이아몬드들이다(<그림 S1>).  

박테리아에 새롭게 침투한 바이러스나 플라스미드 DNA의 20여개 염기서열들을 Cas1과 Cas2 단백질이(이때 Cas1과 Cas2의 단백질들은 크리스퍼 어레이의 왼쪽에 있는 유전자들인 Cas1과 Cas2가 발현한 것인데, 다우드나 교수의 논문엔 cas1과 cas2의 이탤릭 소문자로 되어 있다) 식별해 자르고 다듬어 CRISPR Array의 오른쪽 부분인 비-반복적인 스페이서 어레이(a spacer array)에 옮기고 저장한다. 여기에는 전에 침투했던 여러 종류의 바이러스나 플라스미드 DNA의 염기서열이 있었다. 이 때 새롭게 추가되는 염기서열은 선도서열에 인접한 맨 앞의 첫 번째 스페이서가 된다. 여기까지의 과정을 스페이서획득(spacer acquisition)이라고 한다. 그 다음 획득한 스페이서에 있는 특정 바이러스나 플라스미드 dsDNA의 한쪽 가닥의 염기서열에 상보적(Complementary)인 염기서열들이 precursor(전구) CRISPR RNA(pre-crRNA)로 전사(Transcription)되고, 그러면 Cas9 단백질이(하늘색) 출현하고, 그 다음 반응을 촉진하는 하나의 RNA-특이 리보뉴클레아제(an RNA-specific ribonuclease)인 RNase III(오렌지색)가 출현하면, 그 다음 pre-crRNA의 염기서열들과 상보성을 이루는 트렌스-활성 RNA(trans-activating RNA, tracrRNA)와 이중 가닥(ds)을 형성하며, 이때 tracrRNA와 pre-crRNA가 붙어서 생긴 이중 가닥은 RNase III에 의해서 일부 잘려서 제거된다(<그림 S1>의 1st과정). 그리고 알려지지 않은 뉴클레아제들이 3'→5' 방향의 pre-crRNA의 5' 말단을 구성(5' end formation)한다(<그림 S1>의 2nd과정). 

1▲(그림 S1). 타이프 II RNA-매개 CRISPR/Cas 시스템의 면역 경로(The type II RNA-mediated CRISPR/Cas immune pathway). 20여개 표적 염기서열을 자르기 위해 crRNA에는 66개~42개의 뉴클레오티드(nt)가, tracrRNA에는 89~75개의 nt가 들어있다. Image Credit: Jinek, Doudna, Charpentier et al., Science, 17 Aug 2012.

이렇게 pre-crRNA는 중간-crRNA(intermediate crRNA)가 되고, 그 다음 성숙(maturation) 과정을 거처 마침내 성숙한(mature) crRNA가 된다. 이 성숙과정에는 앞서 보았듯이 Cas9과 RNase III가 관여하였다. 그리고 crRNA와 tracrRNA가 짝을 이루어(pairing) 고리 형태의 루프를 형성해(R-loop formation) 두 개의 RNA 구조(a two-RNA structure)가 되어, 결국 Cas9-TracrRNA:crRNA의 삼원 복합체(ternary complex)를 이룬다. 그리고 외부에서 침투하는 특정 바이러스나 플라스미드를 표적으로 crRNA는 가이드(정찰병) 역할을 해서 상동염기를 찾고(homology search), Cas9은 절단(전투병) 역할을 해서, 바이러스의 두 가닥의 DNA를 잘라(double-stranded DNA break, DSB) 바이러스를 무력화 시키는 것이다. 이때 Cas9 단백질에 있는 두 가지 촉매영역들인(two catalytic domains) 엔도뉴클레아제(endonuclease)가 필요한데, HNH(histidine-asparagine-histidine) 영역은 crRNA와 상보적(complementary)인 표적 DNA의 가닥을 자르고, RuvC-같은(like) 영역은 비-상보적(noncomplementary)인 가닥을 자른다. 결국 표적 DNA의 이중가닥을 자르는 것이다.

그런데 Cas9 단백질이 정확하게 표적 DNA의 20여개 염기서열에 달라붙어(binding) 잘라내기 위해서는 PAM(Protospacer adjacent motif)이라 알려진 3개의 염기로 이루어진 짧은 염기서열이 표적 DNA 옆에 존재해야 된다. 이때 Cas9단백질은 PAM 시퀀스로부터 3번째와 4번째 염기 쌍 사이를 추정 절단하게 된다. PAM 시퀀스를 인식하는 기능 때문에 PAM 시퀀스를 가지고 있는 침입한 바이러스의 프로토스페이서 DNA만을 자르게 된다.

2▲ Cas9(자주색으로 칠해진 부분)에는 두 가지 엔도뉴클레아제 영역이 있는데, HNH 영역은 crRNA와 상보적인 표적 DNA의 가닥을 자르고, RuvC-같은(like) 영역은 비-상보적인 가닥을 자른다. 오리지널 이미지를 필자가 수정했음. Image Credit: Custom sgRNA/Cas9 by Pnabio.com)

이때 PAM은 3개의 염기로 이루어져 있는데, 반드시 두 개의 구아닌(GG)이 ‘NGG’로 이루어져야(ending with two guanines) 한다. 앞의 N이란 어느 염기가 와도 된다는 뜻으로 TGG, AGG, GGG, CGG 중 하나가 된다. 

3▲(그림 1-E) tracrRNA와 상보적인 crRNA는 오렌지 색으로, 프로토스페이서와 상보적인 crRNA(with 20-nt)는 노란색으로, PAM은 회색으로, 실험 대상의 절단 사이트들은 파랑색과 빨강색 화살표와 빨강색 선으로 표시. Image Credit: Jinek et al., Science, 17 Aug 2012.

4▲(그림 5A) (위) crRNA와 tracrRNA의 두 개의 RNA가 Cas9(푸른색)과 함께 표적 dsDNA를 자르고, (아래) 두 개의 RNA를 루프로 연결하여 하나의 sgRNA 키메라(Chimera)로 만들어 Cas9과 함께 dsDNA를 자름. Image Credit: Jinek et al., Science, 17 Aug 2012.

키메라(Chimaera, Chimera) – 두 개 이상의 유전적으로 다른 개체에서 유래하는 세포, 핵, 염색체 혹은 유전자를 함유한 개체. 키메라란 그리스 신화에 나오는 사자의 머리, 양의 몸통, 뱀의 꼬리를 한 괴물을 말하는데, 이로부터 생물학에 있어서는 둘 이상의 다른 유전자형의 세포, 또는 다른 종(種)의 세포로부터 만든 1개의 생물 개체를 가리키는 용어로 쓰고 있다.

이처럼 박테리아들은 과거에 침입했던 바이러스의 DNA 정보를 crRNA에 저장(기억)해 놓고 공격에 대비하는, 즉 면역을 획득하는 셈이다. 결국 크리스퍼/카스9는 박테리아의 면역시스템인데, 다우드나 교수의 논문 핵심은 이 면역시스템을 이용해 새로운 3세대의 설계 가능한 인공 유전자 가위를 만든 것이다. 다시 말해 특정 표적 사이트에 맞는 맞춤식의 설계가 가능한 유전자교정기술(RNA-programmable genome editing technology)을 개발한 것이다. 또한 두 개의 RNA인 crRNA와 tracrRNA를 하나의 단일 RNA 키메라(a single RNA chimera)로 설계하고(programmed) 인공적으로 만들어(engineered), 단일-가이드 RNA(a single-guide RNA, sgRNA)로 사용해도 표적 바이러스의 dsDNA를 절단한다.

자 이번엔 다우드나 교수의 논문에 나타난 실험 과정을 보자. 병원균(pathogen)인 화농연쇄상구균(Streptococcus pyogenes, SF370)을 배지(medium)에서 배양하고(cultured), 대장균(Escherichia coli)을 배지와 한천(agar)에서 배양했다. 그 다음 화농연쇄상구균에서 Cas9과 RNA를 추출하고, 그 다음 Cas9을 pMJ806이라는 플라스미드를 벡터(vector, 운반체 혹은 매개자)로 이용하여 대장균(BL21 Rosetta2)에 주입하고 과-발현(overexpression)을 유도하고 정제했다(purified). 이렇게 정제한 Cas9과 RNA, 다양한 프로토스페이서, 기타 돌연변이 염기서열들을 벡터로 사용되는 pUC-계열의 pUC19에 넣어 플라스미드 DNA를 만들고, 이 플라스미드 DNA를 다양한 벡터들인 플라스미드들(pMJ849~pMJ901)을 이용해 대장균(RDN204)에 넣어 형질전환(transformation) 시켰다. 이때 형질전환 방법으로 표준열충격프로토콜(a standard heat shock protocol)을 사용했으며, 효율을 높이기 위해 전기충격 혹은 전기천공(electroporation) 방법을 사용했다. 그리고 대조군 형질전환(Control transformations)을 비교분석하기 위해 정상인 야생형(野生型, Wild Type)의 화농연쇄상구균(SF370)을 대장균(RDN204)에 주입했는데, 소독식수인 주사용멸균수(注射用滅菌水, Sterile Water)를 사용하고 백본 벡터(backbone vector)로 플라스미드 pEC85를 이용했다. 

실험 결과인 Cas9에 의한 절단 생성물(cleavage products)을 보자. Cas9 단백질과 42-nt로 이루어진 스페이서 2를 가진 crRNA-sp2와 75-nt로 이루어진 tracrRNA를 설계하여 복합체를 만들고, 이 복합체를 스페이서 2의 상보적 서열과 PAM을 가진 원형(circular)과 선형(linearized)의 플라스미드 DNA(plasmid-sp2)와 섞어 주었다(added). 그 결과 crRNA-sp2는 plasmid-sp2를 자르는 반면 시퀀스가 다른 비-동종의(noncognate)의 crRNA-sp1은 plasmid-sp2를 자르지 못함을 보였다. 또한 절단 반응이 일어나기 위해서는 마그네슘(Mg)이 필요하다는 것을 발견했다. 

실험결과는 아가로오스 젤 전기영동(agarose gel electrophoresis) 방법으로 절단된 DNA 가닥을 분리하고, 에티듐브로미드 용액으로 염색시켜(ethidium bromide staining) 자외선으로 조사(UV illumination)하여 발광되는 부분으로 시각화하였다.

(그림 1-A)는 절단 생성물을 보여주고 있는데, +는 Presence를 나타내고 –는 absence를 나타내는데, 반드시 동종의 plasmid-sp2와 crRNA-sp2가 매칭될 때, 그리고 Cas9-CrRNA-sp2:tracrRNA가 삼원 복합체를 이룰 때 절단이 잘 일어나는 것으로 나타났다. 왼쪽은 원형으로 되어있는 플라스미드 DNA를 잘라 선형의 DNA가 나오는 것을 보인 것이고, 오른쪽은 선형의 플라스미드 DNA를 잘라 두 가닥의 DNA가 나오는 것을 보이는 것이다. 아래의 M은 절편 DNA의 크기(fragment sizes)를 알 수 있는 DNA size maker이다. 

5▲(그림 1-A) 동종이 매칭되고 Cas9-CrRNA-sp2:tracrRNA가 삼원 복합체(ternary complex)를 이룰 때 절단이 잘 일어남. 예를 들어 Cas9-crRNA-sp1:tracrRNA일 때는 절단이 안 일어남. 오리지널 이미지를 필자가 박스 처리함. Image Credit: Jinek et al., Science, 17 Aug 2012.

(그림 1-B)는 프로토스페이서 2를 가진 합성 생체분자들(Synthetic biomolecules)인 올리고뉴클레오티드의 상보적 가닥과 비-상보적 가닥을 절단한 생성물을, 변성 폴리아크릴아미드 겔 전기 영동법(denaturating polyacrylamide gel electrophoresis)으로 분리하고 인광 이미징(phosphorimaging)으로 시각화한 것이다. 절단된 20여개 nt들은 50개의 nt들보다 작기 때문에 + 방향의 아래쪽으로 빨리 이동한 것을 나타낸다. 마찬가지로 동종이 매칭되고 Cas9-CrRNA-sp2:tracrRNA가 삼원 복합체를 이룰 때 절단이 잘 일어난 것으로 나타났다.

6▲(그림 1-B) 프로토스페이서 2를 가진 합성 생체분자들(Synthetic biomolecules)인 올리고뉴클레오티드의 상보적 가닥과 비-상보적 가닥을 절단한 생성물. 마찬가지로 동종이 매칭되고 Cas9-CrRNA-sp2:tracrRNA가 삼원 복합체(ternary complex)를 이룰 때 절단이 잘 일어남. Image Credit: Jinek et al., Science, 17 Aug 2012.

자 이번에는 Cas9에는 두 가지 엔도뉴클레아제 영역이 있는데, HNH 영역은 crRNA와 상보적인 표적 DNA의 가닥을 자르고, RuvC-like 영역은 비-상보적인 가닥을 자른다는 것을 어떻게 알아냈는지 실험 결과를 보자. 다우드나 교수 팀은 HNH 또는 RuvC 영역의 촉매 잔기들에(catalytic residues)에서 절단 역할을 못하게 하는 점 돌연변이들(point mutations)을 가진 돌연변이(mutant) Cas9을 정제하고 디자인했다. 그리고 이 돌연변이 Cas9을 사용하여 플라스미드 DNA 절단을 시도한 결과, 돌연변이 Cas9는 원형을 잘라 한 가닥의 DNA가 끊어진 형태인 열린 원형(nicked open circular)을 생성해냈고, 반면 정상적인(WT, Wild-Type) Cas9은 원형을 잘라 선형(linear)을 생성해냈다(<그림 2-A>의 아래 왼쪽 부분의 nicked-linear-supercoiled를 말함. 이들 형태에 대해서는 다음 사이트를 참조). 

이것은 무엇을 의미하는가 하면 Cas9의 HNH와 RuvC 영역들은 플라스미드 DNA의 이중가닥 중 각각 한쪽 가닥만 자른다는 것을 의미한다. 누가 상보적 가닥을 자르고 누가 비-상보적 가닥을 자르는가를 결정하기 위해, mutant Cas9-crRNA:tracrRNA 복합체를 사용하여 상보적/비-상보적 DNA에 각각 방사성표지를 붙인(radiolabeled) 프로토스페이스2 올리고뉴클레이티드 DNA를 절단한 결과, HNH는 상보성 DNA 가닥을 자르고, RuvC-like는 비-상보성 가닥을 자르는 것으로 나타났다(그림 2-B). 

7▲(그림 2-A & B) Cas9는 두 개의 뉴클레아제 영역이 있음. (A) (위) Cas9의 도매인에는 RuvC I-RuvC II-RuvC III와 HNH가 있는데, RuvC I의 잔기들에 있는 Asp10→Ala10으로 바꾸어 돌연변이 D10A를 디자인 하고, HNH의 잔기들에 있는 His840→Ala840으로 바꾸어 돌연변이 H840A을 디자인함. (아래) WT Cas9 or mutant Cas9-crRNA-sp2:tracrRNA로 절단한 결과, WT는 정상이지만, 돌연변이들은 비-정상의 절단 물을 생성함. (B) 돌연변이 D10A와 H840A는 서로 다른 위치의 가닥을 절단함. Image Credit: Jinek et al., Science, 17 Aug 2012.

자 이번에는 crRNA와 tracrRNA에는 몇 개의 nt들이 있어야 Cas9이 표적 DNA를 가장 효과적으로 자르는지를 연구한 결과를 살펴보자. 앞서 tracrRNA는 89~75개의 뉴클레오티드가 들어있다고 했다. 다우드나 교수 연구 팀은 42개의 nt로 이루어진 crRNA와 다양하게 nt를 줄인(truncated) tracrRNA를 재구성하고 절단 실험을 하였다. 이 실험의 목적은 tracrRNA의 크기를 조금씩 달리해서 원래 자르는 것과 비슷한 정도로 자르는 조각 tracrRNA를 찾는 것이 목적이다. 다르게 말하면 tracrRNA와 crRNA의 어느 부분이 자르는데 핵심적인 역할을 하는지 찾는 실험이다.

그 결과 원래 tracrRNA 중에서 23번째부터 48번째까지의 시퀀스로 이루어진 tracrRNA도 가장 강력한(robust) 절단을 하는 것으로 나타났다(<그림 3-A & C>). 이번에는 4번째부터 89번째까지의 시퀀스를 가진 tracrRNA와 nt 개수를 1~42, 1~36, 1~32, 11~42로 줄인 crRNA를 사용하여 표적 DNA 절단을 시도한 결과 <그림 3-B>에서 보는 바와 같이 crRNA의 5’-말단(terminal)에 있는 10개의 nt가 crRNA에서 누락되어도(missing) 100% 절단은 아니지만 어느 정도 절단이 유도되는 것으로 나타났고(<그림 3-B>의 노란색 부분), 3’-말단(end)의 crRNA의 1~10의 nt들이 누락된 경우에는 절단은 일어나지 않았다(<그림 3-B>의 빨강색 부분). 이것은처음의 nt들이 잘 맞아야 절단이 잘 일어남을 증명하는 것이다.

8▲(그림 3-A~C) 42개의 nt로 이루어진 crRNA와 23~48 사이의 nt로 이루어진 tracrRNA가 쌍을 이룰 때 Cas9의 절단 효과가 큰 것으로 나타남. 오리지널 이미지를 필자가 박스와 O/X로 아래의 48~23과 간격 바로 처리함. 3’-말단의 crRNA의 1~10의 nt들이 누락된 경우에는 절단은 일어나지 않음. 이것은 처음의 nt들이 잘 맞아야 절단이 잘 일어남을 증명하는 것임. Image Credit: Jinek et al., Science, 17 Aug 2012.

자 이번에는 박테리아에서 프로토스페이서 염기서열의 매치와 미스매치(mismatch) 정도를 알아보기 위해, 단일 염기 돌연변이들(single-nucleotide mutations)을 가진 프로토스페이서 플라스미드 DNA를 디자인하고, 세포 안에서 실험을 하는 in vivo 방식과 in vivo 방식을 모방해 세포 밖의 튜브에서 실험하는 in vitro 방식으로 Cas9의 절단 능력을 분석했다. 그 결과 프로토스페이서 내에 단일 염기가 바뀐 경우(돌연변이 된 경우), PAM에가까운영역에있는돌연변이들이있는곳에서의Cas9은 생체(in vivo) 내에서 작동하지 않았다. 또한 튜브에서의(in vitro) 플라스미드 절단 효율(plasmid cleavage efficiency)이 크게 떨어졌다.

in vitro: 생체 분자들의 상호작용이나 생명현상을 연구하는 방법에는 4가지가 있는데 그 용어는 모두 라틴어로, (1) 실제 살아있는 생물/동식물/사람의 세포분자에서 실험하는 방법을 in vivo, (2) in vivo 방식을 모방해 세포 밖에서 글라스나 테스트 튜브 등을 이용해 여러 단백질이나 기타 요소를 섞어주며 실험하는 방법을 in vitro, (3) in vivo 와 in vitro 의 중간 단계인 실제 조직기관에 인공혈액을 넣기 등의 in situ 방법, 그리고 (4) 실시간 또는 가상의 컴퓨터 시뮬레이션/모델링 및 실리콘 칩에 의한 가상분자 등을 활용하는 시스템 생물학(System Biology)이나 생물정보학(Bioinformatics)으로 연구하는 in silico 방법이 있다. 소개되는 논문에 이러한 단어가 있으면 이를 참조로 이해하면 된다.

PAM 위쪽으로(upstream) 가장 가까운 곳에서 먼 방향으로 3번-4번-5번-6번-7번-10번-22번의 nt를(<그림 3-D>의 오른쪽 아래 빨강색의 nt) 각각 돌연변이 시켰을 때 절단 효율은, PAM과 가까이에 있는 nt가 돌연변이 되었을 때 효율이 가장 낮았다. 돌연변이 3번-4번-5번에서는 거의 절단이 안 일어났고, 7번은 조금, 10번-22번은 정상적인 WT와 거의 같은 효율로 일어났음을 알 수 있다. 이것은crRNA가 PAM과 가까이 있는 부분의 시퀀스와 완전히 결합해야 절단 효율이 가장 좋다는 것을 의미하는 것이다. 이것은 처음 시작에 문제가 없을 때 효율이 가장 좋다는 것을 의미하는 것이다.

9▲(그림 3-D) 각각 다른 돌연변이 nt를 가진 프로토스페이서 2의 미스매치(불일치) 정도. WT는 정상 crRNA-sp2를 가지고 있는 세포, △ CRIPSR은 crRNA-sp2가 없는 세포. 절단 효율은 플라스미드 DNA 1 마이크로 그램 당 콜로니-형성 단위(colony-forming units (CFU) per microgram of plasmid DNA). Image Credit: Jinek et al., Science, 17 Aug 2012.

이것은 프로토스페이서의 PAM과 인접한 시드 영역(seed region)이 중요하다는 것을 의미한다. 따라서 다음과 같은 내용이 증빙되었다. crRNA와 PAM과 인접한 표적 DNA 사이에는 적어도 13개의 염기들이 정상적으로 결합하여야 절단이 잘 일어난다는 것이다. PAM에서 먼 5’-말단으로부터 19~20(정상 18개), 17~20(정상 16개), 15~20(정상 14개)의 돌연변이들은 WT와 유사하게 절단한 반면, 13~20(정상 12개), 11~20(정상 10개), 9~20(정상 8개)의 돌연변이들은 절단이 일어나지 않았다(<그림 3-E>). 

10▲(그림 3-E) crRNA와 PAM과 인접한 표적 DNA 사이에는 적어도 13개의 염기들이 정상적인 결합을 이루어야 절단이 잘 일어남. Image Credit: Jinek et al., Science, 17 Aug 2012.

11▲(그림 4-B) 정상적인 PAM을 가진 WT와 돌연변이 PAM1과 PAM2를 가진 프로토스페이서 4 올리고뉴클레오티드 DNA의 절단 결과. 오리지널 이미지를 필자가 박스 처리함. Image Credit: Jinek et al., Science, 17 Aug 2012.

자 이번에는 PAM의 중요한 역할을 알아보기 위해 정상적인 PAM을 가진 WT와 돌연변이 PAM1과 PAM2를 가진(<그림 4-B>의 빨강색 염기 쌍) 프로토스페이서 4 올리고뉴클레오티드 DNA의 절단 결과, WT는 dsDNA의 양 가닥을 잘랐으나 돌연변이 PAM1과 PAM2는 아무 가닥도 자르지 않은 것으로 나타났다. 따라서 PAM은 CRISPR/Cas9 시스템에서 반드시 필요하다는 것을 증빙한 것이다.

이번에는 crRNA:tracrRNA를 하나의 단일 키메라 RNA를 만들어 실험한 결과를 보자. 다우드나 교수 연구팀은 crRNA의 3’-말단과 tracrRNA의 5’-말단을 하나로 합쳐 3'→5'의 머리핀 모양 구조(hairpin structure) – 4개의 염기인 GAAA로 tetraloop 형성 – 의 두 가지 버전인 키메라 A와 B를 디자인했는데, A는 B보다 5개에서 12개의 nt를 더 가진 긴(longer) 키메라였는데, <그림 5-B & C>에서 보는 바와 같이 짧은 키메라 B는 잘 작동하지(did not work efficiently) 않았다.

12▲(그림 5-B & C) Short chimeric RNA는 잘 작동하지 않음(절단이 안 일어남). 오리지널 이미지를 필자가 박스 처리함. Image Credit: Jinek et al., Science, 17 Aug 2012.

마지막으로 이런 시스템이 다른 곳에 응용 될 수 있는지 확인하였다. 녹색형광단백질(GFP, Green Fluorescent Protein)을 코딩한 키메라 sgRNA 5개를 디자인하고, 잘리는 효과(efficacy)를 테스트했다(<그림 5-D>). 그 결과 5가지 모두 플라스미드 DNA의 정확한 위치를 절단했다. 이것은 키메라 RNAs를 합리적으로 디자인하면 원하는 표적 DNA의 어떤 곳도 자를 수 있다는 것을 제안하는 것이다.

13▲(그림 5-D) 키메라 RNAs를 합리적으로 디자인하면 원하는 표적 DNA의 어떤 곳도 자를 수 있음. Image Credit: Jinek et al., Science, 17 Aug 2012.

마지막으로 다우드나 교수 팀은 병원균(pathogen)인 화농연쇄상구균(Streptococcus pyogenes, SF370)이 가장 효율적인 CRISPR/Cas9 시스템을 갖고 있다는 것을 어떻게 발견했을까? 우선 기원이 동일하여 형태나 발생에서 유사성을 가지는 종분화적 상동성들(오솔로지, orthologs)을 연구했는데, 그것들이 화농연쇄상구균(Streptococcus pyogenes, Spy), 리스테리아균(Listeria innocua, Lin), 연쇄상구균(Streptococcus thermophiles, Sth), 캄필로박터제주니균(Campylobacter jejuni, Cje), 수막염균(Neisseria meningitides, Nme) 등의 야생형들(WTs)이다. 이들에서 각각 Cas9과 RNA를 추출하고 정제하는 과정을 거쳐, 대장균에 주입해 이들의 절단 능력을 분석했다. 

그 결과 (그림 S11-A) 에서 보는 바와 같이 Spy의 Cas9과 Spy의 tracrRNA:crRNA-sp2가 가장 효율적인 절단 능력을 가고 있음을 발견한 것이다. 
,
14
▲(그림 S11-A) Spy의 Cas9과 Spy의 tracrRNA:crRNA-sp2가 가장 효율적인 절단 능력을 갖고 있음을 발견. Image Credit: Jinek et al., Science, 17 Aug 2012. 

계속해서 프로토스페이서 1을 가진 올리고뉴클레이티드 DNA를 절단한 결과, Spy의 Cas9과 Spy의 tracrRNA:crRNA-sp2가 매칭을 이룰 때 이중가닥을 가장 효율적으로 자르는 것으로 나타났다(그림 S11-B). 

15▲(그림 S11-B) Spy의 Cas9과 Spy의 tracrRNA:crRNA-sp1이 매칭을 이룰 때 이중가닥을 가장 효율적으로 자르는 것으로 나타남. Image Credit: Jinek et al., Science, 17 Aug 2012. 

다우드나 교수 팀의 연구는 인간이나 동물의 진핵세포(eukaryotic cell)가 아닌 원핵생물(prokaryotes)인 박테리아에서 크리스퍼/카스 시스템을 추출하고 세포대상(in vivo)이 아닌 세포가 없는 시험관 튜브(cell-free, in vitro)에서 절단효과 실험을 했고, 그 결과 절단은 확인했지만, 절단 후 복구과정에서 유도된 돌연변이의 삽입(insertions)과 결실(deletions)을 나타내는 인델(Indels)의 빈도(%)를 검증하지 못했다는 단점이 있긴 하지만, 처음으로 CRISPR/Cas9 시스템의 기본 메커니즘을 밝혀냈다는 데에는 모두가 인정하고 있다. 또한 다우드나 교수팀은 CRISPR-Cas9을 게놈 교정(genome editing)에 사용할 수 있을 것이라고 제안했으나 많은 전문가들은 이에 회의적이었다. 왜냐하면 그 구체적 방법 즉, 진핵세포 핵 안으로 세균 유래인 Cas9-guide RNA complex를 전달하는 방법을 제안하거나 입증하지 못 했고, 히스톤 단백질에 감여 있는 상태로 돌돌 말려서 크로마틴(chromatin) 구조를 이루고 있는 진핵세포 DNA에 결합해 절단할 수 있을지 불확실했기 때문이다(Commented by 김진수 교수, 13 Jul 2017). 

Commented by 김진수 교수, 13 Jul 2017, 위 내용에 대해 필자가 확신이 없어 2017년 7월 13일에, 기초과학연구원(IBS) 유전체교정연구단장이자 서울대 화학부 ‘김진수’ 교수님께 리뷰를 부탁 드려 2017년 7월 13일에 코멘트주신 내용을 반영한 것이다. 김진수 교수 팀은 1세대-2세대-3세대-3.5세대-염기교정 등에 대해 그간 논문 70여편을 발표하였다. 본 보고서의 내용이 3세대와 특허를 중심으로 하기 때문에, 김진수 교수 팀의 3.5세대인 CRISPR/Cpf1과 염기교정(Base Editor)에 대해서는 다음 보고서에서 자세히 소개하기로 한다.

그럼 다음에는 다우드나 교수 팀이 밝힌 CRISPR/Cas9 시스템의 기본 메커니즘을 이용해 동물/인간 등 진핵세포를 대상으로 연구한 MIT의 펭 장(Feng Zhang) 교수 팀과 서울대의 김진수 교수 팀의 논문을 분석해보자.

 

크기변환_사본-10632695_637493523030856_2757249799481243589_n차원용 소장/교수/MBA/공학박사/미래학자

아스팩미래기술경영연구소(주) 대표, (전)국가과학기술심의회 ICT융합전문위원회 전문위원, 국토교통부 자율주행차 융복합미래포럼 비즈니스분과 위원, 전자정부 민관협력포럼 위원, 국제미래학회 과학기술위원장

 

3 COMMENTS