3.5세대 유전자 가위(CRISPR/Cpf1) 논문 분석 6

- 하버드대학 케이스 정(Keith Joung) 박사 팀, Cpf1의 정확성 입증

요약 – 생명과학자들은 최근 3세대를 넘어 보다 정확하고 표적에 특이적인 3.5세대 유전자 가위(CRISPR/Cpf1)를 발견하고 개발했다. 인간세포와 동식물세포의 유전자를 마음대로 교정하는데(Editing) 사용한다. 표적 DNA를 자른 후 세포 내 복구 시스템에 의해 다시 연결되는 과정에서 유전자 교정과 원하는 변이가 일어난다. 이 방식을 활용해 암과 AIDS 등뿐만 아니라 더 나아가 희귀난치병 치료나 작물•가축개량•미래식량(Clean meat) 분야에서 유전자 가위 혁명이 빠르게 확산되고 있다. 특정 유전자 부위를 정확하게 잘라 내 그 기능을 알아내는 데에도 사용되고, 쥐를 대상으로 특정 유전자를 제거/억제하거나(Knock-out) 특정 유전자를 삽입하여(Knock-in) 희귀 병을 가진 쥐를 만들기도 하는데, 종전에는 수개월~수년이 걸렸지만 유전자 가위를 이용하면 시간과 비용을 획기적으로 줄일 수 있기 때문이다. 이렇듯 인류는 세포 안에 있는 특정 유전자나 염기를 골라서 제거하거나 정상으로 바꿀 수 있는 유전자 가위 기술을 보유했다. 

본 보고서에서는 3.5세대 유전자 가위에 대한 논문 공개 순으로 내용을 살펴보고 분석해 인사이트를 제공하고자 한다. 아울러 논문분석이기 때문에 오류가 있을 수도 있다는 점을 알려드리는 바이다.

글 싣는 순서

1장. Cpf1 발견의 과정 
2장. 펭 장 교수 팀, 새로운 CRISPR/Cpf1의 발견과 인간 세포대상 연구결과(2015) 
3장. CRISPR/Cpf1유전가 가위 전쟁(2016)
3-1. 김진수 교수 팀, 쥐의 표적 돌연변이유도와 털 색이 다른 쥐의 생성
3-2. 서울아산병원 및 울산의대, 녹아웃(Knockout) 마우스의 생성
3-3. 김진수 교수 팀, Cpf1의 정확성 입증 

3-4. 하버드대학 케이스 정 박사 팀, Cpf1의 정확성 입증
정확도를 다트게임으로 묘사(2016)
5장. Discussion


3장. CRISPR/Cpf1유전가 가위 전쟁(2016)

2016년 8월, 유전자 교정에 대해 10년 가까이 논문을 다룬 생명과학 및 화학분야 국제학술지 ‘네이처 바이오테크놀로지(Nature biotechnology)’에는, 앞서 살펴본 펭 장 교수가 밝힌 3.5세대 CRISPR/Cpf1의 메커니즘(Zetsche et al., Cell, 25 Sep 2015)을 활용한 연구성과 3편이 실렸는데, 공교롭게도 모두 우리나라 연구팀의 연구성과였다. 기초과학연구원(IBS) 유전체교정연구단 김진수 단장(서울대 화학과 교수) 연구팀의 논문이 2편, 그리고 서울아산병원 아산생명과학연구원 및 울산의대의 연구팀의 논문이 1편 등이다. 3편의 논문들 중 2편은 807~808페이지와 808~810페이지에 실린 2페이지의 논문들이고, 863~868 페이지에 실린 논문은 김진수 교수 팀의 논문이다. 이들 3편은 2016년 6월 6일에 온라인판에 공개되었던 논문들이다. 

Keith Joung
▲하버드 대학의 케이스 정(Keith Joung) 박사 (Image: Massachusetts General Hospital)

3-4. 하버드대학 케이스 정 박사 팀, Cpf1의 정확성 입증

2016년 8월, 유전자 교정에 대해 10년 가까이 논문을 다룬 생명과학 및 화학분야 국제학술지 ‘네이처 바이오테크놀로지(Nature biotechnology)’에는, 앞서 살펴본 3.5세대 CRISPR/Cpf1의 메커니즘을 활용한 연구성과 3편이 실렸는데, 공교롭게도 모두 우리나라 연구팀의 연구성과였다. 

기초과학연구원(IBS) 유전체교정연구단 김진수단장(서울대 화학과 교수) 연구팀의 논문이 2편, 그리고 서울아산병원 아산생명과학연구원 및 울산의대의 연구팀의 논문이 1편 등이다. 3편의 논문들 중 2편은 807~808페이지와 808~810페이지에 실린 2페이지의 논문들이었고, 863~868 페이지에 실린 논문은 김진수 교수 팀의 논문이었다. 이들 3편은 2016년 6월 6일에 온라인판에 공개되었던 논문들이었다. 그리고 다음에 소개할 하버드대학의 케이스 정(Keith Joung) 박사 팀의 논문이 김진수 교수 팀의 논문에 이어 869~874페이지에 1편 더 실렸는데, 이 논문은 2016년 6월 27일에 온라인판에 공개되었다.

앞서 살펴본 김진수 교수 팀의 3.5세대 유전자 가위 Cpf1의 정확성을 “전체-게놈 분석을 통한 사람 세포에서의 Cpf1 엔도뉴클레아제의 특이도 검증(Genome-wide analysis reveals specificities of Cpf1 endonucleases in human cells)”(Kim et al., Nature Biotechnology, 6 Jun 2016)이라는 논문을 통해 입증 한 후, 2주일 뒤인 2016년 6월 27일에, 하버드 의대(Harvard Medical School)와 매사추세츠 제너럴 하스피털(Massachusetts General Hospital)의 벤자민 클레인스티버(Benjamin P Kleinstiver, 교신 저자) 포스트닥터와 한인 2세인 케이스 정(J Keith Joung, 교신저자) 박사를 중심으로 하는 연구팀이 "사람 세포들에서의 크리스퍼-카스 Cpf1의 전체 게놈 특이도(Genome-wide specificities of CRISPR-Cas Cpf1 nucleases in human cells)(Kleinstiver et al., Nature Biotechnology, Aug 2016)"라는 논문을 발표했다. 

논문 요약 – 펭 장 교수 팀이 CRISPR-Cas Cpf1을 발견했지만(Zetsche et al., Cell, 25 Sep 2015), CRISPR-Cas Cpf1의 활동들과 전체 게놈 특이성들은 잘 정의되지 않았었다. 이에 연구팀은 AsCpf1과 LbCpf1이 널리 사용되는 SpCas9과 비교할 정도로 인간 세포들에서 표적 효율들(on-target efficiencies)을 갖는다는 것을 발견했다. 

또한 Cpf1 뉴클레아제를 프로그램하는 데 사용되는 짧은 CRISPR RNA(crRNA)의 3’-말단에 4~6 염기들이 단일 염기 불일치에 둔감하다는(insensitive) 것과(절단을 허용), 그러나 crRNA의 영역에 있는 다른 염기들 중 많은 염기들이 단일 또는 이중 치환(single or double substitution)에 매우 민감하다는 것(절단 허용 안 함)을 발견했다. 

이러한 결과는 Cpf1이 인간 세포에서 매우 특이적이지만(highly specific), PAM-에서 먼 말단(PAM-distal end)에서는 미스매치가 허용되고 있다는 것을 발견한 김진수 교수 팀과 일치하는 것이다(Kim et al., Nature Biotechnology, 6 Jun 2016). 이것은 그 만큼 Cpf1이 사람 세포들에서 매우 높은 표적 특이성을 보인다는 것을 시사하는 것이다. 

우선 연구팀은 U2OS 인간 세포들 내에서 품질 좋은 AsCpf1과 LbCpf1 뉴클레아제들을 평가 진단하고, 네 가지 서로 다른 인간 유전자들 내의 19 개 표적 사이트들에 대한 돌연변이유발 교정 활동들(mutagenic editing activities)을 테스트했다. 각각의 Cpf1 표적 사이트는 SpCas9에 의해 효율적으로 돌연변이가 유발될 수 있는 하나의 DNA 서열과 근접해 있다(<그림 S1>).

1▲<그림 S1> SpCas9에 의해 효율적으로 변형된(modified) 것으로 알려진 내인성 유전자들 내에서의 Cpf1 표적 사이트들은 SpCas9 사이트들과 인접. 4 개의 유전자들에서의 Cpf1과 SpCas9에 의한 표적 사이트들은 각각 파란색과 회색으로 강조 표시됨. Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

표적 사이트들 중 6 개(DNMT1 부위 1-4 및 EMX1 부위 1-2)는 이전에 HEK293 세포들에서 Cpf1 뉴클레아제들로 돌연변이가 유도된 곳이다(Zetsche et al., Cell, 25 Sep 2015). T7 엔도뉴클레아제 I(T7E1) 미스매치 절단 분석을 사용하여, 19개 사이트들에서 효과적인 인델이 유도된 것을 확인했다. 

확인 결과 AsCpf1에서 3.8 %에서 56.2 % (평균 26.7 %)의 돌연변이유발(mutagenesis) 비율을 보였고, LbCpf1에서 5.2 %에서 53.2 % (평균 = 33.8 %)를 보였다. 동일한 분석을 사용하여, SpCas9가 표적으로 하는 10 개의 근처 사이트들에서의 돌연변이유발 비율은 26.8 %에서 55.4 % (평균 = 42.5 %)를 보였다(<그림 1a>). 돌연변이 비율로만 보면 AsCpf1과 LbCpf1이 SpCas9을 못 따라가는 것으로 보이는 대목이다.

2▲<그림 1a> 인간 세포들에서 Cpf1 뉴클레아제들에 의해 유도된 표적 인델(indel) 변이율. (a) 19 개의 내인성 인간 유전자 사이들에서 AsCpf1 및 LbCpf1에 의해 유도된 내인성 유전자 변형 률(Endogenous gene percent modification) (왼쪽 패널, T7E1 분석에 의해 결정됨). AsCpf1에서 3.8 %에서 56.2 % (평균 26.7 %)의 돌연변이유발(mutagenesis) 비율을 보였고, LbCpf1에서 5.2 %에서 53.2 % (평균 = 33.8 %)를 보였으며, SpCas9가 표적으로 하는 10 개의 근처 사이트들에서의 돌연변이유발 비율은 26.8 %에서 55.4 % (평균 = 42.5 %)를 보였음. 표적 부위는 SpCas9에 의해 효율적으로 변형된(modified) 것으로 알려진 증폭산물(amplicons)에서 선택됨. Error bars, s.e.m.; n = 3. Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

AsCpf1과 LbCpf1의 표적 돌연변이유발 활성들을 SpCas9와 더 나은 비교를 하기 위해, 중복된 표적 사이트들(overlapping target sites)을 가진 22 개의 내인성 인간 유전자 표적 사이트들을 찾아냈다(<그림 1b>). 

이러한 매치된 사이트들은 김진수 교수가 2014년에 자체 개발한 비-표적 사이트들을 검색해내는 빠르고 다재다능한 알고리즘인 Cas-OFFinder(Bae et al., Bioinformatics, 2014)로 찾아냈는데, 게놈에서 예측된 비-표적 사이트들의 가변 수들(variable numbers)을 갖도록 선택되었다. 

3▲<그림 1b> AsCpf1, LbCpf1, SpCas9를 위해 하나의 공통의 프로토스페이서 서열(a common protospacer sequence)을 공유하는 매치된 표적 사이트들(Matched target sites). Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

이 22 개 유전자 표적 사이트들에 대한 AsCpf1, LbCpf1, SpCas9의 활동들을 분석한 결과 다양한 돌연변이유발 교정 효율들(variable mutagenic editing efficiencies)을 보였다(<그림 1c, d>). 시간 경과 분석(Time-course analysis)은 3 개의 다른 사이트들에 대해 각각의 AsCpf1, LbCpf1, SpCas9을 형질 주입한 후 72 시간까지 거의 최대 인델 돌연변이유발이 이루어짐을 나타냈다.

45▲<그림 1c, d> (c). T7E1 분석을 통해 AsCpf1, LbCpf1, SpCas9의 돌연변이유발이 검출. (d) 매치된 표적 사이트들에서의 활동 요약. Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

다음으로, AsCpf1과 LbCpf1의 특이성(specificities)을 평가하기 위해, crRNA-프로토스페이서 DNA 인터페이스에서 이들 핵산분해효소의 미스매치에 대한 허용(tolerance)을 조사했다. DNMT1 유전자(<그림 2a>) 내의 세가지 서로 다른 표적 사이트들을 타겟으로 crRNA의 상보성 영역 내에서(스페이서와 프로트스페이서) 한 쌍의 염기들을 불일치(돌연변이) 시켰다(이중 미스매치). 

그 결과 3 개의 표적 사이트들 모두에서, 1~18번(PAM-에서 근접한 1번에서 먼 방향으로 18번)의 이중 불일치에서는 AsCpf1 및 LbCpf1에 대한 T7E1 분석 결과 절단이 허용이 안되어 사이트 변형(site modification)이 제거되었다. 다시 말해 인델이 일어나지 않았다. 이에 반해, 위치 19와 23 번 사이의 PAM에서 먼 이중 불일치에서는 절단이 허용되어 인델을 유발했다.

이것은 앞서 살펴본 김진수 교수 팀의, 위치 1-18 번에서의 이중 불일치에서는 Cpf1 절단 활동이 일어나지 않아, 절단 능력이 완전히 손실되었고, 19~23번에서는 절단이 허용되고 있다는 내용과 일치하는 것이다(Kim et al., Nature Biotechnology, 6 Jun 2016). 이러한 결과는 Cpf1이 인간 세포에서 매우 특이적이지만(highly specific), PAM-에서 먼 말단(PAM-distal end)에서는 미스매치가 허용되고 있다는 것을 시사하는 것이다. 

6▲<그림 2a> AsCpf1 및 LbCpf1의 불일치된 crRNA에 대한 허용성(Tolerance of AsCpf1 and LbCpf1 to mismatched crRNAs). 1~18번(PAM-에서 근접한 1번에서 먼 방향으로 18번)의 이중 불일치에서는 AsCpf1 및 LbCpf1에 대한 T7E1 분석 결과 절단이 허용이 안되어 사이트 변형(site modification)이 제거됨. 다시 말해 인델이 일어나지 않았음. 이에 반해, 위치 19와 23 번 사이의 PAM에서 먼 이중 불일치에서는 절단이 허용되어 인델을 유발함. 이중 불일치는 빨강색 두 개의 염기들로 표시. Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

7▲<그림 2b> AsCpf1 및 LbCpf1의 불일치된 crRNA에 대한 허용성(Tolerance of AsCpf1 and LbCpf1 to mismatched crRNAs). 1~18번 사이의 단일 미스매치는 매우 민감한 반면, 19~23 사이의 단일 미스매치는 민감하지 않음. 단일 불일치는 빨강색 염기로 표시. Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

이번엔 김진수 교수 팀과 같이(Kim et al., Nature Biotechnology, 6 Jun 2016) DNMT1의 두 개 사이트들에서 단일 미스매치(single mismatches)의 허용성을 테스트했다. 그 결과 AsCpf1과 LbCpf1이 1~18 사이의 대부분의 위치에서 단일 미스매치된 crRNA 뉴클레오티드에 대해 매우 민감하다는 것을 제안하는 반면(용납하지 않아 절단이 안 일어나거나 덜 일어나 변형 율이 떨어짐), crRNA의 3 '말단에서의 19~23에서의 단일 미스매치에서는 효율적인 돌연변이유발 활동이 일어나, 단일 미스매치가 별 영향을 안 주면서 절단 및 돌연변이가 일어남으로, 염기인식(recognition of bases)이 꼭 필요하지 않을 수도 있다는 것을 시사하는 것이다. 

이번엔 crRNA 3’ 말단의 염기 삭제와 연장(deletions and extensions)을 통해 다양한 길이(variable-length)를 갖는 일련의 crRNA로 AsCpf1 및 LbCpf1을 테스트하여 교정을 위한 crRNA의 3'말단에서 염기 길이의 중요성을 평가 하였다. Cpf1이 3 개의 DNMT1 사이트들에 대해 염기수가 줄어든(truncated) crRNA와 쌍을 이루었을 때, T7E1 분석에 따르면 crRNA의 3’ 말단에서 4-6 개의 염기들이 제거 되더라도 돌연변이유발 효율은 견고했다(robust)(<그림 2c>). 

흥미로운 것은 표준 프로토스페이서 상보성 길이가 23-nt인 crRNA의 3' 말단에 최대 3 개의 매치된 염기를 첨가한 결과(24-nt~26-nt), AsCpf1 또는 LbCpf1에 의한 인델 형성이 실질적으로 변화하지 않았다는 점이다. 이러한 결과는 견고한 Cpf1 활성을 위해서는 단지 17 ~ 19 염기들의 crRNA 프로토스페서 상보성이 필요하며, 표준 23-nt 스페이서의 3' 말단에 4 ~ 6 염기들은 표적 사이트 절단에 필요하지 않을 수 있음을 시사하는 것이다. 

8▲<그림 2c> crRNA 3’ 말단의 염기 삭제와 연장(deletions and extensions)을 통해 다양한 길이(variable-length)를 갖는 일련의 crRNA로 AsCpf1 및 LbCpf1의 돌연변이유발 백분율의 요약. crRNA의 3’ 말단에서 4-6 개의 염기들이 제거 되더라도 돌연변이유발 효율은 견고. 표준 23-nt인 crRNA의 3' 말단에 최대 3 개의 매치된 염기를 첨가한 결과(24-nt~26-nt), AsCpf1 또는 LbCpf1에 의한 인델 형성이 실질적으로 변화하지 않았음. 견고한 Cpf1 활성을 위해서는 단지 17 ~ 19 염기들의 crRNA 프로토스페이서 상보성이 필요하며, 표준 23-nt 스페이서의 3' 말단에 4 ~ 6 염기들은 표적 사이트 절단에 필요하지 않을 수 있음. Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

또한 표준 23-nt 스페이서 서열 대신에 20-nt를 갖는 단일 미스매치된 crRNA를 사용하는 경우, 실질적으로 AsCpf1 및 LbCpf1 활성의 차이는 관찰되지 않았다(<그림 2d>). 다시 말해 20-nt나 23-nt나 같은 메커니즘이 일어난다는 것이다.

9▲<그림 2d> 길이가 23-nt 또는 20-nt 인 단일 미스매치된 crRNA로 프로그래밍한 경우 AsCpf1 및 LbCpf1의 활성 백분율. 길이와 상관없이 일정 비율 유지. Image: Kleinstiver et al., Nature Biotechnology, 27 June 2016

 

크기변환_사본-10632695_637493523030856_2757249799481243589_n차원용 소장/교수/MBA/공학박사/미래학자

아스팩미래기술경영연구소(주) 대표, (전)국가과학기술심의회 ICT융합전문위원회 전문위원, 국토교통부 자율주행차 융복합미래포럼 비즈니스분과 위원, 전자정부 민관협력포럼 위원, 국제미래학회 과학기술위원장