남성 성염색체의 전체 DNA 코드 서열 완전 해독

기초과학 / 문광주 기자 / 2023-08-24 09:57:48
3'30" 읽기
- 남성호르몬의 복잡한 구조가 비정상적으로 많은 반복 부분으로 이뤄져 해독이 어려웠다.
- 이전에 알려진 서열에 약 3천만 개의 염기쌍과 41개의 단백질 코딩 유전자를 추가
- Y 염색체의 완전한 서열 분석으로 이제 전체 인간 게놈이 완전히 매핑됨
- 불임의 원인을 진단하기가 더 쉽다.

Y 염색체가 처음으로 완전히 해독됨
남성 성염색체의 최초의 완전한 DNA 코드


처음으로 남성 성염색체의 전체 DNA 코드 서열이 분석됐다. 이는 Y 염색체에 대한 최초의 완전한 매핑이다. 이전에 알려진 서열에 약 3천만 개의 염기쌍과 41개의 단백질 코딩 유전자를 추가한 것이다. 또한 의학적으로 중요한 많은 유전자 복합체와 복사본의 기본 서열을 보여준다. Y 염색체의 완전한 서열 분석으로 이제 전체 인간 게놈이 완전히 지도화되었다. 

▲ 남성 성염색체는 생물학적 성과 생식에 중요합니다. © vchal/게티 이미지

남성 성염색체는 인간 염색체 중 가장 작고 가장 열악한 염색체다. 진화 과정에서 유전 정보의 거의 90%가 손실되었다. 그럼에도 불구하고 Y 염색체는 반드시 필요하다. 남성의 성 발달과 정자 생산을 조절하고 세포 분열인 감수분열에 중요한 유전자를 운반하기도 한다. 최근 연구에 따르면 노인 남성의 일부 세포에서 Y 염색체가 손실되면 심장병, 암 및 기타 질병의 위험이 증가하는 것으로 나타났다.

Y 염색체가 복잡한 이유

이러한 중요성에도 불구하고 Y 염색체는 아직 완전히 서열이 밝혀지지 않은 게놈의 유일한 부분이었다. X 염색체와 게놈의 나머지 부분은 2022년부터 원활하게 매핑되었다. 그에게서 필수 유전자가 알려졌음에도 불구하고 그의 DNA 코드 중 약 절반은 순서가 없는 상태로 남아 있었다. 그 이유는 남성호르몬의 복잡한 구조가 비정상적으로 많은 반복 부분으로 이루어져 있기 때문이다. 회문구조(palindrome : DNA 분자상의 염기서열이 오른쪽에서 읽어도, 왼쪽에서 읽어도 같은 구조를 가지는 현상)그 그 안에 축적된다. DNA 코드가 서로의 거울 이미지처럼 정확하게 복사되는 긴 뻗기이다.

과거에 사용된 서열 분석 방법으로는 복사된 부분이나 매우 유사한 부분을 읽고 올바른 순서로 재조립하는 것이 불가능했다. 그러나 기술 발전 덕분에 시퀀싱 시스템은 이제 한 번에 최대 백만 개의 염기쌍 섹션을 읽을 수 있다. 이를 통해 동일한 반복을 많이 수행하여 게놈의 일부라도 해독할 수 있다. 한편, 인공지능은 DNA 조각을 조립하는 데에도 사용된다.
▲ Y 염색체는 가장 작고 열악한 염색체이지만, 특히 서열을 완전하게 파악하는 것은 어렵다. © Darryl Leja/국립인간게놈연구소(NHGRI)

이전에 매핑되지 않은 3천만 개의 염기쌍

이러한 방법을 사용하여 T2T(Telomere-to-Telomere) 컨소시엄은 이제 Y 염색체의 염기서열을 완전히 분석하는 데 성공했다. 베데스다 소재 국립인간게놈연구소(NHGRI)의 Arang Rhie와 그의 동료들은 "결과 지도에는 간격이나 모델 추가 서열 없이 Y 염색체의 6246만 염기쌍이 모두 포함되어 있다"고 보고했다. 따라서 서열분석은 이전에 알려진 이 염색체의 DNA 부분에 약 3천만 개의 염기쌍을 추가했다.

새로 배열된 섹션에는 41개의 단백질 코딩 유전자와 수많은 팔린드롬(회문) 및 반복된 시퀀스가 ​​포함된다. NHGRI의 컨소시엄 리더인 Adam Phillippy는 "가장 놀라운 점은 이러한 반복이 어떻게 정렬되어 있는지였다"며 “우리는 누락된 부분이 어떻게 구성되어 있는지 사전에 정확히 알지 못했고 매우 혼란스러웠을 수도 있다. 대신에 이 염색체의 거의 절반은 위성 DNA라고도 알려진 두 개의 특정 반복 서열의 교대 블록으로 구성된다. 퀼트 같은 멋진 패턴을 만들어낸다”고 말했다.

불임의 원인을 진단하기가 더 쉽다.

Y 염색체의 완전한 서열분석은 또한 의학적으로 중요한 부분에서 몇 가지 특징을 드러낸다. 그중 하나는 정자 생산에 중요한 여러 유전자를 포함하는 소위 무정자증 인자 영역에 영향을 미친다. 이 시퀀싱에서는 여러 개의 회문(palindrpme)이 나타났다.

"이러한 회문은 때때로 DNA 가닥에 루프를 생성할 수 있기 때문에 이 구조는 매우 중요하다"라고 Rhie는 설명했다. "이러한 루프가 우연히 절단되면 게놈에 유전적 결함이 발생할 수 있다." 무정자증 인자 영역의 이러한 DNA 손실은 영향을 받은 남성의 정자 생산을 방해하고 불임을 유발하는 것으로 알려져 있다. 현재 알려진 이 영역의 시퀀스 덕분에 이러한 손실은 미래에 더 쉽게 식별될 수 있다.

복사 복합체의 개별 변형

Y 염색체의 의학적으로 중요한 또 다른 부분은 소위 TSPY 배열이다. 여기에는 정자 생산에도 중요한 TSPY 유전자와 그 수많은 사본이 포함된다. 그들은 함께 전체 인간 게놈의 두 번째로 큰 복사본 복합체를 형성한다. 새로운 서열 분석은 이제 처음으로 이 TSPY 배열의 정확한 기본 서열을 보여 주며, 사본의 수가 남성마다 10~40개 사이로 다양할 수 있음을 알게 됐다.

"이전에 알려지지 않은 변종을 발견하면 인간 건강을 더 잘 이해하는 데 도움이 될 것이라는 희망이 항상 있다"고 Phillippy는 말했다. "의학적으로 관련된 게놈 변이체는 미래에 더 나은 진단 방법을 개발하는 데 도움이 될 수도 있다." 볼티모어에 있는 존스 홉킨스 대학교의 공동 저자 Dylan Taylor도 비슷한 견해를 가지고 있다. "이제 우리는 Y 염색체의 100% 완전한 서열을 얻었으므로 우리는 이전에 인간의 특성과 질병에 영향을 미칠 수 있었던 수많은 유전적 변이를 식별하고 탐색할 수 있다"라고 Taylor는 말했다.

박테리아 게놈의 Y-DNA

Y 염색체의 완전한 해독은 완전히 예상치 못한 또 다른 발견을 가져왔다. 연구자들은 새로 생성된 DNA 서열을 박테리아 게놈의 대규모 데이터베이스의 서열과 비교했을 때 놀라운 수의 유사성을 발견했다. 데이터베이스에 포함된 5,100개 이상의 박테리아 게놈에는 인간 Y 염색체 코드의 짧은 부분이 포함되어 있다.

Rhie는 “놀랐다”라고 말했다. 해독 후 박테리아 게놈은 인간 DNA에 의한 오염 가능성을 정기적으로 확인했다. 그러나 이러한 테스트는 서열이 알려진 인간 DNA 단편만을 검출할 수 있으며, 남성 성염색체의 큰 부분에는 그렇지 않다. 이제 Y 염색체의 DNA 지도에 있는 간격의 현재 순서를 통해서만 이러한 불순물을 식별할 수 있다.
(Nature, 2023; doi: 10.1038/s41586-023-06457-y)
출처: NIH/ National Human Genome Research Institute, Johns Hopkins University

[더사이언스플러스=문광주 기자]

[ⓒ the SCIENCE plus. 무단전재-재배포 금지]