(출처:pexels.com)
(출처:pexels.com)

[데일리포스트=최율리아나 기자] 우리의 몸을 구성하는 단백질은 DNA 염기서열에 맞춰 합성되지만 인간 유전체(human genome) 가운데 단백질 합성에 직접 관여하는 것은 불과 3% 정도다. 

나머지 97%는 도대체 어떤 기능이 있는지 알 수 없는 이른바 ‘정크 DNA'라고 불리는 비암호화 DNA(non-coding)이다. 유전 정보가 없기 때문에 정크(쓰레기)로 불리고 있는 것.

최근 인간 유전체를 딥러닝(Deep Learning)으로 분석해 정크 DNA로 알려진 영역에서 자폐증에 관여하는 유전자를 새롭게 발견했다는 연구 결과가 국제 학술지인 '네이처 제네틱스(Nature Genetics)'에 게재됐다. 

국제 학술지 '네이처 제네틱스'에 게재된 연구팀 논문
국제 학술지 '네이처 제네틱스'에 게재된 연구팀 논문

딥러닝 분석으로 정크 DNA 영역에서 자폐증 관련 유전자를 발견한 것은 프린스턴 대학 생물학 연구소(Lewis-Sigler Institute for Integrative Genomics) 소속 지엔 조우(Jian Zhou) 등이 이끄는 연구팀이다. 

연구팀은 1790명의 ​​자폐증 환자와 자폐증 환자 가족의 전체 유전체(게놈)를 딥러닝 기반으로 분석했다. 이 과정에서 혈연관계에서 유전된 자폐증 유전자의 영향을 배제하기 위해 가족 및 친척 가운데 자폐증 환자가 있는 경우는 제외했다.  

(출처:pxhere.com)
(출처:pxhere.com)

그 결과 단백질 합성에 직접 관여하지 않는 정크 DNA에서 자폐증 관련 유전자 배열을 발견하는 데 성공했다. 분석에 따르면 기존에 자폐증과 관련성이 입증된 단백질 합성 유전자도 발견되었는데, 해당 유전자 배열은 이번에 확인된 유전자 배열 전체의 30% 정도에 불과하며 나머지 70%가 정크 DNA 영역에서 발견됐다.  

지금까지 정크 DNA는 단백질을 합성하지 않는 대신 어떠한 조정 기능을 할 것이라고 추측되어 왔지만 구체적인 사례는 거의 확인된 바 없다. 이는 정크 DNA가 맥락 없는 임의의 염기서열 밖에 없어 환자 유전체와 일반인 유전체를 비교해도 그 차이가 무엇을 의미하는지 알 수 없고, 원인도 특정할 수 없었기 때문이다. 

(출처:pixabay.com)
(출처:pixabay.com)

하지만 딥러닝 기술을 적용한 연구팀의 분석 방법은 배열의 차이 자체에 주목해 질환과의 관련성을 예측할 수 있다. 즉 무작위로 유전체를 비교하는 것이 아닌, 질환과 관련성이 깊은 유전자 변이에 초점을 맞춰 연구를 진행할 수 있게 된 것.  

연구팀의 공동연구원 올가 트로야스카야(Olga Troyanskaya) 교수는 이번 발견에 대해 "딥러닝 분석을 통해 자폐증뿐만 아니라 원인유전자를 발견하지 못한 다양한 질환의 원인을 파악할 수 있다. 지금까지 소홀했던 97%의 유전자에서 많은 발견을 기대할 수 있다"는 견해를 밝혔다. 

저작권자 © 데일리포스트 무단전재 및 재배포 금지