top of page

유전체학개론 강좌 소개

 

이 과목은 숭실대학교 3학년 가을학기에 강의합니다. 미생물 게놈 시퀀싱 데이터(생거방법)를 공개 데이터베이스에서 다운로드하여 조립하고, 유전자 예측 및 기능 부여를 실습합니다. 리눅스 컴퓨터만을 사용하기에 자연스레 리눅스 명령어를 익히게 됩니다.

본 강좌에는 온라인 비디오를 이용한 플립드러닝 형태로 운영됩니다.

먼저 생거시퀀싱의 원리를 알아보고, 생거법으로 한번에 읽을 수 있는 염기의 길이는 500염기쌍 내외인데, 수백만 염기쌍 길이의 미생물 게놈을 완벽히 시퀀싱하기 위해서는 얼마만큼 시퀀싱을 해야하는지 공부함. 예제 데이터를 NCBI에서 다운로드하고, 이를 CAP3를 이용하여 조립을 실습함. 조립된 콘티그의 길이 총합을 계산하고, Tablet을 사용하여 조립된 결과를 검토할 것임.  콘티그를 연결하는 뼈대화 개념도 소개함.

Gene function annotation & operon structures

예측된 유전자들을 표준 균주의 단백질들과 BLASTp를 통하여 비교하여 보고, rps-BLAST를 통하여 COG도메인 분석을 시행함. 각 단백질을 COG 기능코드별로 분류하고, 동일한 기능 코드를 갖는 단백질이 게놈 상에 같은 방향으로 연속적으로 위치하게 되면 오페론의 가능성이 높다고 보고, 이를 찾는 방법을 리눅스 쉘 스크립트로 구현해 봄

Predicting genes from a genome sequence

조립된 게놈 서열로부터 유전자의 위치를 예측하는 원리와 함께 실습을 하는 시간임. Open reading frame의 길이, Shine-Dalgarno 서열, G+C content와 코돈 빈도 간의 상관관계 등의 개념과 이들이 유전자 예측에 사용되는 원리를 공부하고, GeneMarkS 프로그램을 실행하여 각 콘티그 별로 유전자를 예측함. 예측된 유전자들의 길이 등에 대한 분포도 조사함. 

Linux commands and Ubuntu GUI

이 강좌의 가장 큰 목적 중의 하나가 리눅스 시스템에 익숙해지는 것임. 생명정보학의 모든 분석은 리눅스 플랫폼에서 이뤄지기 때문에, 리눅스를 잘 활용할 수 있는 필요함. 복잡한 프로그래밍을 하지 않아도 리눅스 명령어를 적절히 조합하면 훌륭한 작업을 할 수 있음을 익히고, 더불어 쉡 스크립트 활용을 통하여 프로그래밍 로직에 대해서도 접하게 됨.

bottom of page