강좌 정보
2025 제19회 통계유전학워크샵
19th Asian Institute in Statistical Genetics and Genomics
기본 개요
강좌명
머신러닝 기법을 활용한 오믹스 빅데이터 분석
주강사
이제근 (숭실대학교), 선호근 (부산대학교)
조교
-
날짜
2025.07.24 09:20 ~ 2025.07.25 17:10
강좌 방식
Day 1: 온라인(녹화) // Day 2: 오프라인
강좌 정보

본 강좌에서는 머신러닝 통계 분석 기법을 활용하여 오믹스(omics) 빅데이터를 분석하는 여러 가지 방법들을 학습한다. 통계 분석 모형 및 이론에 대한 간략한 소개와 함께 통계 패키지 R 프로그램을 이용한 데이터 분석 실습을 병행한다. 또한 실제 유전체 빅데이터 분석 실습을 통하여 의생명과학적 의미를 도출하는 방법도 함께 다룬다. 강의는 크게 두가지 파트로 나뉜다.


첫번째 파트는 주로 빅데이터 분석에 사용하는 기본적인 기계학습 기반 방법들에 대해 배운다. 구체적으로는 기계학습의 기본 개념에 대해 학습하고, regression 및 classification 방법들에 대해 이론적인 설명과 실습을 함께 진행한다. 또한 k-means clustering, hierarchical clustering을 비롯하여, PCA, NMF, t-SNE, UMAP 등의 차원 축소(dimensionality reduction) 및 시각화 방법들에 대해서도 실습과 함께 살펴본다.


두번째 파트는 주로 유전체 빅데이터 연관분석(genetic association study)에 사용하는 regularization technique들을 R 패키지 실습을 통해 학습한다. 고차원 유전체 데이터(high-dimensional genomic data) 분석에서 질병관련 유전체 선별을 위해 사용되는 lasso 및 elastic-net regularization 방법을 포함하여 유전체 그룹 및 네트워크 구조를 활용한 group lasso와 network-based regularization 방법들도 함께 다룬다.

기타
인터넷 접속 필요여부
웹서핑
동영상
파일 다운로드
기타
교육생 개인 노트북
필요 필요하지 않음
세부 안내사항
R 프로그램으로 유전체 데이터 분석 가능한 노트북 필요 (Windows 와 Mac 모두 사용 가능)
수강생 수준

강좌 난이도: 상 /

수강생 수준: R 프로그램에 대한 경험 및 기초 지식을 권장하나, 미경험자도 강의를 수강할 수 있도록 R 프로그램에 대한 간단한 기본 소개는 강의 초반에 진행할 예정임.

수강생 준비물
R 최신버전 설치 및 R 실행 환경을 갖추고 참석하기 바람.
기타 안내사항
수업 시간에 사용할 R 패키지 (R packages) 설치는 강사별로 별도의 안내가 있을 예정임
교육일정
구분 세션 시간 강의내용 강사명 비고
Day 1 Session 1 09:20~10:50 R을 이용한 데이터 분석 및 기계학습의 기본 개념 이제근 강의/실습 (녹화)
Day 1 Session 2 11:00~12:30 데이터 회귀 및 분류 (Regression & Classification) 이제근 강의/실습 (녹화)
Day 1 Session 3 14:00~15:30 데이터 군집화 (Clustering) 이제근 강의/실습 (녹화)
Day 1 Session 4 15:40~17:10 데이터 차원 축소 (Dimensionality reduction) 이제근 강의/실습 (녹화)
Day 2 Session 1 09:20~10:50 유전체 선별을 위한 Lasso 방법 (Lasso for Gene Selection) 선호근 강의/실습 (대면)
Day 2 Session 2 11:00~12:30 유전체 선별을 위한 Elastic-net 방법 (Elastic-net for Gene Selection) 선호근 강의/실습 (대면)
Day 2 Session 3 14:00~15:30 유전체 그룹 선별을 위한 group lasso 방법 (Group Lasso for Genetic Pathway Selection) 선호근 강의/실습 (대면)
Day 2 Session 4 15:40~17:10 난소암 DNA 메틸화 데이터 분석 (Analysis of High-dimensional DNA methylation ovarian cancer data) 선호근 강의/실습 (대면)