About CBI Lab

생명정보 지능 연구실에 오신것을 환영합니다!

CBI 연구실Machine learning, Deep learning 등을 활용한 빅데이터 기반 모델링, Algorithm 을 활용한 빅데이터 분석, 데이터 처리 및 시각화 등 컴퓨터 전공 지식들을 활용하여 생명정보 빅데이터 처리 및 분석에 관련된 다양한 연구를 진행하고 있습니다. 관심, 흥미, 학부 전공에 따라 다양한 연구 프로젝트에 참여 기회가 제공됩니다.

생명정보 데이터를 활용한 데이터 사이언스 분야에 관심이 있는 다양한 전공 (컴퓨터/소프트웨어, 통계, 생명과학, 수학 등) 인재들을 환영합니다.

Research Fields

Deep Learning 기반 모델링

최근 다양한 뉴럴 네트워크 (neural network) 모델의 발달을 기반으로 딥러닝 (deep learning)이 여러 분야에서 빅데이터 기반의 다양한 분석 및 분류 모델로서의 높은 성능과 가능성을 보여주고 있다.

이러한 딥러닝 기술을 활용하여 본 연구실에서는 DNA methylation과 miRNA 등의 후성유전체 데이터 또는 gene expression과 같은 유전체 데이터를 기반으로 여러 타입의 암 진단 및 분류 모델을 개발하는 연구를 진행하고 있다.

생명정보 빅데이터 마이닝 - 암(cancer), 후성유전체(epigenome)

수치화된 matrix 형태로 표현되는 각종 생명정보 빅데이터를 machine learning, algorithm, 통계적 기법 등을 통하여 분석한다. 특히 후성 유전의 대표적인 메커니즘인 DNA methylation은 DNA 상에서 발생하는 후성유전학적 변이로서 염기서열의 변화 없이 화학적인 변화에 의해 유전자 발현 조절, 세포 분화, 이동성 요소들의 억제와 같은 여러 생물학적 과정 속에서의 중요한 역할을 수행한다.

본 연구실에서는 data mining을 통한 수치화된 후성유전체 데이터를 분석하여 유전자 조절과 관련하여 중요성이 높은 특성을 발굴하고, 이를 질병 중에서도 특히 암과의 관련성에 대해 집중적으로 연구하고 있다.

클라우드 컴퓨팅과 분산처리

맞춤의학 및 정밀의학을 위한 유전체 및 후성유전체 분석 기술이 발전함에 따라, 대용량 시퀀싱 데이터들이 생산되면서 효율적인 바이오 빅데이터 처리의 필요성이 대두되고 있다.

본 연구실에서는 초대용량 후성 유전체 데이터 처리를 위한 분산 맵핑 알고리즘을 개발하고, 이를 클라우드 컴퓨팅(cloud computing) 환경 상에서 구축하는 연구를 진행하고 있다.

Selected Projects

지원기관 내용 기간
질병관리청 Integrated analysis of time-series multi-omics data for COVID-19 patients and development of risk prediction model 2023
한국연구재단 Developing single cell multi-omics data based explainable deep learning model and platform for disease-specific biomarker discovery 2021 - 2024
한국연구재단 Development of asthma patient Omics platform for precision medicine 2020 - 2024
농촌진흥청 Analysis of characteristic information and developing an advanced program for use of germplasm 2019 - 2023
숙명여대 IBT 융합 헬스케어 2019 - 2020
산업기술평가원 Development of international standard of a meta-service model for medical product information 2018 - 2020
한국연구재단 Development of highly parallelized distributed short read aligner for bisulfite-treated methylome data 2017 - 2019

Published Softwares & Models

Name Description Link
BiSpark a Spark-based highly scalable aligner for bisulfite sequencing data
Cloud-BS a MapReduce-based bisulfite sequencing aligner on Cloud
methCancer-gen a DNA methylome dataset generator for user-specified cancer type based on conditional variational autoencoder
meth-SemiCancer a cancer subtype classification framework via Semi-supervised learning utilizing DNA methylation profiles
moBRCA-net a Breast Cancer Subtype Classification Framework Based on Multi-Omics Attention Neural Networks
moSCminer a cell subtype classification framework based on the attention neural network integrating the single-cell multi-omics dataset on the cloud
scDAE a cell subtype classification model via representation learning based on a denoising autoencoder for single-cell RNA sequencing