일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- upstage
- 업스테이지AILab
- 패스트캠퍼스업스테이지부트캠프
- AI 부트캠프
- 취업 포트폴리오
- 무료교육
- 부트캠프
- Ai
- 업스테이지패스트캠퍼스
- 국비지원취업
- 패스트캠퍼스
- 12월3주차
- #왕십리 #성동구 #중랑구 #동대문구 #중구 #광진구 #성북구 #가산디지털 #금천구 #신도림테크노 #양천구 #영등포구 #디엠씨 #dmc #마포구 #은평구 #서대문구 #중구 #종로구 #강서구 #동작구 #관악구 #구로구 #동작구 #강남구 #송파구 #도봉구 #서초구 #노원구 #일산 #의정부 #양평 #양주 #고양 #성북구 #경기도 #서울 #휴대폰성지 #휴대폰최저가 #휴대폰
- AI부트캠프
- 패스트캠퍼스AI부트캠프
- 패스트캠퍼스부트캠프
- 국비지원
- KPT
- 패스트캠퍼스 #패스트캠퍼스AI부트캠프 #업스테이지패스트캠퍼스 #UpstageAILab#국비지원 #패스트캠퍼스업스테이지에이아이랩#패스트캠퍼스업스테이지부트
- ai 취업
- 회고
- 데이터분석
- UpstageAILab
- 데이터사이언스
- 패스트캠퍼스업스테이지에이아이랩
- 패스트캠퍼스업스테이지
- Today
- Total
차근차근잼
[2023 부트캠프] Upstage AI Lab - ML 프로젝트 데이터이해 본문
저번주 부터 ml 프로젝트가 시작되었다. 프로젝트는 kaggle competition 이나 playground, 데이콘과 같은 주제 중에서 관심있는 주제를 골라 진행하게 되었고 나는 현재진행중인 kaggle competition 인'HMS - Harmful Brain Activity Classification' 를 골라 진행하였다.
https://www.kaggle.com/competitions/hms-harmful-brain-activity-classification?rvi=1
주제 선정 이유는
1. 진행중인 대회에 참여해보고 싶었고
2. 의학 분야 데이터를 모델링하는 경험은 생소한데 한번쯤 도전해보고 싶은 과제였고
3. 이미지/영상 데이터를 다룰 것 같았기 때문이다.
주제도 주어지는 데이터도 난이도가 있어서 도메인 지식과 데이터에 대한 이해에도 시간이 꽤 소요되었다.
대회 페이지상의 설명을 보면 이 대회의 목표는 발작과 다른 유형의 해로운 뇌 활동을 감지하고 분류하는 것으로 환자들로부터 기록된 뇌전도(EEG) 신호에 기반한 모델을 개발하는 것이다. 모델의 결과로 신경중환자 치료, 간질, 약물 개발에 변혁적인 혜택을 제공하는 뇌전도 패턴 분류 정확도를 신속하게 향상시키고 이 분야의 발전은 의사와 뇌 연구자가 발작이나 다른 뇌 손상을 감지하여 더 빠르고 정확한 치료를 제공할 수 있게 할 수 있다 .... 고 한다. 대회에 참여도 하고 인류 수명 연장에 기여도 하는 그런 셈이랄까 ....
1. 데이터 이해
뇌파는 뇌세포의 활동과 기능을 시시각각 잘 반영하여 주지만 의식의 수준, 졸림, 수면의 단계, 복용하고 있는 약물 등에 따라서 변화가 심하며, 임상의들은 경험적으로 뇌파의 특정 양상이나 모양으로 중추신경계의 질환이나 기능장애를 진단하여 왔다고 한다.
위 그림과 같이 머리에 montage 라고 하는 전극을 머리에 배치한다.
EEG 연구의 첫 단계는 전극의 배치이며, 이는 국제 표준인 10-20 시스템을 일반적으로 사용한다.
이 시스템은 두개골을 10% 또는 20%의 증분으로 나누어 전극을 배치하여, 각 전극이 다른 모든 전극에 대해 상대적으로 위치하도록 하여, 사람들의 다양한 머리 모양과 크기에도 불구하고 모든 EEG 연구가 일관되게 수행될 수 있도록 하는 방법이라고 한다.
10-20 시스템에서는 각 전극이 뇌의 영역에 해당하는 문자와 숫자로 식별되는데
F는 전두엽, T는 측두엽, P는 두정엽, O는 후두엽을 의미한다.
Biopolar montage
해석하면 양극성 몽타주... 라는 분석방법으로는 각 전극의 전압이 인접한 전극과 연결되어 비교된다. 여기서 형성되는 전극에는 연쇄반응이 있으며, 가장 흔한 양극성 몽타주 유형중 하나는 double banana로 불리는 유형으로 각 전극이 뒤에 있는 전극과 비교된다고 한다.
무슨말인지 잘 모르겠으나 Fp2는 F8과, F8은 T4와 비교된다...
이 유형에는 외부 측두연쇄(Fp2→F8→T4→T6→O2)와 내부 두정엽연쇄(Fp2→F4→C4→P4→O2)가 각각 한 쪽에 두 개씩 있다.
'z' 전극(Fz→Cz→Pz)은 중앙에 작은 연쇄를 형성한다고 한다.
그 뒤로 더 자세한 .... 설명은 차차 하고 일단 이렇게 해서 얻은게 Spectogram 으로 이해하면 되겠다!
따라서, 대회에서 주어지는 EEG 데이터와 Spectrogram 데이터는 뇌파 측정 원본 데이터와 이것을 분석을 위해 2D 이미지화 하기 위해 재표현한 데이터라고 볼 수 있겠다.
EEG signal 데이터와 Spectogram 데이터는 위 그림처럼 하나의 Spectogram 이 여러 EEG 채널의 데이터를 공유해 만들어질 수 있다. 우리가 예측해야하는 건 EEG, Spectogram이 겹치는 중간의 10초의 발작 여부이다.
input data
- 106,800 unique rows
- 17,089 unique eeg ids
- 11,138 unique spectogram ids
- 1950 unique patient ids
target
- eeg_id
- [seizure/lpd/gpd/lrda/grda/other]_vote
데이터 분석 파트는 다음 포스트로 ....
그림, 정보 출처 https://www.learningeeg.com/montages-and-technical-components
'공부 > 23' 패스트캠퍼스 Upstage AI 부트캠프' 카테고리의 다른 글
[2023 부트캠프] Upstage AI Lab - Pytorch를 이용한 CNN (0) | 2024.03.15 |
---|---|
[2023 부트캠프] Upstage AI Lab - ML 프로젝트 중간 진행 상황 (0) | 2024.02.26 |
[2023 부트캠프] Upstage AI Lab - 자료구조와 알고리즘 (a.k.a. 코테) (0) | 2024.02.15 |
[2023 부트캠프] Upstage AI Lab - Machine Learning (0) | 2024.02.02 |
[2023 부트캠프] Upstage AI Lab 머신러닝을 위한 통계 개론 (1) | 2024.01.26 |