- ETRI 라이프로그 데이터셋 (2020-2018) 에서 아래 파일들을 다운로드합니다.
- user01-06 data (user01-06.7z)
- user07-10 data (user07-10.7z)
- user11-12 data (user11-12.7z)
- user21-25 data (user21-25.7z)
- user26-30 data (user26-30.7z)
- 2020 실험자별 정보 (user_info_2020.csv)
- 2020 수면 측정 데이터 (user_sleep_2020.csv)
<2023_ETRI_AI_Competition>
├ <2020>
└ <user01-30>
├ <user01>
├ ...
└ <user30>
├ <1598827200>
├ ...
└ <1601165700>
├ ...
└ 1601165700_label.csv
├ user_info_2020.csv
└ user_sleep_2020.csv
├ prerprocessing.ipynb
└ README.md
- user01 - user30 데이터 전처리
- 각 user파일의 timestamp_label.csv에서 userId, ts, actionOption, date를 추출합니다.
- actionOption칼럼의 데이터를 신체활동 분류표에 따른 강도로 분류합니다.
- 강도 분류에 따라 좌식행동-1, 저강도-2, 중강도-3, 고강도-4 로 변환합니다. - 2020 수면 측정 데이터 전처리
- user_sleep_2020.csv에서 userId, date, wakeupcount, sleep_score, startDt, endDt,
lightsleepduration, deepsleepduration,remsleepduration을 추출합니다.
- startDt와 endDt를 계산하여 총 수면시간 칼럼인 sleepTime을 추가합니다. - 2020 실험자별 정보 데이터 전처리
- user_info_2020.cvs에서 userId, gender, age, height, weight를 추출합니다.
- gender 칼럼의 데이터를 M-1, F-0으로 이진 분류를 해줍니다.
- height, weight 칼럼을 사용하여 bmi(체질량 지수)를 계산한 bmi 칼럼을 추가합니다. - 위의 1,2,3과정의 결과를 공통인 칼럼을 기준으로 합친 후 하나의 csv로 통합합니다.
(자세한 데이터 전처리 과정은 preprocessing.ipynb파일 참고바랍니다.)
- git clone
git clone <this_repo>
- BERT
- 위치: model/BERT/data/BERT_R.py
python BERT_R.py
- LSTM
- 위치: model/CLSTM/data/main.py
- main.py파일에서 Config_Model_Type = "LSTM" 으로 변경 후 저장합니다.
python main.py
- CNN-LSTM
- 위치: model/CLSTM/data/main.py
- main.py파일에서 Config_Model_Type = "CLSTM" 으로 변경 후 저장합니다.
python main.py