PPG 데이터베이스쪽 논문을 찾아보려다가 우선 그쪽 데이터베이스 그중에서 대규모 데이터셋이 있는지 찾아보기로 함.

랩미팅을 하면서 이야기가 나온 Vital DB는 우선 나중에 만져보고 우선 직접 하나하나 데이터를 찾아가면서 공부해보기로 함.

그러다 Pulse DB에 대해 알게되었고

Pulse DB: 벤치마킹을 위한 MIMIC-III 및 VitalDB 기반의 대규모 정리된 데이터 세트

https://github.com/pulselabteam/PulseDB

로컬로 다운받으려 했지만 너무 오래걸려서 포기

그래서 혹시나 Kaggle에 데이터셋이 있을까 싶어 검색해서 존재하는 Pulse DB를 VScode로 받고 (얘는 Vital DB의 하위집합 Github 데이터랑 약간 다른 것 같음, 19GB)

https://www.kaggle.com/datasets/weinanwangrutgers/pulsedb-balanced-training-and-testing/data

This is the supplementary training, validation, and testing subsets of PulseDB, derived from the VitalDB dataset:

이는 VitalDB 데이터 세트 에서 파생된 PulseDB의 보충적 교육, 검증 및 테스트 하위 집합입니다 . https://vitaldb.net/dataset/

.mat 파일로 되어있어서 시각화 한 cell을 돌릴때마다 7분정도 씩걸림.

.csv만 돌리다가 .mat파일을 처음 만져보는데 원래 이렇게 오래 걸리나 싶어서

.csv파일로 변환 후 시각화 진행

ㅋㅋ 서버터져서 데이터 날라감