오픈소스 첫 기여 후기 : 버그 수정부터 PR까지 과정 안내
·
카테고리 없음
1. 문제 발견Feature Engineering 관련 업무를 진행하다 22개의 주요 피쳐를 추출하는 pycatch22의 파이썬 패키지에서 잘못된 점을 발견했습니다. 참고로, catch22(“Canonical Time-series CHaracteristics”)는 2019년 Lubba 외 연구진이 제안한, 시계열 데이터의 핵심 성질을 빠르고 직관적으로 추출할 수 있는 22가지 피쳐 집합을 추출하는 패키지입니다. 각 피처는 엔트로피, 자기상관, 스펙트럼 전력, 모티프 통계 등 시계열의 동적 거동을 대표하는 정보를 담고 있으며, 모두 C로 최적화되어 있어 계산 속도가 매우 빠릅니다. 이런 특징 덕분에 catch22는 시계열 분류나 클러스터링 같은 머신러닝 과제에서 효율적이면서도 해석 가능한 피처 엔지니어링 ..