2개월 차가 되었을 때에는 프로젝트를 시작했다. 데이터 엔지니어링 관련 프로젝트 경험은 전무한 만큼 간단한 ETL 파이프라인을 만들기로 기획했다. 기존엔 2주안에 끝내는 것으로 기획했었지만 이론으로는 알고있지만 막상 사용하려 하니 추가로 드는 러닝커브 + 트러블 슈팅 + 예상치 못한 일정 + 게으름으로 인해 예상 기간보다 3배나 늘어나게 되었다. 작은 토이 프로젝트인 만큼 개발 과정중 엄청난 마일스톤은 없었고 크롤러 제작, 스토리지 구축, 변환 스크립트 + 중간중간 gitaction을 통한 cron job 자동화 순으로 진행했다. 한 가지 배운 것은 생각보다 데이터 엔지니어링은 우아하지 못하단 것이다. 새로운 기술이 계속 나오는 만큼(duckdb, prefect 등등..) 깔끔한 api와 깔끔하게 자동화..