트러블슈팅¶
수집 실패 (scrape_failed)¶
증상¶
로그에 collect_failed 또는 DB에 status=FAILED 스냅샷이 기록됨.
원인별 대응¶
1. HTTP 요청 실패 (ConnectionError, Timeout)¶
- 원인: 대상 사이트 일시 장애 또는 네트워크 문제 - 대응: 1~2시간 후 자동 재수집됨. 지속 실패 시 사이트 접속 가능 여부 확인2. HTML 구조 변경 (파싱 결과 0건)¶
- 원인: 대상 사이트가 HTML 구조를 변경함 - 대응: 1. RustFS Bronze에서 최근raw.html을 다운로드하여 구조 확인
2. scraper/daum.py의 CSS 선택자(a[href*="DA=RT1"]) 수정
3. tests/test_daum_scraper.py에 새 HTML 구조 테스트 추가
4. 이미지 재빌드 후 배포
3. 새벽 시간 데이터 부족¶
- 원인: 다음 트렌드는 01:00~06:00 사이 데이터가 제한적으로 제공됨
- 대응: 정상 동작임.
status=EMPTY스냅샷이 기록될 수 있음
DB 연결 실패¶
증상¶
대응¶
- MySQL 서버 상태 확인:
trend_collectordatabase 존재 여부 확인:- 네트워크 확인:
RustFS 저장 실패¶
증상¶
대응¶
Bronze 저장 실패 시에도 DB 저장은 정상 진행되므로 데이터 유실은 없음.
- RustFS 접속 확인:
- 인증 키 확인:
- 버킷 존재 확인:
수동 재수집¶
컨테이너 재시작 시 즉시 1회 수집을 실행한다:
또는 컨테이너 내부에서 직접 실행: