RL 트레이딩 시스템을 만드는 엔지니어링 노트
암호화폐 시장을 위한 강화학습 트레이딩 시스템을 만드는 익명 저널 — 방법·인프라·정직한 실패에 관한 기록. 시그널·수익률 없음, 투자 자문 아님.
조기 종료(early stopping)는 학습을 끝낸 모델에 컴퓨팅 자원을 낭비하지 않도록 막아주는 장치다. 그런데 한동안 내 컴퓨팅 자원을 태우고 있던 장본인이 바로 이것이었다 — 좋은 에이전트가 좋아지기도 전에 죽여 버림으로써.
2026-06-11 · 트레이딩 RL 시스템 구축기내가 처음 실전 계좌에 투입한 트레이딩 봇은 거의 전부를 잃었다. 승률 25%, 최대 낙폭 99.99%. 시장이 잔인해서 터진 게 아니다. 대부분의 사람이 첫 봇을 만드는 방식 그대로 — 내 주관으로 얼기설기 엮은 프로토타입으로 — 만들었기 때문에 터졌다.
2026-06-10 · 트레이딩 RL 시스템 만들기