초안: 문헌 흐름과 현재 고혈압-침치료 TTE 문서에 대한 대입을 빠르게 정리한 작업본이다. 세부 표현, 논문 누락 여부, 최종 투고용 용어는 추가 검토가 필요하다.
요약
Clone-Censor-Weight(CCW)는 관찰자료에서 무작위배정 임상시험의 특정 프로토콜을 흉내 내기 위한 target trial emulation(TTE)의 한 구현 방식이다. 핵심은 단순하다.
- Clone: 한 사람이 baseline에서 여러 치료전략과 동시에 양립 가능하면, 그 사람을 전략 수만큼 복제하고 각 복제본을 하나의 전략에 배정한다.
- Censor: 복제본의 실제 치료 이력이 배정된 전략과 더 이상 양립하지 않는 순간 그 복제본을 인위적으로 검열한다.
- Weight: 이 인위적 검열이 선택편향을 만들 수 있으므로, uncensored 상태로 남아 있을 확률의 역수를 이용해 보정한다.
따라서 CCW는 단순한 모형 보정법이 아니라 time zero, eligibility, treatment assignment를 먼저 맞추는 설계 전략이다. 특히 “진단 후 3개월 안에 치료 시작”, “6개월 이상 지속 사용”, “biomarker가 특정 기준에 도달하면 치료 시작”처럼 baseline에서는 여러 전략이 동시에 가능하고 시간이 지나야 실제 전략 이행 여부가 드러나는 연구에 적합하다.
1. 초기 제안 논문
CCW라는 이름이 처음부터 정립되어 있었던 것은 아니다. 방법론의 뿌리는 Robins의 g-methods, 동적 치료전략(dynamic treatment regimes), 인위적 검열과 inverse probability weighting(IPW)에 있다. 이후 Hernán/Robins의 target trial framework 안에서 “cloning, censoring, weighting”이라는 절차가 명확히 설명되면서 현재의 CCW라는 이름으로 굳어졌다.
Robins의 sustained exposure와 g-methods
Robins의 1986년 논문은 CCW의 직접적 튜토리얼은 아니지만, 시간에 따라 변하는 노출과 confounder가 얽히는 문제를 인과추론 문제로 정식화한 출발점이다.1 건강근로자 생존편향(healthy worker survivor effect)처럼 이전 노출이 이후 confounder에 영향을 주고, 그 confounder가 다시 이후 노출과 사망에 영향을 주는 구조에서는 표준 회귀분석이 부적절할 수 있음을 보였다. 이 문제의 해결축이 g-formula, IPW, marginal structural model(MSM)로 이어진다.
CCW의 weighting 단계는 이 계보 위에 있다. 복제와 인위적 검열은 target trial protocol을 관찰자료 위에 얹는 설계 장치이고, weighting은 그 설계가 만들어낸 informative censoring을 보정하는 추정 장치다.
Hernán et al. 2006: dynamic treatment regimes via IPW
Hernán, Lanoy, Costagliola, Robins의 2006년 논문은 CCW의 전신으로 보아야 한다.2 이 논문은 HIV 자료에서 여러 동적 치료전략을 비교하기 위해 다음 절차를 제시했다.
- 비교할 치료전략을 명시한다.
- 개인이 특정 전략을 더 이상 따르지 않는 순간 인위적으로 검열한다.
- 그 검열로 생기는 선택편향을 IPW로 보정한다.
- weighted Cox model로 전략별 생존을 비교한다.
여기서는 “clone-censor-weight”라는 명칭이 전면에 있지는 않지만, 전략 위반 시 검열하고 검열확률의 역수로 보정한다는 핵심 구조가 이미 제시되어 있다. CCW의 censor-weight 부분이 이 논문에서 매우 명확히 드러난다.
Cain et al. 2010: When to Start Treatment?
Cain, Robins, Lanoy, Logan, Costagliola, Hernán의 2010년 논문은 CCW의 초기 정립 논문으로 가장 중요하다.3 질문은 “HIV 환자에서 CD4 count가 어느 threshold 아래로 내려갔을 때 치료를 시작하는 것이 좋은가?”이다.
이 논문이 중요한 이유는 baseline 또는 follow-up 초기에 한 개인의 관찰 이력이 여러 동적 전략과 동시에 양립할 수 있음을 명시적으로 다루기 때문이다. 예를 들어 어떤 환자는 아직 치료를 시작하지 않았기 때문에 “CD4 < 350이면 시작”, “CD4 < 300이면 시작”, “CD4 < 250이면 시작” 같은 여러 전략을 동시에 따르고 있는 상태일 수 있다. 시간이 지나면서 특정 threshold를 어기면 해당 전략에서는 검열된다.
현재 CCW 용어로 번역하면 다음과 같다.
- 개인의 관찰 이력을 여러 전략에 대응시켜 확장한다.
- 각 전략과 양립하지 않는 시점에서 인위적으로 검열한다.
- 치료 시작 및 검열 과정에 영향을 주는 시간변동 공변량을 이용해 가중치를 만든다.
- 전략별 누적위험 또는 생존함수를 비교한다.
2024년 Gaber et al. 리뷰도 이 논문을 “CCW라는 이름은 없었지만 해당 기법을 가장 먼저 설명한 논문 중 하나”로 평가한다.4
Hernán & Robins 2016: target trial framework
Hernán과 Robins의 2016년 American Journal of Epidemiology 논문은 TTE의 기본 문법을 만든 필수 논문이다.5 이 논문 자체가 CCW 구현서라기보다는, 관찰자료 분석을 “우리가 정말 수행하고 싶었던 무작위배정 target trial의 emulation”으로 보아야 한다는 틀을 제시했다.
핵심 구성요소는 다음이다.
- eligibility criteria
- treatment strategies
- assignment procedures
- follow-up period
- outcome
- causal contrast
- analysis plan
CCW는 이 중 특히 assignment procedures와 follow-up start(time zero) 문제가 어려울 때 등장한다. 치료가 baseline에서 즉시 정해지는 것이 아니라 일정 유예기간 안에서 시작될 수 있다면, baseline에서 관찰된 최종 치료군으로 사람을 나누는 순간 immortal time bias가 생긴다. 이때 clone을 만들어 baseline에서 모든 전략에 배정한 뒤, 실제 이력이 전략과 어긋날 때 censor하는 방식이 target trial의 배정 구조를 더 잘 흉내 낸다.
Hernán et al. 2016: time zero 정렬과 immortal time bias
Hernán, Sauer, Hernández-Díaz, Platt, Shrier의 2016년 Journal of Clinical Epidemiology 논문은 “target trial을 명시하면 immortal time bias 같은 self-inflicted bias를 예방할 수 있다”는 메시지를 정리했다.6
CCW를 이해할 때 이 논문이 중요한 이유는 다음 문장으로 요약된다.
eligibility, treatment assignment, start of follow-up이 같은 시점에 정렬되어야 한다.
관찰자료에서 흔한 오류는 hypertension 진단일을 time zero로 두면서도, 치료군은 “진단 후 몇 개월 안에 침치료를 받은 사람”처럼 미래 정보를 이용해 정의하는 것이다. 그러면 치료군은 치료를 받을 때까지 사건 없이 살아 있어야 하므로, 치료군에 유리한 불멸시간이 생긴다. CCW는 바로 이 정렬 문제를 설계 단계에서 고치는 방법이다.
Hernán 2018 BMJ: treatment duration과 CCW의 세 단계
Hernán의 2018년 BMJ 논문은 CCW를 현재 형태로 가장 직관적으로 설명한 핵심 문헌이다.7 질문은 “관찰자료에서 치료 지속기간이 생존에 미치는 효과를 어떻게 추정할 것인가?”이다.
긴 치료기간을 달성한 사람은 그 기간만큼 생존해야 하므로, 단순히 “장기 사용자 vs 단기 사용자”를 비교하면 장기 사용자에게 immortal time이 부여된다. Hernán은 이를 피하기 위해 세 단계를 제시한다.
- 사람을 여러 치료 지속전략에 복제 배정한다.
- 배정된 지속전략을 어기면 검열한다.
- 검열로 생기는 선택편향을 IPW로 보정한다.
실무자가 CCW를 처음 배울 때는 이 논문을 가장 먼저 읽는 것이 좋다. 수학적 일반성은 Cain et al. 2010 쪽이 더 강하고, TTE 프로토콜 문법은 Hernán & Robins 2016 쪽이 더 중요하지만, 실제 감각은 BMJ 2018 논문이 가장 빠르게 잡힌다.
2. 후속 논의 및 발전
2020년 전후: 튜토리얼화와 암 역학 응용
Maringe et al. 2020은 CCW가 널리 알려지는 데 중요한 튜토리얼 논문이다.8 고령 폐암 환자에서 수술의 생존효과를 평가하는 예제를 통해 다음 절차를 R/Stata 코드와 함께 설명했다.
- target trial과 inclusion criteria 명시
- 환자 clone 생성
- censoring time과 survival time 정의
- IPCW 추정
- weighted survival analysis 수행
이 논문의 장점은 “surgery yes/no”처럼 치료 시점이 진단일과 어긋나는 전형적 immortal time bias 상황을 임상의가 이해하기 쉬운 방식으로 보여준다는 점이다. naive Kaplan-Meier는 수술군의 이득을 크게 과대평가했고, cloned but unweighted 분석도 informative censoring을 무시해 여전히 문제가 남았다. weighted analysis에서는 효과 추정치가 더 보수적으로 바뀌었다.
2021년 논쟁: CCW는 언제 적절한가
Maringe et al. 논문 이후 Zhao, Lyu, Yoshida의 2021년 International Journal of Epidemiology 서신과 Maringe et al.의 답변이 이어졌다.9,10 핵심은 CCW의 유연성과 해석 가능성이다.
중요한 논점은 세 가지다.
- CCW는 단지 수술/비수술 비교에만 쓰이는 방법이 아니라, baseline에서 여러 전략이 양립 가능한 다양한 TTE 문제에 적용될 수 있다.
- clone을 만들었다고 baseline confounding이 자동으로 사라지는 것은 아니다. 실제 치료 이행과 검열 과정은 관찰자료의 공변량 구조에 의해 결정된다.
- 가중치 모형, positivity, 전략의 명확성, estimand 정의가 부실하면 CCW도 잘못된 답을 낼 수 있다.
이 논쟁은 CCW가 “마법의 bias 제거기”가 아니라, target trial을 엄밀히 쓴 뒤 그 프로토콜을 데이터에 이식하는 절차임을 강조한다.
COVID-19와 hospital-based observational data
2023년 COVID-19 병원자료 응용 논문은 CCW를 competing risks와 병원 기반 자료 상황에 확장해 설명했다.11 입원 후 치료 시작 여부를 비교할 때도 치료가 입원 당일 바로 결정되지 않으면 immortal time이 생긴다. 이 논문은 환자를 입원 시점에서 치료전략별로 clone하고, 치료 이력이 배정전략과 달라지는 순간 censor한 뒤, IPCW를 이용해 cumulative incidence를 추정했다.
여기서 중요한 발전은 생존분석의 endpoint가 단일 사망만이 아닐 때도 CCW 설계가 사용될 수 있다는 점이다. 다만 competing event를 censoring event로 볼지, total effect 관점에서 결과 과정의 일부로 둘지는 estimand에 따라 달라진다.
2022-2024년: TTE 리뷰와 pharmacoepidemiology 정리
Fu, Wang, Leaf의 JAMA 2022 TTE 개요와 Fu et al. 2023/2024년 신장역학 리뷰는 TTE를 세 가지 실무 설계로 분류한다.12,13
- active comparator new-user design
- sequential trial emulation
- clone-censor-weight design
이 리뷰에서 CCW는 특히 grace period, treatment duration, biomarker-guided treatment initiation에 적합한 설계로 설명된다. 즉 “치료를 시작했는가?”보다 “언제, 어떤 조건에서, 얼마나 지속했는가?”가 질문의 핵심일 때 CCW가 강해진다.
Gaber et al. 2024는 pharmacoepidemiology 관점에서 CCW의 foundation과 implementation을 정리한 최신 리뷰 중 하나다.4 이 논문은 CCW를 immortal time bias 방지 도구로 설명하되, 실제 적용에서는 다음을 반드시 점검해야 한다고 강조한다.
- treatment strategy가 충분히 well-defined인지
- grace period가 임상적으로 타당한지
- censoring model에 어떤 baseline/time-varying covariates를 넣을지
- weight truncation을 어떻게 할지
- clone으로 생긴 within-person correlation을 어떻게 반영할지
2024-2026년: estimand 논의와 구현 세부사항
최근 문헌은 CCW를 “어떻게 돌리는가”에서 “무엇을 추정하는가”로 이동하고 있다. 예를 들어 “treatment initiation window” 연구에서는 0-30일 안에 시작, 31-90일 안에 시작, 시작하지 않음 같은 전략이 실제로 어떤 intervention을 의미하는지 모호해질 수 있다. 2024년 arXiv 논문인 The Complex Estimand of Clone-Censor-Weighting When Studying Treatment Initiation Windows는 exposure history를 충분히 반영하지 않는 IPCW 모형이 불가능한 intervention이나 selection bias로 이어질 수 있음을 지적한다.14
2025년 synthetic Medicare claims tutorial은 공개 합성자료로 initiation window CCW를 재현 가능하게 설명한다.15 실무자가 R 코드 구조를 잡을 때 유용하다.
2026년 HPV vaccination preprint는 CCW를 potential outcome framework와 연결하고, IPCW와 IPTW의 역할 차이, robust sandwich variance 또는 bootstrap의 필요성을 비교적 체계적으로 설명한다.16 아직 preprint이므로 확정적 근거로 쓰기보다는 최근 논의 흐름을 파악하는 자료로 보는 것이 적절하다.
3. 필수 하위 개념
Target trial emulation
TTE는 관찰자료 분석을 시작하기 전에 “이 질문을 무작위배정시험으로 답한다면 어떤 시험을 설계할 것인가?”를 먼저 쓰는 방식이다. 관찰자료 분석계획이 아니라 hypothetical trial protocol이 먼저다.
가장 중요한 체크리스트는 다음이다.
- 누구를 baseline에서 eligible로 볼 것인가
- 어떤 전략을 비교할 것인가
- 전략 배정은 언제 일어나는가
- follow-up은 언제 시작하는가
- outcome은 어떻게 정의되는가
- ITT effect인지 per-protocol effect인지
- 어떤 분석으로 causal contrast를 추정할 것인가
CCW는 이 중 “baseline에서 여러 전략이 동시에 가능하고, 시간이 지나야 전략 이행 여부가 확인되는 경우”의 per-protocol effect 추정에 자주 쓰인다.
Time zero와 immortal time bias
Immortal time은 결과 사건이 발생할 수 없는 기간이다. 예를 들어 “진단 후 3개월 이내 침치료 시작군”을 치료군으로 정의하면, 치료군에 속하려면 침치료 시작일까지 MACE 없이 살아 있어야 한다. 이 기간을 치료군의 생존시간으로 계산하면 치료군의 위험이 인위적으로 낮아진다.
CCW의 clone 단계는 early event를 양쪽 전략에 공정하게 배분한다. 진단 직후 1개월에 MACE가 발생한 사람은 아직 “3개월 안에 침치료를 시작할 전략”도, “침치료를 하지 않을 전략”도 baseline에서는 가능했기 때문에 양쪽 clone 모두에서 해당 사건이 반영될 수 있다. 이것이 단순 landmark analysis와 다른 지점이다.
Per-protocol effect
CCW가 주로 겨냥하는 estimand는 per-protocol effect다. 즉 “전략을 실제로 끝까지 따랐다면 outcome risk가 어떻게 달라졌는가?”이다.
하지만 관찰자료에서 전략을 끝까지 따른 사람만 남겨 비교하면 healthy adherer bias가 생긴다. 건강하고 의료접근성이 좋은 사람이 더 잘 adherent할 수 있기 때문이다. 그래서 CCW는 전략 위반 시점에서 censor하고, 남아 있는 사람에게 가중치를 부여해 “모두가 전략을 따랐을 때”의 pseudo-population을 만든다.
Inverse Probability Weighting(IPW)와 IPCW
IPW는 “덜 관찰되기 쉬운 사람을 더 크게 대표시키는” 방식이다. CCW에서 핵심은 inverse probability of censoring weighting(IPCW)이다.
예를 들어 어떤 시점까지 acu-user 전략을 계속 따를 확률이 낮은 사람이 실제로 계속 uncensored로 남았다면, 그 사람은 비슷한 특성을 가졌지만 중간에 censor된 사람들을 더 많이 대표해야 한다. 그래서 그 사람에게 큰 weight가 붙는다.
stabilized weight는 보통 다음 직관을 가진다.
stabilized IPCW(t)
= numerator probability of remaining uncensored through t
/ denominator probability of remaining uncensored through t분모는 baseline 및 time-varying prognostic factors를 조건으로 한 uncensored 확률이고, 분자는 더 단순한 조건부 확률이다. stabilized weight는 extreme weight를 줄여 분산을 낮추는 역할을 한다.
Pooled logistic regression
월 단위 follow-up 자료에서는 Cox model 대신 discrete-time hazard model로 pooled logistic regression을 자주 쓴다. 개인-월(person-month) 형태로 데이터를 늘린 뒤, 각 월에 event 또는 censoring이 발생했는지를 outcome으로 둔다.
CCW에서는 두 종류의 pooled logistic regression이 흔하다.
- censoring model: 매월 전략 위반 없이 남을 확률을 추정해 IPCW 생성
- outcome model: weighted person-month data에서 월별 event hazard를 추정해 survival/risk curve 생성
월 단위가 충분히 짧고 사건확률이 낮으면 pooled logistic regression의 odds ratio를 hazard ratio에 가깝게 해석하기도 하지만, 최종 보고에서는 1년/3년/5년 누적위험, risk difference, risk ratio가 더 직접적이다.
Kaplan-Meier, weighted survival curve, cumulative risk
Kaplan-Meier curve는 검열이 비정보적이라는 가정 아래 생존함수를 추정한다. CCW에서는 인위적 검열이 설계상 발생하며, 이 검열은 보통 informative하다. 따라서 단순 Kaplan-Meier를 cloned data에 적용하면 부족하다.
대신 IPCW를 적용한 weighted survival curve 또는 weighted pooled logistic regression을 사용한다. 목표는 전략별 counterfactual survival 또는 cumulative incidence를 추정하는 것이다.
Positivity
Positivity는 각 공변량 조합에서 비교하려는 전략을 따를 가능성이 충분히 있어야 한다는 조건이다. 예를 들어 특정 고령/중증 subgroup에서는 12개월 동안 월 2회 이상 침치료를 유지한 사람이 거의 없다면, 그 subgroup에서 acu-user 전략의 효과를 자료로부터 안정적으로 추정하기 어렵다.
실무 진단은 weight distribution으로 시작한다.
- 평균이 1 근처인지
- 99th percentile 또는 maximum이 과도하게 큰지
- 특정 subgroup에서 weight가 폭발하는지
- truncation 전후 결과가 크게 달라지는지
Consistency와 well-defined treatment strategy
Consistency는 관찰된 치료 이력이 우리가 정의한 전략과 일치할 때, 관찰된 outcome이 그 전략 하의 potential outcome으로 볼 수 있다는 가정이다. 이 가정이 성립하려면 전략이 충분히 구체적이어야 한다.
“침치료 사용”은 너무 넓다. “고혈압 신규진단 후 3개월 이내 월 2회 이상 침치료를 시작하고, 이후 12개월 treatment period 동안 매월 2회 이상 유지”처럼 시작시점, 빈도, 유지기간, 허용되는 deviation을 정의해야 한다.
Bootstrap과 robust variance
Clone을 만들면 같은 개인에서 나온 여러 row가 서로 독립이 아니다. 또한 weighted survival curve, risk difference, risk ratio는 단순 표준오차 공식을 적용하기 어렵다.
따라서 불확실성 추정은 보통 다음 중 하나를 사용한다.
- 개인 단위 bootstrap: 원 개인을 resampling한 뒤 그 사람의 clone과 person-month row를 함께 재생성한다.
- cluster-robust sandwich variance: Cox model 등에서 원 개인 ID 기준으로 clustering한다.
주의할 점은 bootstrap을 row 단위로 하면 안 된다는 것이다. clone 단위나 person-month row 단위 resampling은 원 개인 내부 상관구조를 깨뜨린다.
4. 구현 가이드라인
실제 구현의 핵심은 “긴 데이터(person-period data)를 정확히 만드는 것”이다. 코드는 그 다음 문제다.
권장 데이터 구조
최소 단위는 보통 id-strategy-month이다.
id | clone_id | strategy | month | event | censor | weight | baseline covariates | time-varying covariates각 row는 특정 개인의 특정 전략 clone이 특정 월 interval의 시작 시점에 risk set에 있는지를 나타낸다. outcome, censoring, covariates는 시간 순서를 지켜야 한다. censoring model에 들어가는 time-varying covariates는 해당 월 censoring 판단 전에 이미 관찰된 정보여야 한다.
전처리 체크리스트
- time zero는 모든 전략에서 동일해야 한다.
- baseline covariate window와 treatment washout window를 분리한다.
- grace period 안에서 어떤 치료 시작이 허용되는지 명시한다.
- strategy deviation rule을 월 단위로 기계적으로 판정 가능하게 만든다.
- censoring time은 outcome time보다 앞서는지, 같은 월이면 어떤 사건을 우선할지 정한다.
- nonfatal outcome에서 death를 censor할지, total effect 관점에서 그대로 둘지 estimand 기준으로 정한다.
- weight truncation 기준은 사전에 정하고, truncation 전후 결과를 sensitivity analysis로 제시한다.
현재 고혈압-침치료 TTE 문서에 대입
지정된 두 파일을 확인했다.
/Users/sungjunpark/_KNHIS-HIRA/KMED_ljt_HTN_CCW/Methods_HTN-TTE_260408.xlsx/Users/sungjunpark/_KNHIS-HIRA/KMED_ljt_HTN_CCW/Methods_KO_260331.docx
현재 연구 질문은 고혈압 신규진단 성인에서 침치료 regular use 전략이 MACE 및 기타 심혈관/사망 outcome에 미치는 per-protocol effect로 정리된다. target trial emulation 구조는 이미 잘 잡혀 있다.
핵심 대입은 다음과 같다.
- Eligibility: 2011-2014년 NHIS sample cohort에서 신규 고혈압 진단 성인. 이전 6개월 침치료 기록, 주요 결측, 1년 미만 자료 보유자는 제외.
- Time zero: 신규 고혈압 진단 및 eligibility 충족 시점.
- Strategies: acu-user는 T0 후 3개월 grace period 안에 월 2회 이상 침치료를 시작하고 12개월 treatment period 동안 월 2회 이상 유지. non-user는 12개월 동안 침치료 없음.
- Clone: 모든 eligible individual을 T0에서 acu-user clone과 non-user clone으로 복제 배정.
- Censor: acu-user clone은 3개월 내 시작 실패 또는 시작 후 월 2회 미만이면 검열. non-user clone은 12개월 동안 침치료가 1회라도 있으면 검열.
- Weight: 월별 pooled logistic regression으로 stabilized IPCW 추정. 분모는 strategy, baseline covariates, time-varying covariates, time 및 time^2를 포함. 분자는 strategy와 time 항 중심. 99 percentile truncation 계획.
- Estimand: CCW로 만든 weighted pseudo-population에서 1/3/5년 누적위험, RD, RR을 주 지표로 보고, HR은 보조 지표로 제시.
- Inference: 현재 문서의 bootstrap 500회 계획은 타당하다. 단, 원 개인 ID 단위로 resampling하고 clone/person-month row를 함께 재생성해야 한다.
이 연구에서 가장 신경 써야 할 지점은 “침치료 regular use”가 임상적으로 well-defined intervention인지와, 월 2회 이상 유지 전략에 대해 positivity가 충분한지다. 따라서 최종 분석표에는 IPCW 분포, truncation 전후 SMD, grace period 2/3/4개월 및 월 1회 이상 정의 변경 sensitivity analysis를 반드시 같이 두는 것이 좋다.