한국 항암 바이오텍의 외부대조군(ECA) 근거 패키지: EOP2 전에 끝내야 하는 일
단일군(single-arm) 임상으로 EOP2/허가를 노리는 한국 항암 바이오텍이 외부대조군 근거를 언제, 어떤 데이터로, 어떻게 준비해야 하는지. FDA 2023 ECT 가이던스, 타깃 트라이얼 에뮬레이션, 적격기준 attrition, 정량적 편향분석(QBA), HIRA 데이터 활용까지 실행 관점으로 정리한다.
먼저 결론: ECA는 임상이 끝난 뒤 붙이는 게 아니라, EOP2 전에 프로토콜에 박는 것이다
한국 항암 바이오텍이 가장 자주 저지르는 실수는 순서다. 단일군(single-arm) Phase 2가 ORR로 좋은 숫자를 내면, 그제서야 "외부대조군(External Control Arm, ECA)을 붙여 OS 우월성을 보여주자"는 논의가 시작된다. FDA 입장에서 이건 거의 자동 탈락 사유다. 2023년 2월 FDA가 발표한 ECT 초안 가이던스(Considerations for the Design and Conduct of Externally Controlled Trials, docket FDA-2022-D-2983)는, 데이터 소스·적격 기준·노출 정의·엔드포인트·분석계획·편향 완화 방법을 임상 시작 전에 프로토콜에 사전 지정(prespecify)하고, 외부대조군을 단일군 임상과 동시에 설계하라고 못박았다. 단일군 임상이 끝난 뒤 대조군을 고르면, FDA는 "결과를 보고 유리한 대조군을 골랐다"고 본다. 가이던스가 직접 경고하는 시나리오가 이것이다 — "이미 결과를 아는 완료된 임상에서 외부대조군을 선택하는 것은 특히 편향 우려가 크고, 그 결과가 기존 경험과 불일치하면 더욱 문제가 된다."
두 번째 현실은 더 냉정하다. 같은 가이던스는 "많은 상황에서 외부대조군으로 약효를 신뢰성 있게 입증할 가능성은 낮으며, 스폰서는 더 적합한 설계를 선택해야 한다"고 명시한다. 2002~2021년 FDA 종양학부가 부여한 563개 신규 적응증 중 176개(31%)가 단일군 임상 기반이었고, 그중 173개(98%)의 엔드포인트가 ORR이었다. 즉 단일군 임상의 '정상 경로'는 ORR 기반 가속승인이지, ECA를 붙인 OS 우월성 입증이 아니다. Flatiron Health 의료책임자는 "지금까지 종양학에서 외부대조군 설계를 1차 근거로 한 FDA 승인은 없다"고 단언했다 — 무작위배정이 메우는 '측정 불가능한 차이'를 성향점수매칭(propensity score matching)은 메우지 못하기 때문이다.
그래서 ECA 근거 패키지의 목적은 "ECA로 승인받자"가 아니라, EOP2 미팅에서 FDA와 pivotal 설계를 협상할 때 우리 패를 정확히 알고 들어가는 것이다. ECA가 1차 근거로 쓸 만한 자산인지, 보조(supportive) 근거로만 쓸 자산인지, 아니면 애초에 RCT로 가야 하는지를 EOP2 전에 스스로 판정해야 한다. 이 글은 그 판정 프레임과, 컨설팅사 백서·CRO 블로그가 다루는 방법론(타깃 트라이얼 에뮬레이션, attrition 분석, 정량적 편향분석)을 한국 오퍼레이터 관점으로 재배치한다.
FDA의 진짜 신호: 종양학은 RCT로 기울고 있다
ECA를 검토하기 전에, 상위 정책 흐름부터 봐야 한다. FDA의 2023년 3월 초안 가이던스(Clinical Trial Considerations to Support Accelerated Approval of Oncology Therapeutics)는 가속승인에서도 단일군보다 RCT(이른바 'one-trial' 접근)를 선호하며, 단일군 설계는 RCT가 실현 불가능할 때만 받겠다는 정책 전환 신호다. 같은 문서는 단일군 임상에서 time-to-event 엔드포인트(OS, PFS)는 "일반적으로 해석 불가능"하다고 본다. 2018년 Clinical Trial Endpoints 가이던스도 외부대조군 데이터는 "OS를 포함한 time-to-event 엔드포인트에 대해 신뢰하기 어렵다"고 적었다 — 환자 선택, 영상 진단 개선, 지지요법 개선이 약효처럼 보일 수 있기 때문이다.
이 신호를 한국 바이오텍 관점으로 번역하면 이렇다.
- ORR이 강하고 단일군으로 가속승인을 노린다면, ECA는 OS의 1차 근거가 아니라, 단일군 ORR의 임상적 의미를 맥락화하는 보조 근거로 설계하는 게 현실적이다. Avelumab(Bavencio, Merkel 세포암, 2017 승인)이 정확히 이 패턴이었다 — 88명 단일군 Phase 2가 1차 근거였고, registry RWE는 보조였다.
- 효과 크기가 modest하거나 OS 우월성을 주장해야 한다면, ECA의 신뢰성은 급락한다. 가이던스는 "modest한 예상 효과 크기는 외부대조군을 신뢰할 수 없게 만든다"고 본다. 이 경우 EOP2에서 FDA는 RCT를 요구할 가능성이 높다.
- 희귀질환/자연경과가 명확한 적응증이라면 ECA가 1차 근거가 될 여지가 있다. FDA는 자연경과(natural-history) RWD를 1차 유효성 근거로 받은 사례가 있다 — Skysona/elivaldogene autotemcel(대뇌부신백질이영양증, 2022년 9월 16일 가속승인, ALD-102 단일군 + 미치료 자연경과 코호트 대조: 24개월 MFD-free 생존 72% vs 미치료 43%), Lenmeldy/atidarsagene autotemcel(이염성 백질이영양증, BLA 125758, 2024년 3월 18일 승인, 미치료 자연경과 + 미치료 형제 대조). 단, 이건 종양이 아니라 치료 안 하면 결과가 거의 확정적인 단일유전자 질환이라는 점을 기억해야 한다. (참고로 Skysona는 2022년 승인 후 조혈암 사례가 누적돼 2025년 8월 표기 변경이 이뤄졌다 — 자연경과 대조가 유효성 1차 근거가 될 수 있어도, 안전성 장기추적 의무는 별개로 무겁다는 신호다.)
EOP2 브리핑북에 ECA 챕터를 넣기 전에, 우리 프로그램이 위 셋 중 어디에 속하는지부터 정해야 한다. FDA Pre-IND 미팅 브리핑북 작성과 마찬가지로, EOP2 패키지도 FDA가 답해주기를 바라는 질문을 우리가 먼저 명확히 정의해야 한다.
타깃 트라이얼 에뮬레이션: ECA를 "데이터 매칭"이 아니라 "프로토콜 설계"로 접근하라
컨설팅사·CRO가 ECA를 다룰 때 공통적으로 깔고 들어가는 프레임이 **타깃 트라이얼 에뮬레이션(target trial emulation, TTE)**이다. 핵심은 단순하다: 우리가 RCT를 돌렸다면 어떤 프로토콜이었을지(적격기준, 치료전략, time zero, 추적기간, 엔드포인트, 분석)를 먼저 적고, 그 프로토콜의 각 항목을 외부 데이터로 그대로 재현하는 것이다. ECA를 "환자 특성을 맞추는 통계 작업"으로 보면 실패하고, "프로토콜을 사전 지정하고 그 프로토콜을 RWD에 적용하는 작업"으로 봐야 한다. ECT 가이던스가 요구하는 사전 지정도 결국 이 구조다.
TTE 관점에서 EOP2 전에 종이에 못박아야 할 항목은 다음과 같다.
| TTE 구성요소 | 우리 단일군 arm | 외부대조군(ECA)에서의 정의 | 사전 지정 안 하면 생기는 문제 |
|---|---|---|---|
| 적격기준 | 프로토콜 I/E | 동일 I/E를 RWD에 적용 | 기준 완화 시 비교가능성 붕괴 |
| 치료전략 | 시험약 투여 | SOC/physician's choice 신규투여(new-user) | prevalent user 섞이면 편향 |
| Time zero(인덱스) | 투여 시작 | 적격 충족 시점에 정렬 | 불멸시간 편향 |
| 추적기간 | 프로토콜 추적 | 동일 길이로 정렬 | 추적 불균형이 OS 왜곡 |
| 엔드포인트 | RECIST 반응평가 | RWD에서 동일 정의 가능한가 | 측정오차·오분류 |
| 분석/추정대상(estimand) | 사전 정의 | 동일 estimand로 정의 | 사후 해석 변경 = 신뢰성 하락 |
여기서 한국 바이오텍이 자주 놓치는 게 추정대상(estimand) 사전 정의다. ICH E9(R1)이 요구하는 estimand — 어떤 중간발생사건(intercurrent event, 예: 후속치료 전환, 사망)을 어떤 전략으로 다룰지 — 를 단일군 arm과 ECA에서 동일하게 정의하지 않으면, FDA·EU HTA 모두 "무엇을 추정한 건지 불명확하다"고 본다. Putnam의 olutasidenib RW-ECA 사례처럼, 적격·추적기준은 물론 estimand까지 사전 지정하고 민감도 분석을 붙이면 표본이 작아도 신뢰 가능한 비교추정치를 낼 수 있다는 게 실무 합의다. estimand는 통계 부서만의 문제가 아니라, 임상·RA가 함께 EOP2 전에 정의해야 하는 항목이다.
가장 과소평가되는 함정: 적격기준 attrition과 데이터 결측
ECA 실패의 상당수는 통계가 아니라 데이터가 안 채워져서 일어난다. Friends of Cancer Research(FOCR)의 종양 ECA 파일럿과 Flatiron·ISPOR 발표가 일관되게 지적하는 핵심이 attrition이다. RCT의 까다로운 I/E 기준을 RWD에 그대로 적용하면 환자가 급감하는데, 그 attrition에는 성격이 다른 두 갈래가 있다.
- 진짜 제외(true exclusion). 환자가 실제로 기준에 안 맞음 — 예: 장기기능 검사치(간·신·혈액학) 이상으로 임상이라면 배제될 환자.
- 데이터 부재로 인한 제외(data unavailability). 환자는 적격일 수 있으나, 해당 변수가 RWD에 기록되지 않았거나 측정 시점이 ascertainment window 밖이라 판정 불가.
FOCR 췌장암 파일럿에서, 장기기능 요구 같은 기준이 상당한 환자 손실을 일으켰고 결측 정도는 데이터 소스마다 달랐다. 두 번째 갈래가 특히 위험하다 — "장기기능을 확인할 수 없는 환자"를 빼면, 무작위로 빠지는 게 아니라 더 아프거나 추적이 부실한 환자가 계통적으로 빠져 ECA가 실제보다 좋아 보이게 된다(선택편향). FDA Erdafitinib(FGFR2/3+ 전이성 요로상피암, BLC2001, Flatiron 기반 ECA) 검토에서도 RWD에 모든 적격기준을 적용할 수 없었던 점, 시험군은 유럽 환자 70%인데 대조군은 전원 미국, 시험군 I/E가 더 엄격했던 점이 한계로 지적됐다.
실무 시사점은 분명하다. EOP2 전에 feasibility(타당성) 분석을 먼저 돌려라. 우리 단일군 I/E를 후보 데이터 소스에 적용했을 때 (a) 몇 명이 남는지, (b) 남은 환자 중 핵심 예후인자·엔드포인트가 환자 단위로 채워진 비율이 얼마인지를 수치로 확보해야 한다. 이 숫자 없이 "Flatiron 쓰면 됩니다"라고 EOP2에 들어가면 FDA가 곧장 무너뜨린다. 가이던스는 또한 스폰서가 접근한 모든 데이터 소스와 각 소스를 배제한 이유를 프로토콜에 문서화하도록 요구한다 — "마음에 드는 소스만 골랐다"는 의심을 차단하기 위해서다.
데이터 소스 적합성(fit-for-purpose): 어디서, 어떤 데이터를 끌어올 것인가
ECT 가이던스는 환자 단위 데이터(patient-level data)를 전제로 한다 — 다른 임상시험의 데이터이거나, registry·EHR·의료청구(medical claims) 같은 RWD 소스다. 요약 수준(summary-level) 외부대조는 이 가이던스가 다루지 않는다. 2018년 RWE Framework이 정의한 fit-for-purpose 기준이 핵심이고, 가이던스는 RWD를 외부대조로 쓸 때 다뤄야 할 10가지 비교가능성 고려사항을 명시한다: 시간대, 지역, 진단, 예후, 치료, 결과(outcomes), 추적기간, 동시 진행 임상(intercurrent trials), 결측 데이터, 기타 요인.
종양학 ECA의 데이터 소스는 대략 세 갈래다.
| 소스 유형 | 대표 예 | 강점 | 한국 바이오텍 관점 리스크 |
|---|---|---|---|
| 임상시험 대조군 데이터 | 과거 RCT의 SOC arm | 데이터 품질·정의 일관성 높음 | 접근권·라이선싱, 시점·지역 불일치 |
| 종양 EHR/registry | Flatiron Health 등 미국 종양 EMR | 미국 환자, FDA 친숙도, 동시대 SOC 반영 | 결측 예후인자, 인덱스 날짜 정렬 난이도 |
| 차트리뷰 historical control | SOC salvage 환자 차트 | 적응증 맞춤 구축 가능, 프로토콜화 | 선택편향, 표본 수, 노동집약적 |
| 청구 기반 RWD | HIRA/NHIS(한국), claims | 전국민·대규모 | 임상 결과변수·예후정보 부족 |
여기서 세 가지 함정이 ECA를 무너뜨린다.
불멸시간 편향(immortal time bias). 가이던스가 별도로 경고하는 항목이다. 치료군의 인덱스 날짜를 '약물 투여 시작'으로 잡고, 외부대조군의 인덱스 날짜를 그보다 이른 적격 사건(예: 이전 치료 실패)으로 잡으면, 환자가 약을 받기까지 생존해야 하는 기간이 '불멸시간'이 되어 약물이 실제보다 효과적으로 보인다. 가이던스가 직접 설명하듯, 대조군에서 후속치료 없이 적격사건 직후 추적이 시작되면 생존이 매우 짧은 환자도 포함되지만, 치료군은 투여까지 생존한 환자만 포함돼 약효가 부풀려진다. 양 arm의 인덱스 날짜 정렬을 프로토콜에 사전 지정해야 한다.
RWD 엔드포인트의 측정오차·오분류. 임상에서 RECIST로 정해진 일정에 평가되는 진행(progression)과, 진료기록에서 비정기적으로 포착되는 진행은 다르다. EMA/J&J 발표는 RWD의 진행 이벤트 오분류가 PFS 중앙값을 계통적으로 왜곡할 수 있고(감시편향·오분류편향), 회귀보정(regression calibration) 같은 방법으로 완화해야 한다고 정리했다. 종양 ECA에서 OS가 그나마 안전하고 PFS·반응이 위험한 이유가 여기 있다.
성향점수매칭으로 가린 줄 알았던 불균형이 FDA 재분석에서 되살아난다. Blinatumomab(Blincyto, 2014년 12월 Ph-음성 재발/불응 B-ALL 가속승인)은 단일군 Phase 2를 EU·US 1,139명 historical 환자 풀에서 성향점수로 만든 외부대조와 비교했고, 매칭 전 8개 기저특성 중 6개가 유의하게 불균형했으나 매칭 후엔 (지역 제외) 유의차가 사라졌다 — 성공 사례다. 반대 사례가 더 교훈적이다. Karyopharm의 selinexor(STORM) NDA(212306)는 Flatiron EHR 외부대조(KS-50039)로 OS를 비교했는데, FDA 심사에서 이 분석이 사전 프로토콜로 지정되지 않았고(no pre-specified protocol) 환자 선택·교란에 따른 편향이 크다는 점이 지적돼 승인 근거에서 빠졌다. selinexor의 가속승인은 결국 단일군 STORM의 반응률(ORR)에 근거했고, EHR 외부대조 OS 비교는 채택되지 않았다. 결측 예후인자가 많은 청구·EHR 데이터에서 흔히 벌어지는 일이다.
실무 시사점: 데이터 소스를 고를 때 "표본이 크냐"보다 "FDA가 요구할 핵심 예후인자가 환자 단위로 채워져 있냐"가 먼저다. 그래서 글로벌 ECA의 1차 후보는 대개 미국 종양 EHR이지, 청구 데이터가 아니다.
분석은 PSM 하나로 끝나지 않는다: 강건성(robustness) 패키지를 같이 설계하라
한국 바이오텍 자료에서 ECA 분석이 "성향점수매칭" 한 줄로 끝나는 경우가 많은데, FDA·CRO가 기대하는 건 그 이상이다. 가이던스 자체가 특정 통계법을 강제하지 않는다 — "어떤 단일 방법도 모든 ECA에 적합하지 않으며, 접근법은 해당 FDA 심사부서와 협의하라"는 입장이다. 바꿔 말하면, 방법 선택의 정당화와 강건성 입증이 방법 그 자체보다 중요하다. 컨설팅사 백서가 공통으로 권하는 강건성 패키지는 다음과 같다.
- 매칭/가중 방법 선택의 근거. 성향점수 매칭·가중(IPTW)·entropy balancing 중 무엇을, 왜. 표본이 작은 종양 ECA(n<100)에서는 outcome-prediction 기반 G-computation이, n>500이면 doubly debiased ML이 PSM보다 안정적이라는 비교연구도 있다 — 핵심은 표본 규모에 맞는 방법을 사전에 정당화하는 것.
- 미측정 교란 정량화(quantitative bias analysis, QBA). E-value(관측된 효과를 설명해 없애려면 미측정 교란인자가 가져야 할 최소 연관강도)와 tipping-point 분석으로 "결론이 뒤집히려면 얼마나 큰 숨은 편향이 필요한가"를 수치로 제시한다.
- 음성대조 결과(negative control outcomes). 치료가 영향을 줄 수 없으나 동일 교란구조를 공유하는 결과변수를 잔여 편향 게이팅·추정치 보정(empirical calibration)에 활용한다.
- 결측·정보적 중도절단 민감도 분석. tipping-point로 결측·informative censoring 가정을 단계적으로 비관/낙관 조정해 결론 안정성을 본다.
EOP2 브리핑북에는 "PSM으로 매칭하겠다"가 아니라 "1차 분석은 X, 강건성은 E-value+음성대조+tipping-point로 입증하고, 모든 계획을 사전 지정한다"가 들어가야 한다. 이 강건성 패키지를 누가 돌릴지도 미리 정해야 한다 — 통상 미국 측 통계 파트너 또는 글로벌 CRO가 FDA가 수용하는 형식으로 사전 지정한다.
한국 데이터(HIRA/심평원)는 글로벌 ECA에 쓸 수 있나: 보조면 가능, 1차는 무리
한국 본사가 가장 듣고 싶어하는 질문이다. 결론부터: 현재 구조에서 HIRA/NHIS 데이터는 글로벌 종양 ECA의 1차 대조군으로는 어렵고, 보조·민감도 분석·지역 대표성 보강용으로는 현실적이다.
근거는 데이터 자체의 성격이다. HIRA와 NHIS는 약 5천만 전국민을 거의 전수 커버하는 단일지불자 청구 데이터이고, HIRA K-OMOP은 2015~2024년 국민건강보험 청구를 OMOP 공통데이터모델로 변환해 56,416,773명 규모로 진단·입원/외래 투약·조제·시술·청구비용을 담아 국제 관찰연구와 상호운용 가능하게 만들었다. 표본 규모와 상호운용성은 세계 최상급이다. 문제는 임상적 정밀도다. HIRA 데이터의 악성종양 진단은 차트와 77.6% 일치율(손상 81.2%), 전체 진단의 약 70%가 차트 진단과 일치하며, 중증·입원에서 정확도가 높다. 바꿔 말하면 청구 기반 진단코드만으로는 종양 ECA가 요구하는 병기·바이오마커·반응평가(RECIST)·예후인자를 채우기 어렵다. STORM 사례처럼 핵심 예후인자가 비면 FDA 재분석에서 효과가 사라진다. 앞서 본 attrition 관점에서도, 청구 데이터는 '데이터 부재로 인한 제외'가 구조적으로 클 수밖에 없다.
규제 인프라도 아직 과도기다. MFDS는 2021년 의약품 등 의료정보 데이터베이스 연구 가이드라인으로 RWE 연구설계·프로토콜·보고서 작성을 다뤘으나, 사전 허가용 정식 RWE 규제 프레임은 아직 없고 사안별로 개방 신호만 낸 상태다. 2024년부터 가명정보를 엄격한 거버넌스 아래 더 유연하게 쓰는 '데이터 결합·활용 존(Data Innovation Zones)'이 운영 중이다. 그러니 한국 데이터를 ECA에 쓰겠다면, 청구 코드 위에 병원 차트·registry를 연계해 임상 변수를 보강하는 작업이 선행되어야 한다.
한국 데이터를 ECA에 끼우는 현실적 용법은 세 가지다.
- 지역 보강. Blinatumomab에서 매칭 후에도 유일하게 남은 불균형이 '지역(region)'이었다. 글로벌 ECA가 미국 EHR 중심이면 아시아 환자가 빠진다. 한국 데이터는 아시아 코호트를 보강해 지역 일반화가능성을 보강하는 카드가 된다.
- 민감도 분석. 1차 ECA(미국 EHR) 결과가 한국 코호트에서도 방향성이 같은지 보이는 robustness 근거.
- EU/HTA 대비. EMA는 2025년 7월 외부대조 reflection paper 작성을 위한 초안 concept paper를 냈고(공개협의 2025년 7월 25일~10월 31일, 11월 3일 워크숍, reflection paper는 2026년 예상), UK MHRA는 2025년 5월 RWD 기반 외부대조 가이드라인 초안을 냈다. 세 규제기관(FDA·EMA·MHRA)이 외부대조를 서로 다르게 개념화하므로, 다지역 데이터 자산은 EU HTA JCA 종양 평가 대응에서 별도 가치를 가진다. RW-ECA는 실제로 HTA 제출에서 점점 비중이 커지고 있어, 약가·상환 협상까지 내다보면 미리 깔아두는 자산이다.
역할분담도 분명히 해야 한다. 한국 본사는 HIRA/registry 데이터 거버넌스·IRB·가명처리·OMOP 매핑을 책임지고, 미국 측 통계 파트너가 FDA가 받아들일 인덱스 정렬·성향점수·결측 처리 분석계획을 사전 지정한다. 한국 데이터를 "있으니까 넣자"가 아니라, 10가지 비교가능성 고려사항 표에 각 변수를 어느 소스로 채울지부터 매핑하는 게 출발점이다.
한 발 앞선 수: '회고적 매칭'에서 '전향적 ECA'로
지금 대부분의 한국 프로그램은 단일군 임상이 어느 정도 진행된 뒤 기존 RWD에서 대조군을 만드는 회고적(opportunistic) 접근이다. FOCR 워크숍에서 반복된 지적은, 이 방식의 한계가 구조적이라는 것이다. 더 신뢰받는 길은 전향적 ECA — 환자가 무작위배정을 거부할 가능성이 높은 임상 셋업(예: 재발이 거의 확정적인 MRD 양성 코호트)을 미리 식별해, 시험과 같은 시점부터 동일한 I/E·혈액검사(ctDNA)·RECIST 영상 일정으로 RWD를 수집하는 방식이다. 가속승인의 확증 RCT에서 대조군 환자가 진행 후 시험약으로 교차(crossover)해 OS가 오염되는 상황도, 동시대 전향적 ECA가 들어갈 강력한 후보다.
한국 바이오텍에 주는 함의: ECA를 "임상 끝나고 붙이는 사후 작업"으로 보면 회고적 접근의 약점을 그대로 떠안는다. EOP2에서 FDA에게 신뢰를 주려면, 단일군 임상과 같은 인프라(동일 영상 판독기준, 동일 바이오마커 측정, 동일 추적 일정)로 대조군 데이터를 전향적으로 모으는 계획을 제시하는 게 한 수 위다. 이건 회고적 미국 EHR을 1차로 두더라도, 전향적·동시대 코호트를 보강으로 까는 하이브리드로 설계할 수 있다.
RWE 정책 변화(2025년 12월)를 오해하지 마라: 의료기기 한정이다
2025년 12월 FDA가 "RWE 사용의 주요 장벽을 제거했다"는 보도가 한국에도 돌았다. 정확히 읽어야 한다. FDA는 2025년 12월 15일 발표·12월 18일 Federal Register 게재(docket FDA-2023-D-4395)된 의료기기 일부 제출용 확정 가이던스에서, RWE를 받을 때 항상 식별 가능한 환자 단위 데이터 제출을 요구하지는 않겠다고 했고, 의약품·바이오 병행 가이던스 업데이트도 검토하겠다고 밝혔다. 그러나 이 변화는 의료기기 한정이다. 의약품·바이오는 아직 변경이 없으며, 전체 환자 단위 데이터를 포함하지 않는 RWE 접근은 여전히 사안별로 FDA와 사전 협의해야 한다.
즉, 항암 바이오텍(의약품/바이오)의 ECA 패키지는 여전히 환자 단위 데이터 제출을 전제로 설계해야 한다. 실제 ASCO가 정리한 2020~2022년 FDA 종양 NDA/BLA 검토에서, RWE를 포함한 29건 중 26건이 수용됐고, 거절 사유에는 방법론 문제·표본 수 우려와 함께 '환자 단위 데이터 누락'이 들어 있었다. 이 정책 변화를 "이제 요약 데이터로 ECA를 낼 수 있다"고 받아들이면 EOP2에서 곧장 깨진다. 또한 데이터를 직접 소유하지 않는 경우(예: Flatiron 라이선스, 해외 registry), FDA가 source data에 접근할 수 있도록 데이터 소유자와의 계약을 사전에 구조화하라는 게 가이던스 요구사항이다 — 한국 본사가 데이터 거버넌스만 챙기고 접근권 계약을 놓치는 일이 흔하다.
규제 근거 계보도 EOP2 브리핑북에 정확히 인용하는 게 좋다. ECT 가이던스의 법적 근거는 21 CFR 314.126과 ICH E10이다. ICH E10(2000년 7월 채택, FDA 2001년 5월 가이던스)은 대조군을 5유형으로 분류하면서 외부/historical control을 "검정군과 대조군의 비교가능성 확보와 중요 편향 최소화 능력에 심각한 우려가 있다"는 이유로 다섯 번째 유형에 둔다. FDA가 ECA에 보수적인 건 최근 기조가 아니라 25년 된 원칙이다.
가속승인을 노린다면 알아야 할 확률과 시계
ECA 패키지를 짜는 한국 바이오텍 대부분의 실제 목적지는 단일군 기반 가속승인이다. 숫자를 직시해야 한다. 2024년 8월 기준 미국 종양 가속승인은 누적 약 170건이고, 그중 약 100건이 확증시험을 거쳐 정규승인으로 전환됐으며, 31건이 철회됐다 — 그 철회 31건 중 24건이 최근 5년에 몰려 있다. FDA 종양센터(OCE)는 종양 가속승인의 약 1520%가 확증시험 실패·미완을 이유로 철회됐다고 본다. 단일군 임상의 비중도 작지 않다 — JAMA Oncology(2023)에 따르면 20022021년 FDA가 종양에서 부여한 단일군 기반 적응증 176건 중 116건이 가속승인이었다.
이 숫자가 ECA 설계에 주는 함의: 가속승인 자체보다 **확증시험(confirmatory trial)**이 진짜 관문이다. 단일군+ECA로 가속승인을 받아도, 확증 RCT를 못 돌리면 몇 년 안에 철회 리스크가 크다. 따라서 EOP2에서는 (1) 단일군 ORR로 가속승인을 받을 경로와 (2) 그 직후 시작할 확증 RCT 설계를 한 세트로 제시해야 한다. ECA를 확증 단계까지 끌고 가 1차 OS 근거로 쓰겠다는 계획은 위 데이터상 FDA가 거의 받지 않는다.
참고로 한국 내 허가 타임라인은 별개로 빨라지고 있다 — MFDS는 2025년 1월 1일부로 신약 허가체계를 개편(전담심사팀, 순차심사, GMP 병행실사)해 약 420일을 295일로, 추가로 240일을 목표로 단축했고 GMP 실사는 제출 후 90일 내 완료를 우선한다. 다만 이건 국내 허가 속도이지, 글로벌 ECA의 FDA 수용성과는 무관하다는 점을 IR·BD 라인에 분명히 해둬야 한다.
다음 90일 실행 순서
EOP2 미팅을 6~12개월 앞둔 한국 항암 바이오텍의 ECA 근거 패키지 준비 순서다.
- (0~2주) 자기 진단. 우리 프로그램이 ORR 가속승인형 / modest-effect RCT 강제형 / 희귀-자연경과 1차근거형 중 어디인지 판정한다. RCT 강제형이면 ECA에 자원을 쓰지 말고 US 페이어 근거계획과 RCT 설계로 방향을 돌린다.
- (2~4주) ECA 역할 + estimand 확정. ECA가 1차 근거인지 보조/민감도 근거인지, 그리고 ICH E9(R1) estimand(중간발생사건 처리전략 포함)를 문서로 못박는다. 종양에서 1차 근거를 노린다면 FDA에 1차 OS 근거 없이는 거의 승인이 없다는 점을 인지하고 보조 설계를 기본값으로 잡는다.
- (4~8주) Feasibility/attrition 분석. 후보 데이터 소스에 우리 I/E를 적용해 잔존 환자 수와 핵심 예후인자·엔드포인트 완결성을 수치화한다. '진짜 제외'와 '데이터 부재 제외'를 분리해 본다(FOCR/Erdafitinib 교훈). 접근한 모든 소스와 배제 이유를 문서화한다.
- (4~8주) 타깃 트라이얼 에뮬레이션 매핑. 적격기준·치료전략·time zero·추적·엔드포인트·estimand 각각을 어느 소스로 어떻게 재현할지 표로 작성한다. 미국 종양 EHR을 1차 후보로 두고 인덱스 정렬(불멸시간 방지)을 사전 지정한다.
- (6~10주) 분석 + 강건성 패키지 사전 지정. 1차 매칭/가중 방법과 그 선택 근거, E-value·tipping-point·음성대조 결과 같은 정량적 편향분석, 결측·정보적 중도절단 민감도 분석, RWD 엔드포인트 측정오차 보정까지 프로토콜에 박는다.
- (6~10주) 한국 데이터 포지셔닝. HIRA/K-OMOP·국내 registry를 지역 보강·민감도·EU/MHRA 대비용으로 자리매김한다. 청구 코드 위에 임상 변수를 보강할 차트/registry 연계와 가명처리·IRB·거버넌스, 그리고 데이터 접근권 계약을 본사 책임으로 착수한다.
- (8~12주) EOP2 브리핑북에 ECA 챕터 통합. 법적 근거(21 CFR 314.126, ICH E10), TTE 기반 설계, feasibility 수치, 편향 완화·강건성 패키지, 그리고 가속승인+확증 RCT를 한 세트로 제시한다. 2025년 12월 RWE 정책 변화는 의료기기 한정임을 명시하고 환자 단위 데이터 제출을 전제로 설계했음을 적는다. 가능하면 전향적·동시대 ECA 보강 계획을 한 수로 더한다.
- (상시) FDA 조기·사안별 협의. 환자 단위 데이터를 일부라도 포함하지 않는 RWE 접근은 의약품·바이오에서 여전히 사안별 협의 사항이다. EOP2 전 Type C/사전미팅으로 데이터 소스·분석계획·estimand에 대한 FDA의 사전 의견을 받아둔다.
ECA는 마법의 지름길이 아니다. 잘 준비된 ECA의 진짜 가치는 "이 데이터로 ECA를 1차 근거로 쓸 수 없다"는 판정을 EOP2 전에 우리 손으로 내려, 헛된 pivotal 설계에 2~3년을 태우지 않는 데 있다.