CRISPR·AI·유전체학의 수렴: 신약 개발 산업 구조 재편의 기술적 논리
2025년 바이오테크 산업의 핵심 동력은 CRISPR 치료제의 임상 성숙, 생성형 AI의 신약 파이프라인 통합, 그리고 유전체 데이터 인프라의 대규모 확장이라는 세 축이 동시에 교차하는 지점에서 형성되고 있다. Sanofi-OpenAI-Formation Bio 파트너십, Intellia의 98% 발작 감소 임상 데이터, Recursion의 BioHive-2 슈퍼컴퓨터 기반 표현형 스크리닝이 신약 개발 패러다임을 '개념 증명'에서 '산업 구조 재편'의 단계로 전환시키고 있다.
서론: 왜 지금 이 수렴이 의미 있는가
신약 개발은 구조적으로 느린 산업이다. 후보 물질 발굴부터 시판 허가까지 평균 12~15년, 비용은 물질당 평균 26억 달러(Deloitte, 2023 R&D Returns Analysis)가 소요된다. 임상 성공률은 1단계 진입 기준 약 7.9%에 불과하다(BIO Industry Analysis, 2023). 이 수치들은 업계가 수십 년간 안고 있는 구조적 비효율의 압축적 표현이다.
2025년 현재, 이 비효율에 동시적으로 도전하는 세 가지 기술 궤적이 상업적 적용 단계에 진입했다. CRISPR 기반 유전자 편집은 단일 투여로 장기 효능을 입증하는 임상 데이터를 축적 중이고, 생성형 AI는 화학 공간과 단백질 서열 탐색을 알고리즘화하고 있으며, 유전체·표현형 데이터 인프라는 AI 모델 훈련에 필요한 규모의 생물학적 맥락 데이터를 공급하기 시작했다. 각각은 독립적으로도 의미 있지만, 세 축이 동시에 성숙하고 있다는 점이 현재 국면을 이전과 질적으로 다르게 만든다.
1. CRISPR 임상의 성숙: ‘개념 증명’에서 ‘용량 최적화’로
Intellia NTLA-2002: 단일 투여 98% 감소가 의미하는 것
유전성 혈관부종(HAE, Hereditary Angioedema)은 FXII 또는 KLKB1 유전자의 변이로 인해 브라디키닌 과잉 생성이 일어나고 급격한 부종 발작이 반복되는 희귀 유전질환이다. 기존 치료제는 발작 예방을 위한 주기적 피하 주사 또는 정맥 주사에 의존해 왔다—환자는 평생 치료 부담을 안고 산다.
Intellia Therapeutics의 NTLA-2002는 CRISPR-Cas9 기반 in vivo 편집을 통해 KLKB1 유전자를 단일 투여로 영구 침묵시킨다. 2025년 발표된 Phase 1/2 업데이트에서 NTLA-2002는 월평균 발작률을 98% 감소시켰으며, 8회 추적 관찰 기간(최대 ~2년) 동안 효능이 유지되었다. 중대한 안전 사건은 보고되지 않았다.
이 데이터가 중요한 이유는 단순히 수치가 높아서가 아니다. 단일 투여의 장기 내구성이 입증되었다는 것은 유전자 편집이 기존 만성 치료제(biologic 또는 소분자)와 다른 약가 및 급여 모델을 가질 수 있음을 시사한다. 치료 패러다임이 ‘지속 투여’에서 ‘일회성 개입’으로 이동할 경우, 의약품 공급망, 보험사 급여 계산 방식, 환자 접근성 모두 재편된다.
Regeneron-Mammoth Biosciences: 간 너머를 향한 편집
현재 in vivo CRISPR 치료제 대부분은 LNP(지질 나노입자) 전달 시스템에 의존하며, 이 시스템이 가장 효율적으로 도달하는 기관은 **간(liver)**이다. Intellia의 NTLA-2002도 간세포 내 KLKB1을 편집한다. 이것이 현재 in vivo CRISPR의 가장 큰 구조적 한계다—간 외 조직, 특히 근육, 폐, 뇌, 면역세포로의 전달 효율은 아직 임상 검증이 미흡하다.
Regeneron과 Mammoth Biosciences의 최대 1억 달러 규모 협력은 이 한계를 정면으로 겨냥한다. Mammoth의 핵심 자산은 자연계에서 발굴한 초소형(ultra-compact) CRISPR 시스템이다—대표적으로 CasΦ, Cas14 계열. 이들은 기존 SpCas9(약 4.2 kb)에 비해 현저히 작아 아데노-연관 바이러스(AAV) 벡터에 탑재하기 용이하다. AAV는 간 외 조직, 특히 근육·중추신경계·망막 전달에서 LNP보다 임상 전례가 두텁다.
이 협력이 성공할 경우, CRISPR 치료 가능 질환의 적응증 범위는 희귀 간질환에서 근이영양증, 신경퇴행성 질환, 일부 고형암으로 확장될 수 있다. 시장 기회의 크기 자체가 달라진다.
Enhanced Prime Editing: 차세대 정밀 편집의 임상 진입 가속
CRISPR-Cas9이 DNA를 절단하는 방식이라면, Prime Editing은 절단 없이 원하는 서열을 직접 써 넣는 기술이다. 이론적으로 삽입, 결실, 모든 점 돌연변이 유형에 적용 가능하며, 표적 외 효과(off-target)가 상대적으로 낮다. 그러나 임상 적용의 주된 장벽은 편집 효율이었다—특히 간 및 폐세포에서의 낮은 효율은 치료적 농도 달성을 어렵게 했다.
최근 발표된 ePE(enhanced Prime Editing) 연구는 pegRNA(prime editing guide RNA) 구조 최적화와 단백질 엔지니어링을 결합해 간·폐세포에서 기존 대비 5배 향상된 편집 효율을 보고했다. 이 수준의 효율 개선은 단순한 기술적 진보가 아니라 임상 진입 가능성의 임계값 통과를 의미한다.
Prime Editing의 잠재적 적용 대상 중 하나는 낫 모양 적혈구병(SCD) 및 β-지중해빈혈이다—현재 CRISPR-Cas9 기반 Casgevy(Vertex/CRISPR Therapeutics)가 이미 FDA 승인을 받았지만, 교정 효율이 치료 결과에 직접 연동되는 만큼 ePE의 개선은 향후 경쟁 구도에 영향을 미칠 수 있다.
2. AI 신약 개발: 인프라 투자에서 파이프라인 통합으로
Sanofi-OpenAI-Formation Bio: 대형 제약사의 AI 전략 선언
Sanofi가 OpenAI, Formation Bio와 체결한 파트너십은 대형 제약사가 AI를 연구 보조 도구가 아닌 핵심 파이프라인 인프라로 통합하겠다는 전략적 의지의 표현이다. 이 협력의 기술적 핵심은 세 가지다:
- 독점 데이터 통합: Sanofi가 보유한 임상 시험 데이터, 분자 데이터베이스, 실패한 후보 물질 데이터를 모델 훈련에 투입
- 임상 시험 설계 자동화: 환자 코호트 선별, 엔드포인트 최적화, 프로토콜 생성을 AI로 보조
- 분자 최적화 루프: 구조-활성 관계(SAR) 분석을 생성형 AI로 가속화
Formation Bio(구 Triomics)는 임상 운영 AI 플랫폼을 전문으로 하며, FDA 제출 문서 자동화 및 시험 모니터링에서 검증된 track record를 보유한다. OpenAI의 대규모 언어 모델이 여기에 결합되면 자연어 기반 임상 프로토콜 생성 및 규제 문서 작성이 가능해진다.
주목할 점은 Sanofi가 2024년 AI 인력에 집중 투자를 선언하고 기존 연구직 일부를 조정한 기업이라는 맥락이다. 이 파트너십은 그 전략의 구체적 실행 형태로 읽힌다.
Recursion BioHive-2: 바이오파마 전용 슈퍼컴퓨터의 등장
Recursion이 NVIDIA H100 GPU 클러스터로 구성된 BioHive-2의 운영을 공식화한 것은 AI 신약 개발 인프라 경쟁이 새로운 차원에 진입했음을 보여준다. Recursion에 따르면 BioHive-2는 제약 산업에서 가장 빠른 AI 슈퍼컴퓨터다.
이 시스템의 핵심 목적은 자사의 대형 언어 모델 ‘Lowe’ 구동이다—Lowe는 Recursion이 수년간 수집한 수천만 건의 세포 이미지, 유전체, 표현형 데이터를 해석해 새로운 약물-표적 상호작용을 예측한다. 바이오테크 기업이 이 규모의 전용 컴퓨팅 인프라를 직접 운영한다는 것은 데이터 파이프라인의 내재화, 즉 핵심 역량의 수직 통합을 의미한다.
NVIDIA-Terray ‘CODA’: 화학 공간의 생성적 탐색
NVIDIA의 BioNeMo 플랫폼 위에서 Terray Therapeutics가 훈련 중인 CODA 모델은 소분자 화학 공간을 생성형 AI로 탐색한다. 핵심 차별점은 복잡한 단백질 표적에 대한 결합 친화도(binding affinity) 예측 속도다—기존 분자 동역학 시뮬레이션 대비 수천 배 빠른 처리가 가능하다고 알려져 있다.
이 속도 우위의 실질적 함의는 히트-투-리드(hit-to-lead) 단계의 압축이다. 전통적으로 수개월이 소요되던 초기 화합물 선별 과정이 알고리즘화될 경우, 선도 물질 발굴 비용과 시간이 동시에 감소한다.
Absci-AstraZeneca: De Novo 항체 설계의 상업화
Absci의 ‘통합 신약 창조(Integrated Drug Creation)’ 플랫폼이 AstraZeneca의 종양학 파이프라인에 적용되는 것은 AI 기반 de novo 항체 설계가 실제 상업적 파이프라인에 통합되는 전례를 만들고 있다.
De novo 항체 설계는 자연 항체 라이브러리를 출발점으로 삼지 않고, AI가 원하는 결합 특성과 물리화학적 성질을 가진 항체를 처음부터 설계하는 접근이다. 표적 특이성을 유지하면서 생물물리학적 특성(안정성, 용해도, 면역원성)을 동시에 최적화하는 것이 기술적 핵심이다.
3. 기술 수렴의 구조: 무엇이 어디서 만나는가
| 기술 축 | 핵심 기업/프로젝트 | 현재 성숙도 | 주요 병목 | 수렴 포인트 |
|---|---|---|---|---|
| In vivo CRISPR (간) | Intellia NTLA-2002, Beam Therapeutics | Phase 2 임상 데이터 확보 | 급여 모델, 제조 스케일업 | 유전체 데이터로 편집 표적 선별 |
| In vivo CRISPR (간 외) | Regeneron-Mammoth, Sarepta | 전임상~Phase 1 | AAV 면역원성, 재투여 불가 | AI로 전달 시스템 최적화 |
| Prime Editing | Beam Therapeutics, Prime Medicine | 전임상~초기 임상 | 편집 효율, 전달 | ePE로 효율 임계값 돌파 시도 |
| 생성형 AI (소분자) | Terray-NVIDIA CODA, Insilico Medicine | 상업적 적용 단계 | 예측 정확도 검증, 규제 | 유전체 데이터로 표적 정의 |
| 생성형 AI (항체) | Absci-AstraZeneca, AbSci, Generate | 파트너십 통합 단계 | in vivo 검증, 제조 | CRISPR 표적과 항체 표적 중첩 |
| AI 임상 운영 | Sanofi-OpenAI-Formation Bio, Unlearn | 초기 상업화 | 규제 수용성, 데이터 거버넌스 | 유전체 바이오마커로 임상 설계 |
| 유전체 데이터 인프라 | Recursion BioHive-2, Illumina, Tempus | 대규모 운영 | 데이터 표준화, 프라이버시 | 모든 AI 모델의 훈련 데이터 공급 |
이 표가 보여주는 것은 각 기술이 독립적으로 발전하는 것처럼 보이지만, 유전체 데이터라는 공통 기반에서 수렴한다는 점이다. CRISPR 편집 표적을 선별하기 위해서도, AI 신약 모델을 훈련하기 위해서도, 임상 환자를 층화하기 위해서도 유전체 데이터는 필수 인프라다.
4. 산업 구조에 가해지는 실질적 압력
대형 제약사(Big Pharma): 수직 통합 vs. 전략적 제휴
Sanofi의 사례는 대형 제약사가 AI 역량을 내재화할 것인지, 아니면 플랫폼 기업과 파트너십을 통해 접근할 것인지의 전략적 선택을 드러낸다. 현재까지의 패턴을 보면 완전 내재화보다 전략적 제휴가 우세하다—Pfizer-CX Daily, Roche-Genentech AI integration, AstraZeneca-Absci 모두 파트너십 형태다.
그 이유는 구조적이다. 대형 제약사가 보유한 핵심 경쟁력은 규제 역량, 제조 스케일업, 글로벌 영업망이지 알고리즘 개발이 아니다. AI 플랫폼 기업에 데이터를 제공하고 결과물에 접근하는 것이 효율적인 모델일 수 있다. 단, 이 경우 데이터 소유권과 모델 접근권에 대한 계약 구조가 핵심 협상 변수가 된다.
CRO·CMO: 자동화의 첫 번째 충격 흡수층
임상시험수탁기관(CRO)과 의약품 위탁생산기관(CMO)은 AI 자동화의 직접적 영향권에 있다. Formation Bio와 같은 AI 임상 운영 플랫폼이 프로토콜 설계, 환자 선별, 모니터링의 상당 부분을 자동화할 경우, 전통적 CRO의 인력 집약적 사업 모델에 직접적 압력이 가해진다.
다만 단기적으로 CRO가 소멸하기보다는 역할 재편이 더 현실적 시나리오다. AI 도구를 활용하는 CRO와 그렇지 못한 CRO 간의 효율 격차가 확대되면서 시장 집중이 가속될 가능성이 높다.
바이오텍 스타트업: 플랫폼 기업으로의 포지셔닝 vs. 단일 프로그램 집중
Mammoth Biosciences(Regeneron과 1억 달러 딜), Absci(AstraZeneca 파트너십)의 사례는 바이오텍 스타트업이 취할 수 있는 두 가지 전략 유형을 보여준다:
- 플랫폼 기업형: 기술 자산(CRISPR 시스템, AI 설계 플랫폼)을 다수 대형 파트너에 라이선스하면서 마일스톤 수익을 확보. 특정 질환에 대한 임상 리스크 직접 부담을 최소화.
- 파이프라인 집중형: Intellia처럼 자체 임상 프로그램을 직접 운영하고 데이터 소유권을 유지. 성공 시 가치 상승 폭이 크지만 자본 소모가 심하다.
현재 자본 시장 환경(고금리, 바이오텍 섹터 선별적 자금 유입)에서는 플랫폼형 전략이 단기 생존 가능성이 높지만, 중장기 기업 가치 측면에서는 임상 데이터를 직접 보유한 파이프라인 집중형이 유리한 경쟁 지위를 구축할 수 있다.
5. 규제와 급여: 기술이 만나는 현실적 장벽
기술적 진보가 아무리 빠르더라도, 상업화 경로는 규제 승인과 급여 결정이라는 두 개의 관문을 통과해야 한다.
규제 측면: FDA는 2024년 AI/ML 기반 신약 개발 가이던스 초안을 발표했으며, 특히 AI 생성 후보 물질에 대한 비임상 데이터 요구사항이 명확화되지 않은 상태다. CRISPR 치료제의 경우 Casgevy 승인이 선례를 만들었지만, in vivo 편집(혈액 세포 ex vivo 편집인 Casgevy와 달리 체내 직접 투여)에 대한 장기 안전성 추적 요구는 더 복잡하다.
급여 측면: Intellia의 NTLA-2002가 단일 투여로 장기 효능을 보인다면, 가격 산정은 기존 만성 치료제의 연간 투여 비용 누적치와 비교해야 한다. HAE 치료에 현재 사용되는 lanadelumab(Takhzyro)의 미국 연간 치료비는 약 45만 달러 수준이다. 단일 투여 유전자 편집 치료제가 이 누적 비용을 상회하는 가격으로 책정될 경우 민간 보험사와의 협상이 복잡해진다.
결론: 세 기술이 함께 성숙할 때 생기는 것
CRISPR, AI 신약 개발, 유전체학의 동시 성숙이 만들어내는 것은 단순히 더 빠른 신약 개발이 아니다. 그것은 누가 신약 개발의 핵심 역량을 소유하는가에 대한 질문의 재구성이다.
전통적으로 이 역량은 막대한 임상 경험, 규제 관계, 글로벌 영업망을 보유한 대형 제약사에 집중되어 있었다. 그러나 AI 플랫폼이 후보 물질 발굴 단계를 민주화하고, CRISPR가 단일 투여 치료를 가능하게 하며, 유전체 데이터가 표준화된 API로 접근 가능해질수록, 경쟁의 진입 장벽 구조가 변한다.
이미 Recursion, Absci, Mammoth와 같은 기업들이 대형 제약사와 대등한 기술 협상 포지션을 갖기 시작했다. 향후 5~7년은 이 기술 우위가 실제 임상 데이터와 상업적 성과로 전환되는지—혹은 기술적 가능성이 규제·급여·제조 현실에 부딪혀 속도를 조절하는지—가 결판나는 시기다.
어떤 방향이 되든, 지금 형성되고 있는 기술-자본-규제의 삼각 구도는 향후 바이오파마 산업의 가치사슬 배치를 결정하는 근거가 될 것이다.