Anthropic이 자사 비공개 모델 Claude Mythos를 약 150개 조직에 추가로 풀어, 전력·수도·의료·통신 같은 핵심 인프라의 소프트웨어 취약점을 찾는 Project Glasswing을 15개국 이상으로 확대했다. 6월 2일자 발표 기준이고, 4월에 미국 정부를 포함한 50여 개 파트너로 시작한 프로그램을 한 단계 키운 것이다.
이 블로그에서 Copy Fail, NGINX Rift, DirtyDecrypt 같은 CVE를 다룰 때마다 깔려 있던 전제가 하나 있었다. 취약점은 사람이 찾는다는 것. 그 전제가 지금 흔들리고 있다.
Project Glasswing과 Claude Mythos가 무엇인가
Claude Mythos는 Anthropic이 일반에 공개하지 않은 프리뷰 모델이다. Anthropic은 이 모델이 코드에서 취약점을 찾고 익스플로잇을 짜는 능력에서 극소수 최상위 인간 보안 연구자를 제외한 거의 모두를 앞선다고 설명한다. 몇 주 단위로 수천 개의 제로데이를 찾아낼 수 있다는 것이 핵심 주장이다.
Project Glasswing은 이 모델을 통제된 형태로 파트너 조직에 제공하는 프로그램이다. 파트너는 Mythos를 받아 자기 코드베이스를 스캔하고, 취약점을 식별하고, 패치를 작성하고, 릴리스 전 점검까지 돌린다. 발표에 따르면 실제 활용 범위는 다음과 같다.
- 취약점 패치 작성과 테스트
- 릴리스 전 소프트웨어 검증
- 침투 테스트
- 위협 탐지
- 메모리 안전 언어로의 코드 번역
흥미로운 대목은 Anthropic이 이 모델을 일반에 공개하지 않겠다고 못 박았다는 점이다. 이런 사이버 능력이 악용되는 것을 막을 안전장치가 아직 충분히 갖춰지지 않았고, 자사를 포함한 어떤 AI 개발사도 그 수준에 이르지 못했다는 이유다. 취약점을 잘 찾는 능력은 방어에도 쓰이지만 공격에도 그대로 쓰인다. 이중 용도 문제를 정면으로 인정한 셈이다.
어디에 적용됐고, 무엇을 찾아냈나
확대된 명단에는 전력·수도·의료·통신, 그리고 하드웨어 벤더와 오픈소스 메인테이너가 들어간다. 초기 50개 파트너 그룹에서는 상대적으로 빠져 있던 영역이라는 게 Anthropic의 설명이다. 국가는 미국 외에 호주·캐나다·프랑스·독일·이탈리아·스위스·네덜란드·스페인·벨기에·스웨덴·인도·일본·뉴질랜드, 그리고 한국이 포함됐다. 접근 권한이 확인된 조직으로는 Okta, Samsung, SK Hynix, SK Telecom, NATO, EU 사이버보안 기관 ENISA 등이 거론됐다.
Anthropic은 확대 우선순위를 정한 기준을 이렇게 밝혔다.
파트너 대부분은 한 번의 대규모 공격으로 1억 명 이상이 피해를 입을 수 있다고 본다. 세계 안보와 각국 안보 양쪽에 중대한 영향을 미친다.
규모 수치는 출처에 나온 것만 정리하면 이렇다.
| 항목 | 수치 |
|---|---|
| 발견된 고위험·심각 취약점 | 10,000건 이상 |
| 스캔한 오픈소스 프로젝트 | 1,000개 이상 |
| 전체 발견 이슈 | 23,019건 |
| 그중 고위험·심각 등급 | 6,202건 |
| Anthropic + 외부 6개 보안업체가 검증한 건 | 1,752건 |
| 검증된 건의 진짜 양성(true positive) 비율 | 90% 초과 |
프로그램은 2026년 4월 초에 시작했다. 구체적 사례로 Cloudflare와 Mozilla가 자사 코드베이스에서 각각 수백 건의 취약점을 발견했다고 언급됐다. 또 수십억 대 기기가 쓰는 암호 라이브러리 wolfSSL에서 인증서 위조 공격으로 이어질 수 있는 결함을 Mythos가 짚어낸 사례도 공개됐다.
방어자에게 이것은 무엇을 의미하나
겉으로 드러난 그림은 방어자에게 유리하다. 취약점을 찾는 비용이 급격히 떨어지면, 자기 코드를 먼저 점검하는 쪽이 더 많은 구멍을 더 빨리 메울 수 있다. Anthropic이 내세우는 목표 자체가 “방어자에게 영구적 우위"를 만드는 것이다. 더 싼 AI 모델이 공격자 손에 들어가기 전에 방어 쪽이 앞서가야 한다는 논리다.
하지만 이 그림에는 균형추가 필요하다.
첫째, 찾는 것과 고치는 것은 다른 문제다. Anthropic 스스로 인정한 병목이 바로 여기다. 취약점을 찾기는 쉬워졌는데, 검증하고 공개하고 패치하는 일은 여전히 사람의 몫이고 느리다. 23,019건을 찾아냈지만 검증된 건은 1,752건이다. 나머지는 누군가 일일이 분류하고 확인해야 한다. 진짜 양성 비율이 90%를 넘는다는 건 바꿔 말하면 10건 가까이를 외부 보안업체 여섯 곳까지 동원해 검증했다는 뜻이기도 하다. 자동 탐지가 뱉어낸 결과는 곧바로 믿을 수 있는 결론이 아니라, 사람이 처리해야 할 대기열일 뿐이다.
둘째, 부담이 특정 지점에 쏠린다. 특히 오픈소스 메인테이너다. 많은 프로젝트가 소수의 자원봉사자로 굴러간다. 여기에 AI가 쏟아내는 취약점 리포트가 밀려들면, 그 자체가 새로운 운영 부하가 된다. Anthropic도 이 긴장을 알고 있어서, 메인테이너가 리포트를 더 빨리 분류할 수 있도록 Mythos를 활용하는 방안과 오픈소스 취약점 보고 모범 사례 공개를 검토 중이라고 밝혔다. 도구가 만든 문제를 같은 도구로 풀겠다는 접근인데, 효과는 지켜봐야 한다.
셋째, 이중 용도 위험은 사라지지 않고 미뤄졌을 뿐이다. Anthropic은 Mythos급 모델을 일반 공개하지 않겠다고 했지만, 동시에 “앞으로 몇 주 안에” 모든 고객에게 Mythos급 모델을 제공할 것으로 본다고 말한다. 경쟁사도 비슷한 방향이다. 같은 기간 OpenAI는 사이버보안 특화 모델 GPT-5.5-Cyber를 다수 테스트 파트너에 배포했다. 방어자가 먼저 쓰는 동안 공격자도 비슷한 능력에 다가가고 있다는 뜻이고, “영구적 우위"라는 표현은 마케팅 문구에 가깝게 들린다.
정리하면, 운영·보안 관점에서 실질적으로 바뀌는 건 탐지 단계의 처리량이다. 그 뒤의 검증·분류·패치·배포는 여전히 사람과 조직의 역량에 묶여 있고, 오히려 탐지가 빨라질수록 이쪽 병목이 더 도드라진다. AI 취약점 탐지를 도입한다면 가장 먼저 점검할 것은 모델 성능이 아니라 우리 조직이 늘어난 발견 건수를 소화할 분류·패치 파이프라인을 갖췄는가다.
탐지에서 패치까지, 병목은 뒤쪽에 있다
flowchart TD
A[AI 취약점 탐지
대량 출력] --> B[검증·분류
사람 개입]
B --> C{진짜 취약점?}
C -->|예| D[패치 작성]
C -->|아니오| E[오탐 폐기]
D --> F[공개·배포]
B -.병목.-> G[메인테이너 부하]
F -.병목.-> G
탐지는 싸지고 빨라졌다. 그래서 무게중심이 도식의 아래쪽, 사람이 붙어야 하는 검증과 패치·배포로 옮겨갔다. Project Glasswing이 던지는 진짜 질문은 “AI가 취약점을 찾을 수 있는가"가 아니라 “찾아낸 것을 우리가 감당할 수 있는가"다.
참고: