거대 인공지능(AI) 기업인 앤트로픽(Anthropic)이 AI를 활용해 중국 정부가 지원하는 간첩 작전을 방해했다고 밝혔습니다.
Anthropic에 따르면 중국 정부의 지원을 받는 첫 번째 캠페인에서 AI의 ‘에이전트’ 기능을 사용하여 기술 회사, 금융 기관, 화학 제조업체 및 정부 기관을 대상으로 사이버 공격을 실행했습니다.
월요일에 발표된 보고서에서 Anthropic은 중국 국가와 연관되어 있는 것으로 높은 신뢰도로 평가된 위협 행위자가 Claude Code 도구를 조작하여 약 30개의 글로벌 표적에 침투를 시도했으며 소수의 사례에서 성공했다고 밝혔습니다.
Anthropic은 공격자들이 처음으로 AI의 ‘에이전트’ 기능을 사용하여 AI를 조언자뿐만 아니라 사이버 공격의 실행자로 전환했다고 밝혔습니다. 회사는 이를 실질적인 인간 개입 없이 수행된 대규모 사이버 공격의 기록된 최초의 사례라고 불렀습니다.
9월 중순에 캠페인을 발견한 후 Anthropic은 심각도와 전체 범위를 파악하기 위한 조사를 시작했습니다.
대응의 일환으로 Anthropic은 계정이 식별되면 금지하고, 적절한 경우 영향을 받은 기관에 통보했으며, 조사가 실행 가능한 정보를 수집할 때 당국과 협력했다고 보고서는 밝혔습니다.
중국은 사이버 범죄의 세계적인 리더입니다. 추정에 따르면 전 세계 사이버 공격의 30~40%가 중국에서 발생합니다. 최근 몇 년 동안 연구에 따르면 중국 정부가 후원하는 공격이 최대 150% 증가한 것으로 나타났습니다. 이러한 캠페인은 정부 데이터베이스, 에너지 유틸리티, 기술 회사 및 금융 네트워크와 같은 중요한 시스템을 반복적으로 표적으로 삼았습니다.
AI는 어떻게 스파이가 되었는가
Anthropic은 공격자들이 AI의 고급 특성을 이용하여 이러한 공격을 가했다고 말했습니다.
이제 AI 모델은 복잡한 지시를 따르고 상황을 이해할 수 있는 수준에 도달하여 매우 정교한 작업이 가능해졌습니다. Claude의 독특한 코딩 능력은 이 작업에 특히 유용했습니다.
빠른 읽기
모두 보기
‘그냥 양말인가요?’ 애플의 아이폰 포켓이 인터넷에서 화제가 된 이유
ChatGPT가 여전히 OpenAI의 주머니에 구멍을 뚫고 있기 때문에 Anthropic은 AI 경주에서 승리하여 이익을 얻습니다.
이러한 고급 기능을 갖춘 AI 모델은 ‘에이전트’ 역할을 할 수 있습니다. 즉, 최소한의 인간 입력으로 자율적으로 작동할 수 있습니다. 자율주행차는 이러한 ‘에이전트’ 행동의 실제 사례입니다.
더욱이 AI 모델은 종종 개방형 표준 Model Context Protocol을 통해 다양한 소프트웨어 도구에 액세스할 수 있습니다. 단순한 챗봇이 아닌 이제 웹을 검색하고, 데이터를 검색하고, 이전에는 인간 운영자에게만 허용되었던 작업을 수행할 수 있습니다.
사이버 범죄자는 고급 추론 및 에이전트 능력과 결합된 이러한 도구를 활용하여 AI를 비밀번호 크래커, 네트워크 스캐너 및 기타 보안 관련 소프트웨어로 바꿀 수 있습니다.
중국이 클로드를 스파이로 만든 방법 – 단계별
간첩 활동은 다단계로 이루어졌으며 고도로 자동화되었다고 Anthropic은 말했습니다.
공격자는 AI를 사용하여 캠페인의 80~90%를 수행할 수 있었고 해킹 시도당 4~6개의 중요한 결정 지점에만 개입했습니다.
첫 번째 단계에서 사이버 범죄자는 대상을 선택하고 사람의 개입을 최소화하면서 자동으로 시스템을 손상시키도록 설계된 공격 프레임워크를 구축했습니다. 이 프레임워크는 Claude Code를 자동화 도구로 사용했습니다.
그들은 Claude에게 자신의 임무가 해롭지 않다고 확신했습니다. Claude는 악의적인 활동을 방지하도록 교육을 받았기 때문에 이는 매우 중요했습니다. 공격자들은 모델을 탈옥하고 가드레일을 우회하도록 속여 이를 달성했습니다. 그들은 공격을 작고 겉으로는 무해한 작업으로 나누어 클로드가 전체 맥락을 확인하지 않고 실제 사악한 목적을 깨닫지 못한 채 공격을 실행할 수 있도록 했습니다.
계략의 일환으로 공격자는 방어 테스트를 수행하는 합법적인 사이버 보안 회사의 직원이라고 주장했습니다.
두 번째 단계에서 공격자는 Claude Code를 사용하여 대상 조직의 시스템을 검사하고 가치가 높은 데이터베이스를 식별했습니다.
“Claude는 인간 해커 팀이 소요하는 시간보다 훨씬 짧은 시간에 정찰을 수행할 수 있었습니다. 그런 다음 발견 내용을 요약하여 인간 운영자에게 다시 보고했습니다.”라고 Anthropic은 말했습니다.
세 번째 단계에서 공격자는 Claude를 사용하여 자체 익스플로잇 코드를 조사하고 작성함으로써 취약점을 식별하고 테스트했습니다. 그런 다음 사용자 이름과 비밀번호를 수집하여 더 깊은 액세스 권한을 부여하고 대량의 개인 데이터를 추출하여 인텔리전스 값으로 분류했습니다.
이 단계에서 Claude는 높은 권한의 계정을 식별하고, 백도어를 생성하고, 최소한의 인간 감독으로 데이터를 추출했습니다.
마지막 단계에서 공격자는 Claude를 사용하여 공격에 대한 자세한 문서를 생성하고 훔친 자격 증명 및 분석된 시스템의 파일을 컴파일합니다. 이는 향후 캠페인에 도움이 될 리소스입니다.
Claude는 초당 수천 개의 작업을 수행할 수 있었기 때문에 공격자들은 작업 속도를 극적으로 가속화했습니다.
“AI가 수행하는 엄청난 양의 작업은 인간 팀의 경우 엄청난 시간이 걸렸을 것입니다. AI는 인간 해커가 따라잡을 수 없는 공격 속도를 만들었습니다.”라고 Anthropic은 말했습니다.
그러나 회사는 Claude의 작업이 완벽하지 않다는 점에 주목했습니다. 때때로 자격 증명을 환각으로 나타내거나 실제로 공개된 비밀 정보를 추출했다고 주장했습니다. 아이러니하게도 이러한 단점은 완전 자율 사이버 공격에 장애물이 되었습니다.