베이징의 실리콘밸리라 할 수 있는 중관촌 어딘가에서, 중견 AI 연구소의 한 연구원이 지난주 내게 자신의 팀이 H100 컴퓨팅 시간을 "가뭄 속 물처럼 배급하고 있다"고 말했다. 그녀의 회사가 미국 상무부에 수출 허가 신청을 진행 중이어서 익명을 요청했다.
그 가뭄이 곧 끝나거나, 훨씬 더 심해지려 한다.
백악관은 월요일, CNBC 보도에 따르면 트럼프 대통령이 5월 시진핑 주석과의 대면 회담을 위해 베이징을 방문할 것이라고 확인했다. 공식 의제는 광범위하다: 무역, 펜타닐, 대만해협 안정. 그러나 반도체 수출 통제 —— 누가 프런티어 AI를 구축할 수 있고 없는지를 결정짓는 가장 중대한 정책 수단 —— 는 인쇄된 일정표에 등장하든 말든 회담장에 함께할 것이다.
이번 정상회담이 글로벌 AI 지형에 어떤 의미를 가질 수 있는지 이해하기 위해, 매우 다른 관점에서 협상을 추적하고 있는 세 사람과 이야기를 나눴다.
"이건 무역 전쟁이 아니라 아키텍처 전쟁이다"
Q: 사라 첸 박사님, 조지타운대 안보·신흥기술센터(CSET)에서 지난 10년간 반도체 공급망을 연구하셨습니다. 칩 수출 통제에 대해 사람들이 가장 먼저 오해하는 것은 무엇인가요?
사라 첸: 칩에 관한 것이라는 오해입니다. 사실 이것은 향후 20년간 AI 인프라의 아키텍처를 누가 정의할 것인가의 문제입니다. 바이든 행정부가 2022년 10월 수출 통제를 도입하고 2023년 10월 이를 강화했을 때, 목표는 중국의 AI 발전 자체를 막는 것이 아니었습니다. 프런티어를 늦추는 것 —— 미국 동맹국 연구소가 훈련할 수 있는 것과 중국 연구소가 훈련할 수 있는 것 사이의 세대 격차를 유지하는 것이었습니다.
Q: 효과가 있었나요?
첸: 부분적으로요. 중국 연구소들은 놀라울 정도로 창의적으로 대응해왔습니다. 화웨이의 어센드(Ascend) 910C는 실재합니다. H100 킬러는 아니지만 광범위한 추론 워크로드를 처리합니다. 수출 통제가 진정으로 제약한 것은 대규모 훈련 클러스터 —— 수만 개의 긴밀하게 상호 연결된 최상위 GPU —— 를 구축하는 능력입니다. 바로 거기서 병목이 물립니다.
Q: 그렇다면 트럼프가 5월에 칩 통제를 협상 테이블에 올리면 어떻게 달라지나요?
첸: 모든 것이 거래의 대상이 됩니다. 바이든 시대의 프레임워크는 수출 통제를 국가안보의 마지노선 —— 거래의 대상이 되지 않는 것 ——으로 취급했습니다. 트럼프 행정부는 올해 초 "AI 확산 규칙(AI Diffusion Rule)" 조정과 각종 발언을 통해 이 통제를 지렛대로 본다는 신호를 보냈습니다. 이는 근본적으로 다른 자세입니다. 펜타닐 원료물질이나, 행정부가 별도의 외교 트랙을 가동 중인 이란 문제에 대한 양보의 대가로 특정 중국 기업에 대한 맞춤형 규제 완화가 나올 수 있습니다. 폭스뉴스는 이번 주 백악관이 15개 항목의 이란 평화 제안을 내놓았으며 파키스탄이 회담 개최를 제안했다고 보도했습니다. 이 줄기들은 연결되어 있습니다. 외교는 포트폴리오입니다.
GPU가 부족한 연구소 내부
Q: 걸프 지역 소재 AI 연구소의 시니어 ML 엔지니어와도 이야기를 나눴습니다. 이름만 밝혀달라고 한 칼리드입니다. 미국이 최근 AI 확산 규칙에 따라 "Tier 2"로 지정한 지역에서 대규모 언어 모델을 구축하고 계시는데, 실무적으로 어떤 의미인가요?
칼리드: 칩을 구매할 수는 있지만 상한이 있다는 뜻입니다. 특별 허가 없이 수입할 수 있는 컴퓨팅 양에 한도가 있습니다. 경쟁력 있는 아랍어 모델을 훈련하려는 연구소에게 그 한도는 중요합니다. 우리는 군사용 애플리케이션을 만드는 게 아닙니다. 4억 명의 화자가 쓰는 방언을 이해하는 무언가를 만들려는 것입니다. 그런데 허가 체계는 우리의 용도와 무기 프로그램을 구분하지 않습니다.
Q: 중국에 계시지 않은데도 트럼프-시진핑 정상회담이 영향을 미치나요?
칼리드: 직접적으로요. 미국이 더 큰 거래의 일환으로 중국에 대한 통제를 완화하면, 동맹국을 규제할 정치적 명분이 약해집니다. 베이징에는 수도꼭지를 열어주면서 아부다비에 대한 칩 판매는 왜 제한합니까? 반대로, 회담이 결렬되고 규제가 더 강화되면, 미국과 소수 동맹국 외에는 누구도 프런티어 하드웨어에 접근하기 어렵게 만드는 2차 제재가 나올 수 있습니다.
온디바이스 AI: 이미 진행 중인 헤지
Q: 이번 주 제게 인상 깊었던 것이 있습니다. 외교관들이 5월을 위한 브리핑 자료를 준비하는 동안, 개발자들은 이미 병목을 우회하며 구축하고 있습니다. 암호화 사진 저장 서비스 엔테(Ente)가 온디바이스에서 완전히 구동되는 로컬 LLM 애플리케이션 엔수(Ensu)를 출시했습니다. 해커뉴스에서 300포인트 이상을 받으며 상위에 올랐습니다. 첸 박사님, 온디바이스 AI는 칩 부족에 대한 의미 있는 대응인가요, 아니면 곁가지인가요?
첸: 프런티어 훈련을 대체하지는 못합니다 —— 스마트폰으로 GPT-5를 훈련할 수는 없으니까요. 하지만 추론이 일어나는 위치에서 의미 있는 전환을 보여주며, 추론은 대부분의 사용자가 실제로 AI와 상호작용하는 지점입니다. 유능한 모델을 로컬에서 실행할 수 있다면 클라우드에서 분리된 것이고, 이는 데이터센터를 누가 통제하느냐의 지정학에서 분리된 것입니다. 이것은 중요합니다. 해커뉴스 게시물에 추천을 누른 309명의 개발자들이 단순히 프라이버시에 열광하는 것이 아닌 이유이기도 합니다. 그들은 독립성에 열광하고 있는 것입니다.
칼리드: 우리 지역에서 온디바이스 추론은 데이터 주권의 문제이기도 합니다. 이곳 정부들은 시민들의 질의가 버지니아의 서버를 경유하는 것을 원하지 않습니다. 디바이스에서 구동되고, 아랍어를 자연스럽게 처리하며, 절대 외부로 데이터를 보내지 않는 모델? 그것은 곁가지가 아닙니다. 그것이 곧 제품입니다.
5월 회담의 세 가지 현실적 결과
Q: 첸 박사님, 현실적인 세 가지 결과를 가능성 순으로 말씀해 주시죠.
첸: 첫째, 가장 가능성 높은 시나리오: "AI 안전에 관한 협력"이라는 모호한 공동 성명으로, 실질적으로 달라지는 것은 없지만 양측 모두 화두를 얻습니다. 둘째, 중간 정도의 가능성: 소수의 중국 기업 —— 아마도 의료나 기후 모델링 분야 ——에 대한 맞춤형 허가 승인, 펜타닐 단속 약속과 짝을 이루는 것입니다. 이를 통해 트럼프는 거래를 성사시켰다고, 시진핑은 체면을 세웠다고 주장할 수 있습니다. 셋째, 가능성은 낮지만 불가능하지 않은 시나리오: 티어 시스템을 재편하는 보다 포괄적인 프레임워크로, 특정 중국 기관의 등급을 상향하면서 동남아시아 중개국을 통한 우회를 더 엄격히 통제하는 것입니다. 이 세 번째 시나리오는 판도를 진정으로 바꿀 것입니다.
Q: 칼리드 씨, 바라시는 것은 무엇인가요?
칼리드: 명확성입니다. 지금 우리가 내리는 모든 조달 결정은 6개월마다 바뀌는 정책 환경에 대한 베팅입니다. 우리는 그저 규칙을 알고 계획을 세우고 싶을 뿐입니다. 그리 많은 것을 바라는 게 아닙니다.
정상회담 너머의 이해관계
지정학의 소용돌이 속에서 계속 잊히는 것이 있다: 컴퓨팅 자원에 대한 접근을 제한하는 모든 규제는 곧 AI 구축에 참여할 수 있는 사람을 제한하는 것이기도 하다. 중관촌에서 H100 사용 시간을 배급하는 그 연구원은 무기를 만들고 있는 것이 아니다. 농촌 병원을 위한 의료 영상 모델을 훈련하고 있다. 아부다비의 팀은 미국의 패권을 위협하고 있는 것이 아니다. 그들은 아랍어로 작동하는 AI를 만들려는 것이다.
칩 수출 통제는 정당한 국가안보 수단이다. 하지만 현재로서는 AI 역량의 지리적 분포를 결정짓는 가장 큰 요인이기도 하다. 이것이 5월 베이징 정상회담을 올해 기술 산업에서 가장 중대한 회담 중 하나로 만든다 —— 공식 커뮤니케에 "AI"라는 단어가 한 번도 등장하지 않더라도.
협상은 진행 중이다. 제약은 현실이다. 그리고 연구소들은 —— 브루클린에서 방갈로르, 베이징까지 —— 지켜보고 있다.
오늘의 작은 실천
터미널을 열고 python3 -c "import platform; print(platform.processor())"를 실행해 로컬 칩 아키텍처를 확인해 보세요. 그런 다음 llama.cpp를 사용해 Llama 3 같은 양자화된 오픈소스 모델을 로컬에서 실행할 수 있는지 찾아보세요. 놀라실 수도 있습니다. AI의 미래는 데이터센터에만 있지 않습니다. 일부는 이미 여러분의 책상 위에 있습니다.