4년 전, 엔테(Ente)는 대부분의 VC가 시대착오적이라 여긴 전제를 내세우며 출범했다. 엔드투엔드 암호화 사진 저장. 스캐닝 없음. 서버 측 처리 없음. 당신의 추억은 완전히 봉인된다. 2026년, 바로 그 제약이 엔터프라이즈 소프트웨어에서 가장 매력적인 제품 피치 중 하나가 되었다.
엔테는 방금 기기에서 전적으로 구동되는 로컬 LLM을 출시했다. 클라우드 의존성 제로. 그 어떤 것도 폰 밖으로 나가지 않는다. 그리고 이 타이밍은 더할 나위 없이 절묘하다.
2022년: 시장이 무시한 프라이버시 도박
엔테가 엔드투엔드 암호화를 갖춘 구글 포토 대안으로 해커뉴스에 처음 등장했을 때, 반응은 깔끔하게 갈렸다. 일부 사용자는 열광했다. 다른 이들은 뻔한 질문을 던졌다. 서버에서 사진을 볼 수 없다면 스마트 기능, 검색, 얼굴 인식 등 사진 라이브러리를 실제로 쓸모 있게 만드는 기능을 어떻게 구축할 수 있느냐는 것이었다.
인도에 본사를 둔 창립팀의 답변은 직설적이었다. 그런 건 안 한다. 기기가 그 일을 하게 한다. 당시에는 기본적인 온디바이스 해싱과 메타데이터 처리가 전부였다. 스마트 검색은 먼 미래의 꿈이었다. 회사는 소규모 투자를 유치하고 안정성, 크로스플랫폼 동기화, 그리고 프라이버시를 중시하는 사용자 기반의 신뢰 확보에 집중했다.
2023~2024년: 빅테크, 사진에 클라우드를 건다
구글은 클라우드 기반 사진 기능에 더욱 힘을 실었다. 매직 이레이저(Magic Eraser). 베스트 테이크(Best Take). 생성형 배경화면. 애플도 자체 온디바이스 ML 파이프라인을 내놓았지만, iCloud 포토는 여전히 특정 기능을 서버를 통해 처리했다. 삼성의 갤럭시 AI는 사진 편집 도구에 클라우드 추론을 적극 활용했다.
빅테크의 메시지는 만장일치였다. AI 기능에는 클라우드 컴퓨팅이 필요하다. 온디바이스 모델은 너무 작고, 너무 느리고, 너무 제한적이다. 좋은 기능을 원한다면 데이터가 이동해야 한다.
엔테는 조용히 있었다. 하지만 회사 엔지니어링 블로그에 따르면, 팀은 2023년 후반부터 경량 모델을 실험하며 중급 안드로이드 폰의 메모리 및 발열 제약 조건 내에서 무엇이 가능한지 테스트하고 있었다.
2025년 초: 신뢰의 기반이 금이 가다
빠른 연이어 두 가지 사건이 발생하며 프라이버시 우선 제품에 대한 셈법이 바뀌었다.
첫째, 데이터 주권 규제가 EU, 인도, 그리고 동남아시아 일부 지역에서 강화되었다. EU AI법의 투명성 및 데이터 처리 요건은 유럽 사용자 데이터를 다루는 모든 기업에게 클라우드 기반 AI 추론을 법적으로 위험한 것으로 만들었다. 인도의 디지털 개인정보보호법도 유사한 마찰을 만들어냈다. 하룻밤 사이에 "우리는 모든 것을 클라우드에서 처리합니다"라는 말은 단순한 기술 아키텍처 선택이 아니라 컴플라이언스 리스크가 되었다.
둘째, AI 인프라를 표적으로 한 공급망 공격이 현실화되었다. 널리 사용되는 오픈소스 AI 미들웨어 패키지가 침해된 라이트LLM(LiteLLM) 사건은, AI 스택이 서드파티 클라우드 서비스에 의존할 때 신뢰 체인이 얼마나 취약해지는지를 여실히 보여주었다. 단일 파이썬 패키지를 통해 LLM 호출을 라우팅하던 수천 개의 애플리케이션이, 자신들의 전체 추론 파이프라인이 노출되었음을 알게 되었다. 이 공격은 취미 프로젝트에만 타격을 준 것이 아니었다. 프로덕션 엔터프라이즈 시스템도 정확히 피해 범위 안에 있었다.
독점 데이터를 클라우드 LLM에 넘기는 것에 이미 불안을 느끼던 기업들에게, 이것은 두려워하던 바를 확인시켜 준 사건이었다.
2025년 3월: 엔테, 절대 외부와 통신하지 않는 LLM 출시
회사 블로그에 따르면, 엔테는 사진 애플리케이션에 직접 통합된 로컬 LLM을 발표했다. 이 모델은 시맨틱 검색, 사진 라이브러리에 대한 자연어 쿼리, 그리고 지능형 정리 기능을 처리하며, 모두 온디바이스로 구동된다. 핵심적인 기술적 세부사항은 이것이다. 이 모델은 절대로 외부와 통신하지 않는다. 텔레메트리 없음. 클라우드 폴백 없음. 기기에서 구동할 수 없으면 해당 기능은 단순히 활성화되지 않는다.
수백 개의 댓글이 빠르게 달린 해커뉴스 토론은 개발자 정서에 대해 시사하는 바가 컸다. 최다 추천 댓글은 모델 벤치마크나 파라미터 수에 대한 것이 아니었다. 신뢰에 대한 것이었다. 사용자들은 같은 질문의 변주를 반복해서 물었다. "기기 밖으로 아무것도 나가지 않는다는 걸 검증할 수 있습니까?" 네트워크 호출에 대한 독립적 감사를 가능하게 하는 엔테의 오픈소스 코드베이스는, 어떤 클로즈드소스 경쟁사도 따라올 수 없는 차별점이 되었다.
사서이지, 소설가가 아니다
이것은 폰 위의 GPT-4가 아니다. 이 로컬 LLM은 사진 이해에 특화되어 만들어졌다. 하나의 매우 특정한 도서관에 있는 모든 책을 외운 사서라고 생각하면 된다. 소설은 쓸 수 없지만, 누군가 묘사하는 책이라면 아무리 모호하더라도 찾아낼 수 있다. "딸이 노란 모자를 쓰고 있던 그 해변 여행 사진"은 완전히 로컬 메모리에서 처리되는 풀 수 있는 쿼리가 된다.
트레이드오프는 분명히 존재한다. 수천억 개의 파라미터를 가진 클라우드 모델은 복잡한 추론 과제에서 로컬 모델을 능가할 것이다. 하지만 개인 사진 검색 및 정리라는 특정 도메인에서, 엔테는 프라이빗하게 구동되는 소형 특화 모델이 가족 사진을 타인의 서버에 업로드해야 하는 강력한 모델보다 사용자에게 더 가치 있다는 데 베팅하고 있다.
사진을 훨씬 넘어서는 플레이북
엔테는 사진 저장 회사다. 하지만 이 회사가 써 내려가는 플레이북은 이미지를 훨씬 넘어 적용된다.
지금 엔터프라이즈 환경을 생각해 보자. 금융기관, 헬스케어 기업, 정부 계약업체의 CISO들은 모두 같은 긴장감과 씨름하고 있다. 팀원들은 AI 도구를 원하지만, 컴플라이언스 부서는 민감한 데이터를 외부 추론 엔드포인트로 보내는 것을 승인하지 않는다. 라이트LLM 사태 이후 문제는 더욱 첨예해졌다. 클라우드 AI 체인에서 추가되는 모든 의존성은 또 하나의 잠재적 공격 표면이다.
로컬 LLM은 리스크 모델을 완전히 뒤집는다. 모델이 사용자의 하드웨어에서 구동되면, 벤더는 데이터에 절대 접촉하지 않는다. 소환할 추론 로그도 없다. 가로챌 API 호출도 없다. 침해할 서드파티 미들웨어도 없다. 프라이버시 보장이 계약적이 아닌 아키텍처적으로 이루어진다.
이는 EU의 집행 메커니즘이 성숙해짐에 따라 더욱 중요해진다. 유럽 데이터보호 당국은 개인 데이터를 처리하기 위해 클라우드 기반 AI에 의존하는 기업들에 대한 감시를 강화하겠다는 신호를 보내왔으며, 특히 데이터 최소화 원칙에 대한 감시가 강해지고 있다. 로컬 퍼스트 접근 방식은 이 문제 자체를 회피한다.
회의론자의 주장
모든 사람이 이것이 미래라고 확신하는 것은 아니다.
명백한 반론은 이것이다. 온디바이스 모델은 하드웨어에 종속된다. 2025년 플래그십 폰은 수십억 개의 파라미터를 처리할 수 있다. 클라우드 클러스터는 수천억 개를 처리할 수 있다. 단순한 검색 작업에서는 그 격차가 문제되지 않을 수 있다. 하지만 사용자가 더 정교한 AI 기능을 요구하게 되면, 로컬 추론의 한계는 넘을 수 없는 벽이 될 수 있다.
비즈니스 모델에 대한 질문도 있다. 클라우드 기반 AI는 지속적인 컴퓨팅 비용을 발생시키지만, 사용량 기반 과금을 통해 지속적인 수익 기회도 만들어낸다. 완전 로컬 모델은 엔테가 추론을 수익화할 수 없다는 것을 의미한다. 수익은 스토리지 구독에 묶여 있다. 벤처 투자를 받은 스타트업에게 이는 투자자가 듣고 싶어 하는 상방 시나리오를 제한한다.
해커뉴스 스레드의 일부 댓글은 더 미묘한 지적을 했다. "기기 밖으로 아무것도 나가지 않는다"는 약속은 감사만큼만 신뢰할 수 있다는 것이다. 오픈소스가 도움이 되지만, 대부분의 사용자는 코드를 읽지 않을 것이다. 신뢰는 여전히 평판을 필요로 하고, 평판은 구축하는 데 수년이 걸린다.
창업자와 투자자가 주목해야 할 것
엔테의 행보는 하나의 신호이지, 예외가 아니다. 세 가지 힘의 수렴—유능한 온디바이스 하드웨어, 강화되는 데이터 규제, 그리고 클라우드 AI 공급망에 대한 신뢰 약화—이 2년 전에는 존재하지 않았던 프라이버시 우선 제품의 기회의 창을 열었다.
창업자에게: 제약이 곧 제품이다. "기기 밖으로 아무것도 나가지 않는다"는 사과해야 할 한계가 아니다. 엔터프라이즈 바이어 중 가장 빠르게 성장하는 세그먼트—법무팀이 기술 스택에 대한 거부권을 가진—에게 공명하는 포지셔닝 선언이다.
투자자에게: 로컬 추론 분야를 면밀히 주시하라. 소비자 및 엔터프라이즈 하드웨어에서 구동되는 특화된 도메인 특정 모델을 구축하는 기업들은 파운데이션 모델 연구소와는 근본적으로 다른 문제를 풀고 있다. 이들은 벤치마크 점수로 경쟁하는 것이 아니다. 신뢰 아키텍처로 경쟁하고 있다.
오늘 당장 할 수 있는 한 가지: 엔테의 깃허브 리포지토리를 열고 모바일 클라이언트에서 네트워크 호출을 어떻게 처리하는지 살펴보라. 그들의 제품을 사용하든 안 하든, 검증 가능한 프라이버시—믿어야 하는 정책이 아닌 감사할 수 있는 코드—에 대한 그들의 접근 방식은 연구할 가치가 있는 패턴이다. 이것이 자신의 제품이 하는 데이터 약속에 대한 생각을 바꿔 놓을 수도 있다.
AI의 다음 장은 가장 큰 모델을 만드는 자에 의해서만 쓰이지 않을 것이다. 그 일부는 당신의 주머니 밖으로 나갈 필요가 없는 모델을 만드는 자에 의해 쓰일 것이다.