본문 바로가기

콩's AI

Gemma 4 (젬마 4) 기반 오픈 소스 안드로이드 제어앱 PokeClaw

반응형
PokeClaw: 내 폰을 스스로 제어하는 자율주행 AI 에이전트

내 폰을 스스로 제어하는 자율주행 AI 에이전트, PokeClaw의 등장

최근 Gemma 4가 출시된 지 불과 며칠 만에, 스마트폰을 실제로 제어할 수 있는 놀라운 앱이 탄생했습니다. 바로 PokeClaw(PocketClaw)입니다. 개발자가 단 이틀간 밤샘 작업을 하며 만든 이 앱은 Gemma 4를 기반으로 Android 폰을 자율적으로 제어할 수 있는 세계 최초의 시도 중 하나입니다.

가장 큰 특징은 전체 파이프라인이 기기 내부에서 작동하는 폐쇄 루프(Closed-loop) 방식이라는 점입니다. 와이파이가 없어도, 비싼 API 요금을 내지 않아도 AI가 여러분의 폰을 떠나지 않고 작업을 수행합니다.

두 가지 강력한 모드: 로컬 vs 클라우드

PokeClaw는 사용자의 환경에 맞춰 두 가지 두뇌를 선택할 수 있습니다.

  • 로컬 LLM (Gemma 4): 폰에서 직접 실행되어 무료이며, 개인정보가 기기 밖으로 나가지 않습니다.
  • 클라우드 LLM (GPT-4o 등): 더 똑똑하고 정확한 판단이 필요한 경우 API를 연결하여 사용합니다.

지금 바로 가능한 놀라운 기능들

  • WhatsApp 자동 모니터링 및 답장: 특정 연락처의 메시지를 감시하고 Gemma 4가 문맥을 파악해 오프라인으로 자동 답장을 보냅니다.
  • 자율적인 앱 실행: "유튜브 열어서 고양이 영상 검색해줘"라고 말하면 AI가 직접 검색창을 찾고 입력합니다.
  • 화면 요소 직접 읽기: 스크린샷이나 루트 권한이 아닌, 안드로이드 접근성 서비스를 이용해 실제 UI 요소를 사람처럼 인식하고 조작합니다.
Update v0.4.0

사용자 편의를 위한 끊임없는 업데이트

최신 v0.4.0 업데이트에서는 사용자의 피드백을 반영해 더 매끄러운 경험을 제공합니다.

  • 작업 후 자동 복귀: 메시지 전송 등의 업무가 끝나면 자동으로 다시 PokeClaw 앱으로 돌아옵니다.
  • GPU/CPU 자동 폴백: 기기 사양에 맞춰 최적의 연산 장치를 알아서 선택해 실행됩니다.
  • 실시간 비용 카운터: 클라우드 모드 사용 시 소모되는 토큰과 비용을 실시간으로 시각화하여 보여줍니다.

오픈 소스로 함께 만드는 미래

PokeClaw는 아직 세련된 소비자용 앱은 아니지만, 무한한 가능성을 가진 오픈 소스 프로토타입입니다. 현재 GitHub에서 소스 코드를 확인하고 직접 체험해 볼 수 있습니다.

📍 GitHub 주소: https://github.com/agents-io/PokeClaw

반응형

⚠️ 광고 차단 프로그램 감지

애드블록, 유니콘 등 광고 차단 확장 프로그램을 해제하거나
화이트리스트에 추가해주세요.