반응형

내 폰을 스스로 제어하는 자율주행 AI 에이전트, PokeClaw의 등장
최근 Gemma 4가 출시된 지 불과 며칠 만에, 스마트폰을 실제로 제어할 수 있는 놀라운 앱이 탄생했습니다. 바로 PokeClaw(PocketClaw)입니다. 개발자가 단 이틀간 밤샘 작업을 하며 만든 이 앱은 Gemma 4를 기반으로 Android 폰을 자율적으로 제어할 수 있는 세계 최초의 시도 중 하나입니다.
가장 큰 특징은 전체 파이프라인이 기기 내부에서 작동하는 폐쇄 루프(Closed-loop) 방식이라는 점입니다. 와이파이가 없어도, 비싼 API 요금을 내지 않아도 AI가 여러분의 폰을 떠나지 않고 작업을 수행합니다.
두 가지 강력한 모드: 로컬 vs 클라우드
PokeClaw는 사용자의 환경에 맞춰 두 가지 두뇌를 선택할 수 있습니다.
- 로컬 LLM (Gemma 4): 폰에서 직접 실행되어 무료이며, 개인정보가 기기 밖으로 나가지 않습니다.
- 클라우드 LLM (GPT-4o 등): 더 똑똑하고 정확한 판단이 필요한 경우 API를 연결하여 사용합니다.
지금 바로 가능한 놀라운 기능들
- WhatsApp 자동 모니터링 및 답장: 특정 연락처의 메시지를 감시하고 Gemma 4가 문맥을 파악해 오프라인으로 자동 답장을 보냅니다.
- 자율적인 앱 실행: "유튜브 열어서 고양이 영상 검색해줘"라고 말하면 AI가 직접 검색창을 찾고 입력합니다.
- 화면 요소 직접 읽기: 스크린샷이나 루트 권한이 아닌, 안드로이드 접근성 서비스를 이용해 실제 UI 요소를 사람처럼 인식하고 조작합니다.
Update v0.4.0
사용자 편의를 위한 끊임없는 업데이트
최신 v0.4.0 업데이트에서는 사용자의 피드백을 반영해 더 매끄러운 경험을 제공합니다.
- 작업 후 자동 복귀: 메시지 전송 등의 업무가 끝나면 자동으로 다시 PokeClaw 앱으로 돌아옵니다.
- GPU/CPU 자동 폴백: 기기 사양에 맞춰 최적의 연산 장치를 알아서 선택해 실행됩니다.
- 실시간 비용 카운터: 클라우드 모드 사용 시 소모되는 토큰과 비용을 실시간으로 시각화하여 보여줍니다.
오픈 소스로 함께 만드는 미래
PokeClaw는 아직 세련된 소비자용 앱은 아니지만, 무한한 가능성을 가진 오픈 소스 프로토타입입니다. 현재 GitHub에서 소스 코드를 확인하고 직접 체험해 볼 수 있습니다.
📍 GitHub 주소: https://github.com/agents-io/PokeClaw
반응형
'콩's AI' 카테고리의 다른 글
| Hermes Agent, 차세대 AI 에이전트 기술 분석 (0) | 2026.04.09 |
|---|---|
| 제미나이(Gemini) 신규 기능 노트북(Notebooks) 가이드 (0) | 2026.04.09 |
| 구글 Gemma 4 (젬마4) 모바일 설치 및 사용 방법 가이드 (0) | 2026.04.07 |
| 아마존 Kiro(키로) MCP 세팅 가이드 (0) | 2026.04.06 |
| 아마존 Kiro(키로)에서 ChatGPT 연동 가이드 (0) | 2026.04.06 |