NyangPolice's homepage

Bookmark this to keep an eye on my project updates!

View on GitHub
20 March 2026

PageAgent: 한 줄의 코드로 웹사이트를 AI 네이티브 앱으로 만드는 GUI 에이전트

by NyangPolice

PageAgent란?

Alibaba에서 개발한 PageAgent는 Javascript 기반의 In-Page GUI Agent이다. 웹사이트에 일종의 AI copilot을 추가해서 자연어 명령으로 웹페이지 제어를 가능하게 만든다.

기본 브라우저 자동화 도구와의 차이

Playwright, Selenium같은 브라우저 자동화 도구들은 브라우저 외부에서 다른 서버나 python 스크립트를 통해 브라우저를 제어한다. 반면 PageAgent는 웹페이지 내부에 삽입되므로 순수 javascript만을 이용해 동작한다.

사용 예시

가장 간단한 사용방법은 HTML 안에 <script src="<URL-to-page-agent>" crossorigin="true"></script>를 추가하는 것이다. 그러면 웹페이지에 PageAgent가 로드되고, window.pageAgent 객체를 통해 제어할 수 있다. URL에 대해서는 여기 참조.

PageAgent를 삽입했다면 다음과 같이 뜰 것이다.

PageAgent Demo
PageAgent Demo

예시 웹사이트는 해외 회원가입 사이트에서 국적을 선택하는 상황을 모사한 것이다. 대한민국을 찾아줘같은 자연어 명령어를 내리면 대한민국을 잘 선택하는 것을 볼 수 있다. 뿐만 아니라 Daehanminkook같은 요상한 이름으로 되어있어도 잘 찾아냈었다.

재생이 안 되면 여기서 영상 파일 직접 열기

동영상에서는 북마크를 이용해 PageAgent를 삽입한 경우이다. 북마크 방식은 여기서 Try on Other Sites에서 하라는대로 하면 된다.

특징

비판

결론

정식 출시가 올해 1월 22일인 아주 따끈따끈한 프로젝트이니만큼 발전 가능성이 크고 글을 쓰고 있는 시점 직전에 베타버전 MCP도 나오고 있을 만큼 개발이 활발하게 이루어지고 있다. 아마 “와 신기하다”의 일발성 감탄이 아니라 아주 유용한 개발 tool이 될 것으로 기대된다.

tags: page-agent - alibaba - gui-agent - ai-copilot - 웹자동화

Tools 카테고리의 글 목록

Tools 카테고리 페이지로 이동 →