Codex가 브라우저를 직접 조작할 때 먼저 정해야 할 것들 - 인프런

AI에게 “댓글창 열어보고 분위기만 알려주세요”라고 말하는 장면은 이제 꽤 현실적입니다. Codex가 Safari를 열고, 페이지를 스크롤하고, 댓글 반응을 확인한 뒤 “무작정 싫어한다기보다 검증하려는 댓글이 강하게 붙은 상태”라고 요약할 수 있습니다.

이 장면이 중요한 이유는 단순히 Codex가 더 똑똑해졌기 때문이 아닙니다. AI에게 맡기는 일이 코드 작성이나 문서 요약에서 실제 컴퓨터 조작으로 넘어가기 때문입니다.

브라우저를 여는 순간, AI는 사용자의 로그인 세션과 권한이 붙어 있는 화면 위에서 움직입니다. 그래서 Computer Use를 업무에 넣기 전에는 “무엇을 시킬까”보다 “어디까지 허용할까”를 먼저 정해야 합니다.

AI가 하는 일이 코드 밖으로 나왔습니다

기존 AI 코딩 도구의 작업 범위는 비교적 명확했습니다.

파일 읽기
코드 수정
테스트 실행
에러 로그 분석
문서 요약

물론 이 작업들도 위험할 수 있습니다. 하지만 대부분은 파일 시스템과 개발 환경 안에서 통제할 수 있었습니다. Git diff를 보고 되돌릴 수 있고, 테스트로 확인할 수 있고, 커밋 전에 멈출 수 있습니다. Computer Use가 들어오면 범위가 달라집니다.

AI가 브라우저를 열고, 페이지를 클릭하고, 스크롤하고, 입력창을 찾고, 화면에 보이는 정보를 바탕으로 다음 행동을 선택합니다. 댓글 확인, 상품 탐색, 마케팅 세팅, 관리자 페이지 점검 같은 일들이 자동화 후보가 됩니다. 여기서부터는 개발 생산성 이야기가 아니라 권한 위임 이야기에 가까워집니다.

편한 작업과 위험한 작업은 같은 화면에 있습니다

댓글 반응을 대신 확인하게 하는 건 비교적 안전해 보입니다. 읽기 중심 작업이기 때문입니다. 상품 정보를 비교하거나 페이지 내용을 수집하는 것도 비슷합니다. 하지만 같은 브라우저 안에는 더 위험한 작업도 같이 있습니다.

결제하기
광고 예산 변경하기
계정 설정 바꾸기
게시물 공개 전환하기
데이터 삭제하기
고객 정보 다운로드하기

AI에게 “이 페이지 확인해줘”라고만 말하면, AI는 어떤 버튼이 단순 조회이고 어떤 버튼이 상태를 바꾸는지 작업 목적 안에서 추측해야 합니다. 사람은 애매한 버튼 앞에서 잠깐 멈춥니다. AI는 목표가 명확해 보이면 빠르게 움직일 수 있습니다. 그래서 Computer Use는 편한 만큼 사고 반경도 넓습니다.

좋은 지시는 명령이 아니라 작업 경계입니다

“댓글창 열어봐”는 요청은 간단하지만 실무 지시로는 부족합니다.

더 안전한 지시는 이렇게 생겨야 합니다. ```text 목표:

네이버 특정 페이지의 댓글 반응을 읽고 주요 우려를 요약한다.

허용:

페이지 열기
댓글 영역 스크롤
댓글 내용 읽기
근거가 되는 댓글 유형 요약

금지:

로그인/계정 설정 변경
댓글 작성 또는 답글 작성
결제, 삭제, 제출, 공개 전환 버튼 클릭
외부 링크 이동

보고:

긍정/부정/검증성 반응을 나누어 요약
판단 근거가 된 표현 유형을 함께 기록
실행 중 애매한 버튼이 나오면 멈추고 확인 요청

``` 핵심은 AI가 무엇을 할지보다 무엇을 하지 말아야 하는지까지 같이 주는 것입니다. 화면 조작 AI에게는 “목표”만큼 “금지 행동”이 중요합니다.

Computer Use 전 체크리스트

업무에 넣기 전에 아래 질문을 먼저 통과시키는 편이 좋습니다.

1. 이 작업은 읽기 전용인가요?

댓글 확인, 가격 비교, 페이지 상태 점검처럼 읽기만 필요한 작업인지 확인합니다. 읽기 전용이면 상대적으로 안전합니다. 반대로 입력, 제출, 삭제, 공개, 결제, 예산 변경이 포함되면 바로 자동 실행시키면 안 됩니다.

2. AI가 클릭해도 되는 버튼이 정해져 있나요?

브라우저 화면에는 버튼이 많습니다. AI에게는 “눌러도 되는 버튼”과 “누르면 안 되는 버튼”을 명시해야 합니다. 예를 들어 “댓글 더보기는 허용, 답글 작성은 금지”처럼 구체적으로 나누는 편이 안전합니다.

3. 실행 전 승인 게이트가 있나요?

상태를 바꾸는 행동은 실행 전 멈추게 해야 합니다. ```text 삭제, 결제, 제출, 공개 전환, 계정 변경은 실행하지 말고 어떤 버튼을 누르려는지 먼저 보고하세요. ``` 이런 조건이 없으면 AI는 목표 달성을 위해 버튼을 누르는 쪽으로 움직일 수 있습니다.

4. 결과를 검증할 로그가 남나요?

AI의 요약은 편하지만 그대로 믿으면 안 됩니다. 어떤 페이지를 봤는지, 어떤 기준으로 판단했는지, 어떤 행동을 했는지 기록이 남아야 합니다. 특히 댓글 여론처럼 해석이 들어가는 작업은 “부정적이다” 같은 결론보다 왜 그렇게 봤는지가 중요합니다.

팀에서 적용할 때의 기본 운영 원칙

팀에서 Computer Use를 쓰려면 개인 생산성 팁 수준으로 다루면 부족합니다. 최소한 다음 운영 원칙이 필요합니다.

읽기 작업과 쓰기 작업을 분리합니다.
쓰기 작업은 실행 전 사람 승인 단계를 둡니다.
결제, 삭제, 공개 전환, 계정 변경은 기본 금지로 둡니다.
AI가 본 화면과 판단 근거를 기록하게 합니다.
반복 작업은 템플릿화해서 매번 같은 금지 조건을 붙입니다.

AI가 화면을 직접 만지는 시대에는 “얼마나 잘 시켰는가”보다 “어디서 멈추게 만들었는가”가 더 중요해집니다.

마무리 대신 남겨야 할 기준

Codex가 브라우저를 직접 조작한다는 건 흥미로운 기능입니다. 하지만 실무에서는 흥미보다 경계가 먼저입니다. AI가 대신 클릭해주면 사람의 손은 편해집니다. 대신 사람의 책임은 사라지지 않습니다. 오히려 권한 범위, 금지 조건, 승인 게이트, 결과 검증을 더 명확히 해야 합니다. 다음에 AI에게 브라우저를 맡기기 전에 이 한 줄을 먼저 써두는 게 좋습니다.

```text 읽는 것은 허용하지만, 상태를 바꾸는 행동은 실행 전 반드시 멈추고 확인을 요청한다. ``` 이 문장이 없다면 아직 자동화할 준비가 끝난 것이 아닙니다.