[사이드/수익화 프로젝트] AI OCR 크롬 확장 프로그램 - 풀스택 개발자 1명 모집

작성일 25.12.10 07:58 조회수 230

💡 왜 이 프로젝트인가?

chatgpt, claude, gemini 쓸 때 웹페이지 내용 복사해서 붙여넣어 본 적 있으시죠?

Ctrl+A → Ctrl+C+V 로 넣으면..........

- 레이아웃 다 깨지고

- 테이블은 한 줄로 붙어버리고

- 이미지 누락 뿐만 아니라 안에 있는 텍스트 또한 아예 누락

- 결국 AI가 맥락을 제대로 못 읽음

"이 페이지 분석해줘" 했는데 엉뚱한 답변 받아본 경험, 다들 있을 겁니다.

이 확장 프로그램은

✓ 페이지를 "보이는 그대로" 캡처해서

✓ VLM 혹은 LayoutParser로 레이아웃 인식 (API 사용 안하고, 자체 모델로 운용할 생각입니다)

✓ 테이블, 차트, 이미지 텍스트까지 구조 보존

✓ AI에게 제대로 된 컨텍스트 전달

→ 복사 붙여넣기가 아닌, 진짜 "페이지 이해"를 AI에게 시키는 도구

📌 프로젝트 소개

웹페이지/PDF/스크린샷을 AI 모델로 OCR해서

레이아웃 보존한 텍스트로 추출하는 크롬 확장 프로그램

📌 현재 상황

📌 담당 업무

- 크롬 확장 프로그램 개발 (manifest v3)

- 페이지 캡처 / PDF 업로드 기능

- Supabase 연동 (Google 로그인, 사용량 DB)

- 백엔드 API 연동

📌 필요 스킬

- JavaScript/TypeScript

- Chrome Extension API

- Supabase 경험

- (우대) html2canvas, PDF.js 경험

📌 진행 방식

- 주 1회 온라인 미팅

- 예상 기간: 4-6주

- 비대면 협업 (카톡) or 슬랙

📌 지원 방법

간단한 자기소개 + 포트폴리오/깃허브 링크
https://open.kakao.com/o/gMchtA5h