💡 왜 이 프로젝트인가?
chatgpt, claude, gemini 쓸 때 웹페이지 내용 복사해서 붙여넣어 본 적 있으시죠?
Ctrl+A → Ctrl+C+V 로 넣으면..........
- 레이아웃 다 깨지고
- 테이블은 한 줄로 붙어버리고
- 이미지 누락 뿐만 아니라 안에 있는 텍스트 또한 아예 누락
- 결국 AI가 맥락을 제대로 못 읽음
"이 페이지 분석해줘" 했는데 엉뚱한 답변 받아본 경험, 다들 있을 겁니다.
이 확장 프로그램은
✓ 페이지를 "보이는 그대로" 캡처해서
✓ VLM 혹은 LayoutParser로 레이아웃 인식 (API 사용 안하고, 자체 모델로 운용할 생각입니다)
✓ 테이블, 차트, 이미지 텍스트까지 구조 보존
✓ AI에게 제대로 된 컨텍스트 전달
→ 복사 붙여넣기가 아닌, 진짜 "페이지 이해"를 AI에게 시키는 도구
📌 프로젝트 소개
웹페이지/PDF/스크린샷을 AI 모델로 OCR해서
레이아웃 보존한 텍스트로 추출하는 크롬 확장 프로그램
📌 현재 상황
대략적인 기획 완료
백엔드/ML 담당자 있음 (본인)
프론트(크롬 확장) 개발자 모집 중
참고로 아래 내용에 대해선 전 풀스택 개발자가 아니라 잘 모르니, 경험 기반에서 알맞은 프레임워크로 진행하시면 될 듯합니다
📌 담당 업무
- 크롬 확장 프로그램 개발 (manifest v3)
- 페이지 캡처 / PDF 업로드 기능
- Supabase 연동 (Google 로그인, 사용량 DB)
- 백엔드 API 연동
📌 필요 스킬
- JavaScript/TypeScript
- Chrome Extension API
- Supabase 경험
- (우대) html2canvas, PDF.js 경험
📌 진행 방식
- 주 1회 온라인 미팅
- 예상 기간: 4-6주
- 비대면 협업 (카톡) or 슬랙
📌 지원 방법
간단한 자기소개 + 포트폴리오/깃허브 링크
https://open.kakao.com/o/gMchtA5h