[사이드/수익화 프로젝트] AI OCR 크롬 확장 프로그램 - 풀스택 개발자 1명 모집
💡 왜 이 프로젝트인가?chatgpt, claude, gemini 쓸 때 웹페이지 내용 복사해서 붙여넣어 본 적 있으시죠?Ctrl+A → Ctrl+C+V 로 넣으면..........- 레이아웃 다 깨지고- 테이블은 한 줄로 붙어버리고- 이미지 누락 뿐만 아니라 안에 있는 텍스트 또한 아예 누락- 결국 AI가 맥락을 제대로 못 읽음"이 페이지 분석해줘" 했는데 엉뚱한 답변 받아본 경험, 다들 있을 겁니다.이 확장 프로그램은✓ 페이지를 "보이는 그대로" 캡처해서✓ VLM 혹은 LayoutParser로 레이아웃 인식 (API 사용 안하고, 자체 모델로 운용할 생각입니다)✓ 테이블, 차트, 이미지 텍스트까지 구조 보존✓ AI에게 제대로 된 컨텍스트 전달→ 복사 붙여넣기가 아닌, 진짜 "페이지 이해"를 AI에게 시키는 도구📌 프로젝트 소개웹페이지/PDF/스크린샷을 AI 모델로 OCR해서레이아웃 보존한 텍스트로 추출하는 크롬 확장 프로그램📌 현재 상황대략적인 기획 완료백엔드/ML 담당자 있음 (본인)프론트(크롬 확장) 개발자 모집 중참고로 아래 내용에 대해선 전 풀스택 개발자가 아니라 잘 모르니, 경험 기반에서 알맞은 프레임워크로 진행하시면 될 듯합니다📌 담당 업무- 크롬 확장 프로그램 개발 (manifest v3)- 페이지 캡처 / PDF 업로드 기능- Supabase 연동 (Google 로그인, 사용량 DB)- 백엔드 API 연동📌 필요 스킬- JavaScript/TypeScript- Chrome Extension API- Supabase 경험- (우대) html2canvas, PDF.js 경험📌 진행 방식- 주 1회 온라인 미팅- 예상 기간: 4-6주- 비대면 협업 (카톡) or 슬랙📌 지원 방법간단한 자기소개 + 포트폴리오/깃허브 링크https://open.kakao.com/o/gMchtA5h