문선명선생말씀선집 AI 활용 플랫폼 기획안
"말씀의 디지털 전도 — 622권을 살아있는 플랫폼으로"
핵심 원칙: 무비용 운영 구조
모든 AI 기능은 로컬 LLM 또는 무료 오픈소스 기반으로 설계하여 외부 API 호출 비용 Zero를 목표로 한다.
기술 스택 선정
로컬 AI 엔진
| 용도 | 모델 | 비고 |
|---|---|---|
| 텍스트 생성 (상담, 설교, 번역) | Gemma 3 27B / Gemma 4 | Google 무료 오픈소스, 한국어 우수 |
| 경량 보조 | Llama 3.2 3B / Phi-4-mini | 저사양 서버 대응 |
| 임베딩 / 시맨틱 검색 | multilingual-e5-large | HuggingFace 무료 |
| TTS | Kokoro-82M / XTTS-v2 | 무료, 자연스러운 한국어 |
| 번역 보조 | NLLB-200 (Meta) | 한/영/일 무료 번역 |
서버/인프라
- Ollama — 로컬 LLM 서빙 (원클릭 배포)
- LangChain / LlamaIndex — RAG 파이프라인
- ChromaDB / Qdrant — 벡터 DB (말씀 임베딩 저장)
- FastAPI (Python) — API 백엔드
- 기존 PHP/MySQL — 현 사이트와 연동
기능별 상세 기획
1. 🌐 AI 영어·일본어 번역
목적: 해외 교회, 외국인 식구들을 위한 다국어 말씀 제공
방식:
- NLLB-200 (Meta) 로컬 번역 → Gemma로 문체 교정 (2단계 파이프라인)
- 말씀의 특유한 어투·용어(참부모, 섭리, 천일국 등)는 용어 사전(glossary.json) 을 별도 구축하여 번역 시 고정 치환
- 번역 결과는 원문 대조 2단 레이아웃으로 표시
DB 구조 추가:
sayings_translations (id, vol, page, lang, translated_text, translated_at)
구현 우선순위: ★★★★☆ (수요 높음, 기술 난이도 중간)
2. 💬 말씀 상담실 (챗봇형 RAG 상담)
목적: 가정문제·사회문제·신앙문제를 말씀에 근거해 상담
핵심 기술: RAG (Retrieval-Augmented Generation)
사용자 질문 입력
→ multilingual-e5로 질문 임베딩
→ ChromaDB에서 관련 말씀 Top-K 검색
→ 검색된 말씀 + 질문을 Gemma에 전달
→ "말씀 선생님" 페르소나로 답변 생성
→ 인용된 말씀 권·쪽수 함께 표시
상담 카테고리 분류:
- 가정문제 (부부, 자녀, 고부)
- 신앙·섭리 (기도, 훈독, 헌신)
- 사회·직장 (인간관계, 직업윤리)
- 청년·청소년 (진로, 이성교제)
중요 설계 포인트:
- 답변 하단에 "참조 말씀: 제XXX권 X쪽" 필수 출처 표시
- "이 답변은 말씀에 근거한 참고 안내이며, 담당 목회자와 상담하시기 바랍니다" 면책 문구
구현 우선순위: ★★★★★ (핵심 킬러 기능)
3. 📜 설교문 자동생성
목적: 목회자, 전도사, 가정교회 리더를 위한 설교 초안 작성 지원
입력 파라미터:
- 주제 / 키워드 (예: "참사랑", "심정", "효도")
- 절기·행사 (창립절, 참부모님 생신, 하나님의날 등)
- 설교 길이 (5분/10분/20분)
- 청중 (청소년/장년/신입교인)
생성 구조 템플릿:
[서론] 도입 이야기 or 현실 문제 제시 (1~2단락)
[본론 1] 관련 말씀 인용 및 해설
[본론 2] 실생활 적용 사례
[본론 3] 역사적·섭리적 의미
[결론] 결단 촉구 및 기도 안내
말씀 자동 삽입: RAG로 주제에 맞는 말씀 자동 선별·배치
출력 포맷: 화면 표시 + Word/PDF 다운로드 (FPDF/python-docx)
구현 우선순위: ★★★★☆
4. 🎴 말씀카드 생성
목적: SNS, 카카오톡, 인스타그램용 감동 말씀 이미지 자동 생성
방식:
- 말씀 랜덤 추출 or 주제별 검색 후 선택
- 배경 템플릿(계절/분위기별) + 말씀 텍스트 합성
- Pillow (Python) 로 서버사이드 이미지 생성 → 완전 무료
템플릿 카테고리:
- 아침 묵상용 (밝은 자연 배경)
- 가정·부부용 (따뜻한 색감)
- 청년용 (모던·미니멀)
- 절기 특별판
기술 구현:
# 예시 구조
from PIL import Image, ImageDraw, ImageFont
# 배경 이미지 + 말씀 텍스트 + 로고 합성
# 해상도: 1080x1080 (인스타), 1920x1080 (배경화면)
추가 아이디어: 사용자가 배경·폰트·색상 선택 가능한 편집기 (Canvas.js 활용)
구현 우선순위: ★★★★★ (파급력 최대, 기술 난이도 낮음)
5. 🔊 TTS 오디오 접목 (훈독 오디오 생성)
목적: 운전 중, 작업 중 청취 가능한 말씀 오디오 제공
추천 TTS 엔진 (무료/로컬):
| 엔진 | 특징 | 한국어 품질 |
|---|---|---|
| Kokoro-82M | 초경량, 빠름, Apache 2.0 | ★★★★☆ |
| XTTS-v2 (Coqui) | 화자 복제 가능 | ★★★★★ |
| StyleTTS2 | 감정 표현 우수 | ★★★★☆ |
| Edge-TTS (MS) | 온라인이나 무료 | ★★★★★ |
추천 조합:
- 메인: XTTS-v2 (자연스럽고 감성적인 한국어)
- 경량 백업: Edge-TTS (인터넷 연결 시 무료 사용)
기능 설계:
- 권별·페이지별 오디오 스트리밍
- 재생속도 조절 (0.75x ~ 1.5x)
- 오디오 파일 다운로드 (MP3)
- 구간 반복 재생 (훈독에 최적)
구현 우선순위: ★★★☆☆ (서버 리소스 요구 높음)
6. 📖 훈독 프로그램 운영
목적: 개인·가정 훈독 습관 형성 지원 시스템
핵심 기능:
① 맞춤 훈독 플랜
- 122일 완독 플랜 (하루 5권)
- 1년 완독 플랜 (하루 약 1.7권)
- 주제별 선택 훈독 (심정, 참사랑, 가정 등)
② 훈독 트래커
- 회원 로그인 후 읽은 페이지 기록
- 달성률 시각화 (프로그레스바, 달력)
- 연속 훈독 일수 스트릭 표시
③ 오늘의 말씀 (매일 자동 발송)
- DB에서 날짜별 말씀 자동 선정
- 이메일/카카오 알림 연동 (PHPMailer + 카카오 알림톡 API)
④ 가정 훈독방
- 가족 단위 공동 훈독 진행률 공유
- 소감 남기기 (한줄 묵상 기록)
구현 우선순위: ★★★★☆
시스템 아키텍처 전체 구조
[프론트엔드 / 기존 PHP 사이트]
↓ API 호출
[FastAPI 백엔드 서버]
├── RAG 모듈 (LlamaIndex + ChromaDB)
│ └── multilingual-e5 임베딩
├── LLM 모듈 (Ollama → Gemma)
│ ├── 상담 응답 생성
│ ├── 설교문 생성
│ └── 번역 교정
├── TTS 모듈 (XTTS-v2 / Kokoro)
├── 이미지 생성 모듈 (Pillow)
└── 번역 모듈 (NLLB-200)
↓
[기존 MySQL DB] ←→ [ChromaDB (벡터)]
개발 단계별 로드맵
| 단계 | 기간 | 내용 |
|---|---|---|
| Phase 1 | 1~2개월 | 말씀카드 생성 + 오늘의 말씀 (즉시 효과, 낮은 난이도) |
| Phase 2 | 2~3개월 | RAG 파이프라인 구축 + 말씀 상담실 베타 |
| Phase 3 | 3~4개월 | 설교문 자동생성 + TTS 오디오 연동 |
| Phase 4 | 4~6개월 | 번역 시스템 + 훈독 프로그램 + 회원 관리 |
서버 사양 권장
| 구성 | 사양 | 비고 |
|---|---|---|
| 최소 | CPU 16코어 / RAM 32GB / SSD 500GB | Gemma 3 12B 구동 가능 |
| 권장 | GPU RTX 4090 / RAM 64GB | Gemma 3 27B 고속 추론 |
| 최적 | GPU A100 또는 2x RTX 4090 | 다중 사용자 동시 처리 |
대안: GPU 서버 없이 CPU만으로도 Gemma 3 12B는 Ollama에서 구동 가능 (응답 속도는 느리나 품질 양호)
비용 구조 분석
| 항목 | 기존 API 방식 | 로컬 AI 방식 |
|---|---|---|
| LLM 추론 | GPT-4: ~$0.03/1K토큰 | ₩0 (Ollama) |
| 번역 | DeepL API: 유료 | ₩0 (NLLB-200) |
| TTS | Clova Voice: 종량제 | ₩0 (XTTS-v2) |
| 이미지 생성 | DALL·E: 유료 | ₩0 (Pillow 템플릿) |
| 월 운영비 | 수십만~수백만 원 | 서버 전기세만 |
추가 제안: 차별화 포인트
- 말씀 유사 구절 찾기 — 입력 문장과 의미적으로 유사한 말씀을 벡터 검색으로 즉시 표시
- 말씀 퀴즈 — 훈독 후 내용 확인 퀴즈 자동 생성 (Gemma 활용)
- 말씀 타임라인 — 말씀 연도별 시대적 맥락 시각화
- 다국어 병행 표시 — 한/영/일 3개국어 동시 표시 모드

댓글 (1)
말씀카드는 기술 난이도가 낮으면서 파급력이 제일 큽니다. SNS에서 퍼지면 자연스럽게 플랫폼 홍보가 됩니다. 그리고 RAG(검색 증강 생성) 파이프라인은 상담실·설교문 생성·번역 교정 모두의 기반이 되므로, Phase 1과 동시에 조용히 구축해두는 게 맞습니다.
로컬 AI 관련 현실적 조언:
Gemma 4는 현재 구글이 공개한 최신 모델인데, 로컬 구동은 Gemma 3 27B가 현실적으로 가장 검증된 선택입니다. GPU가 없는 서버라면 Gemma 3 12B + Ollama 조합으로 CPU 전용 구동도 가능합니다(느리지만 비용 Zero). TTS는 Edge-TTS가 인터넷만 되면 무료이고 한국어 품질이 우수해서 초기엔 이걸 쓰고, 완전 오프라인화는 나중에 XTTS-v2로 전환하는 2단계 전략을 추천합니다.
핵심 병목 포인트:
말씀 벡터 임베딩 작업(622권 전체를 ChromaDB에 넣는 초기 작업)이 가장 시간이 걸립니다. 한 번만 하면 되지만, 서버 사양에 따라 수 시간~수일이 걸릴 수 있어요. 이 부분 일정에 반드시 반영하셔야 합니다.
댓글 쓰기