2025년 3월 31일, 금융위원회는 ‘금융 특화 한글 말뭉치’를 전격 공개하며 국내 금융권의 AI 활용을 본격적으로 지원한다고 발표했습니다. 이번 조치는 지난해 발표된 ‘금융권 생성형 AI 활용 지원 방안’의 후속 조치로, 챗봇, 번역, 요약 등 다양한 금융 서비스에 특화된 AI 모델 개발을 뒷받침하게 됩니다.
💡 ‘금융 특화 한글 말뭉치’란?
쉽게 말해, AI가 금융 관련 지식을 이해하고 학습할 수 있도록 구성한 대규모 한국어 데이터셋입니다. 기존에는 대부분의 AI가 영어 기반이거나 일반 사용자 중심으로 개발되어 국내 금융업무에 맞추기 어려웠죠. 이 한글 말뭉치는 한국어 기반 금융 용어, 법규, 제도 등 전문적인 내용을 포함하고 있어, 정확도와 신뢰도를 높이는 데 큰 역할을 하게 됩니다.
🧠 세 가지 유형의 AI 학습 말뭉치
1. 학습용 말뭉치
- 금융용어 사전, 정책 자료, 제도 설명 등을 기반으로 구성
- 일반 AI 모델이 금융 전문지식을 습득하는 데 최적화
- 예: 금융연수원의 연수자료, 금융감독원의 용어 정리
2. 검색증강생성(RAG)용 말뭉치
- AI가 최신 법률 정보나 제도 내용을 참조하고 인용할 수 있게 설계
- 법 개정에 따른 정보 오류 방지에 유용
- 예: 금융소비자보호법, 전자금융거래법 조문 포함
3. 평가지원용 말뭉치
- AI 모델이 생성하는 답변의 정확성, 윤리성, 공정성 평가에 사용
- 편향(Bias)과 환각(Hallucination) 문제 점검 가능
- 예: "저소득층은 금융관리 능력이 부족하다" → 편견 감지 테스트
📦 말뭉치 구성 및 제공 방식
사전학습용 | 6,700건 | 일반 금융지식 습득용 |
추가학습용 | 1,100건 | 금융 특화 Fine-tuning용 |
검색증강생성용(RAG) | 3,800건 | 최신 법률정보 반영용 |
평가지원용 | 1,000건 | AI 성능 및 윤리성 평가용 |
총 12,600건, 약 45GB의 데이터가 제공되며, 모든 금융회사는 금융결제원 데이터공유플랫폼(datop.or.kr)에서 신청 후 다운로드 받을 수 있습니다.
🚀 향후 계획과 기대 효과
이번 시범사업은 2025년 6월 말까지 무료 제공되며, 그 이후 금융업권별 특화 말뭉치로 확대될 예정입니다. 이를 통해:
- 개별 금융회사의 AI 개발 비용과 시간 절감
- 국내 금융제도에 최적화된 AI 서비스 개발 촉진
- AI 신뢰성·공정성 강화 기반 마련
금융위원회는 업계의 피드백을 반영해 2025년 하반기에는 더 다양한 데이터 유형과 규모로 확장, 2026년부터는 업권별 맞춤형 말뭉치 제공에 나설 계획입니다.
📝 마무리
AI 시대, 이제 금융도 다르게 움직입니다. ‘금융 특화 한글 말뭉치’는 단순한 데이터셋이 아닌, 금융 AI 혁신의 인프라입니다. 향후 이 말뭉치를 기반으로 얼마나 똑똑한 금융 AI들이 탄생할지, 기대해도 좋을 것 같네요!
티스토리 로그인하고 전체 글 보기 (로그인이 풀렸을 경우 클릭하세요!)
'일상팁' 카테고리의 다른 글
채무자대리인 제도, 더 쉽고 빠르게! 2025년부터 이렇게 달라졌습니다 (1) | 2025.04.08 |
---|---|
은행대리업 신한은행에서 우리은행업무 쌉가능! (0) | 2025.04.08 |
소상공인 맞춤형 채무조정 /폐업자 지원 /햇살론119 /소상공인 금융지원3종세트 (0) | 2025.04.07 |
"미국, 한국 태평염전 소금 수입금지 조치! 강제노동 실태에 대한 충격적인 대응" (0) | 2025.04.07 |
대통령실 어디로 가야 할까? 용산 vs 청와대 vs 세종…차기 대통령의 선택은? (1) | 2025.04.06 |