목록2025/05/24 (1)
코딩 다이어리

들어가기 전현재 사전 학습된 오픈 모델을 활용하고 있으나 성능에 한계가 있는 것을 확인이에 따라 한국어, 서비스에 맞도록 파인튜닝을 진행할 예정활용 가능한 음성 관련 데이터들을 수집하고 확인해서 학습 데이터셋을 구축할 예정현재까지 수집한 데이터셋을 리스트업하고 원본 데이터의 정보들을 확인각 데이터별 특성과 AI 모델에 맞도록 전처리 후 활용할 예정전처리 및 데이터셋 구축 관련 코드와 학습 결과 등은 추후 Github를 통해 공유할 예정모든 데이터는 상업적 목적으로 활용하지 않으며, 원본 데이터 정보는 공개하나 구축한 데이터셋을 직접 공유할 계획은 없음데이터셋 종류1. 한국어 음성데이터 기본 정보데이터셋 명칭: KsponSpeech출처/배포처: AIHUBURL: https://aihub.or.kr/aihu..
AI 음성 인식
2025. 5. 24. 20:03