◆ 출원일 : 2018-10-19
◆ 등록일 : 2020-02-17
◆ 등록번호 : 10-2080409
요약 : 본 발명은 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다. 보다 상세하게는 강의 키워드 입력 모듈을 구비함으로써, 키워드 별 가중치를 적용할 수 있고, 검색 모듈로 가중치를 적용하여 검색하기에, 강의 중 자주 사용되는 용어들로 구성된 웹페이지의 텍스트를 기반으로 강의 음성을 텍스트로 변환할 수 있어, 변환 시 단어들이 강의 주제에 최대한 벗어나지 않도록 하고, 음성 인식 정확도를 향상시키며, 수정 모듈을 구비함으로써, 오류 검출 모듈에서 검출된 단어를 이루는 각 음절의 초성, 중성, 및 종성이 관련 단어 검출 모듈에서 검출된 단어와의 일치도에 따라 차등 표식하여, 사용자 정정 모듈로 이를 확인하고, 텍스트를 정정할 수 있어, 사용자의 작업 시간을 단축하는 강의 관련 키워드를 기반으로 하는 강의 음성파일 텍스트 변환 시스템에 관한 것이다.
이를 위해 본 발명은 강의의 음성을 녹음하는 강의 녹음 모듈; 강의 녹음 모듈로 녹음되는 음성을 음성 인식을 수행하여 텍스트로 변환하는 텍스트 변환 모듈; 강의 녹음 모듈로 녹음되는 강의의 특정 주제와 관련된 키워드를 입력하는 강의 키워드 입력 모듈; 웹서버에서 강의 키워드 입력 모듈로 입력된 키워드로 검색하고, 웹페이지 내 키워드가 포함된 횟수가 많은 순서대로 검색 결과를 정렬하는 검색 모듈; 검색 모듈로 검색된 웹페이지 중, 일정 순위까지의 웹페이지에 게시된 텍스트를 추출하여 저장하는 텍스트 취합 모듈; 텍스트 취합 모듈로 취합된 텍스트 중 2회 이상 반복된 단어를 검출하는 관련 단어 검출 모듈; 사전 제공 서비스와 연결하여 단어 각각에 대한 품사 정보 및 발음 정보를 기반으로, 텍스트 변환 모듈로 변환된 텍스트 중 정보가 없는 단어를 검출하는 오류 검출 모듈; 오류 검출 모듈로 검출된 단어와 관련 단어 검출 모듈로 검출된 단어를 비교하여 특정 조건에 부합하면, 관련 단어 검출 모듈에서 검출된 단어로 수정하고, 이를 특정 조건에 따라 달리 표식하는 수정 모듈; 및 수정 모듈로 수정된 부분을 각 다른 표식으로 확인할 수 있고, 텍스트를 정정할 수 있도록 하는 사용자 정정 모듈을 제공한다.