본문 바로가기

Job스러운생각

팟플레이어 자동자막 이제 소리만 듣고도 번역(외국어 포함)

 

팟플레이어가 24년 12월 11일 whisper엔진을 탑재했습니다.

whisper가 뭐냐

Open AI에서 개발한 음성 인식 엔진인데

이걸 로컬에 설치해서 자막 SMI파일을 만들어주죠

 

https://github.com/openai/whisper

 

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

Robust Speech Recognition via Large-Scale Weak Supervision - openai/whisper

github.com

 

 

 

외국어로 된 영상을 예를 들면

자막 파일로 만들어서 smi로 만들어서 영상에 넣는 것도 가능하지만

whisper AI로 자막을 만들고 이걸 번역하고 smi로 만드는 거보다 중간에 AI를 한번 더 거쳐서 깔끔하게 만들려고

smi를 내려서 제미나이나 뤼튼, gpt에 넣고 좀더 자연스럽게 자막으로 만들어 사용하는 식으로 널리 알려져 있죠

 

비슷한 방식을 capcut같은 툴에서도 제공했지만

자사 엔진도 아니면서 유료로 대부분 전환됐습니다.

 

이게 팟플레이어로 들어간 것이죠

https://tv.kakao.com/guide/potplayer

 

카카오TV

톡에서 즐기는 동영상 콘텐츠! 지금 카톡에서 카카오TV 채널을 추가해보세요.

tv.kakao.com

 

 

팟플레이어를 설치하고

자막 -> 소리로 자막생성 -> 소리로 자막 생성으로 들어가면 되는데

처음엔 작동안되서 이유를 보니 permission 오류가 뜨니

팟플레이어를 설치하고 -> 팟플레이어 아이콘에서 우클릭 -> 관리자권한으로 실행 -> 아무 영상이나 소리로 자막 생성을 한번 해주고

모델을 다운받으면 그 다음부터는 관리자권한이 없어도 됩니다.

 

오류가 나는지를 확인하기 위해서 "재생 시작 시 자동 생성" 혹은 "변환 시작" 이건 작동이 잘 될때 사용하고

처음엔 소리로 자막 생성 .. <- 이 메뉴를 선택해서 어떤 오류가 나는지 체크해보세요

 

 

 

 

자막은 원래 생성하던 모델과 동일하기 때문에 

발음만 정확하다면 웬만하면 잘 나옵니다

 

 

 

일본어.. 영어도 되고 심지어 자막으로 내려서 팟플레이어는 번역까지 되니까....

활용할 곳이 무궁무진 하네요

 

반응형