본문 바로가기
Tip

영어공부는 이제 진짜 필요없다. (교육의 중앙화에 대한 생각)

by leopard4 2025. 4. 10.

영상을 LLM으로 번역한 SRT 파일 삽입 [유튜브나 유데미에서 활용]

확장프로그램

https://chromewebstore.google.com/detail/substital-add-subtitles-t/kkkbiiikppgjdiebcabomlbidfodipjg

 

Substital: Add subtitles to videos and movies - Chrome 웹 스토어

Add captions to any video or movie on Netflix, Youtube or other platforms.

chromewebstore.google.com

그런데 이건 사전에 https://downsub.com/ko/site/youtube/ 

이런 사이트에서 자막추출을 먼저해서 번역을 수동으로 진행해야 하므로 귀찮긴하다.

때문에 그냥 맨아래 이중번역 확장을  쓰면 가장편하다.

(근데 전체 문맥을 이해하는 기능은 PRO (유료)인듯)

 

Gemini LLM API key 를 이용한 웹 실시간 번역 확장프로그램

https://chromewebstore.google.com/detail/ai-%EB%B2%88%EC%97%AD-gemini/khbjbchkedopfbhiafhaacomekdgnhbh

 

AI 번역 - Gemini - Chrome 웹 스토어

AI로 실시간 페이지를 번역하는 확장 프로그램입니다.

chromewebstore.google.com

 

여러 LLM API 키를 이용한 이중번역 웹 확장프로그램

https://immersivetranslate.com/

 

이중 언어 웹 번역 확장_PDF 문서 번역 도구 | Immersive Translate

몰입형 번역은 무료 웹사이트 번역 확장 프로그램으로, 온라인 이중 언어 웹 페이지 번역을 제공합니다. 웹사이트를 영어 또는 다른 언어로 번역하거나, 다양한 형식의 문서 번역, PDF 번역, EPUB

immersivetranslate.com

 

 

 

그리고 실시간번역 워크플로우

 

  • 유튜브 영상 URL 입력
  • youtube-dl로 다운로드
  • Whisper로 자막 추출
  • LLM으로 번역 (LLM도 ollama같은 로컬 모델을 쓰는것도 고려하지만 허깅페이스에 en -> ko 전용 번역 모델도 있다고하는듯)
  • SRT 생성
  • ffmpeg로 자막 영상 완성

(아무튼 이걸 스크립트화 하기만하면된다.)

(근데 이런 프로그램이 이미존재함 https://www.trancy.org/ko?via=ys )

 

 

근데 내생각엔 이렇게 까진 필요없고 아래와 같은 방법이 나은것같다.

 

번역 자막만 따로 띄워서 영상과 함께 보기 (원본 영상 그대로 보기)

VLC 같은 플레이어에서:

  1. 유튜브 영상 URL 복사
  2. VLC → 미디어 > 네트워크 열기 → URL 붙여넣기
  3. translated_subtitles.srt 파일도 같이 열면 영상+자막 재생 가능

 

 

현상황에서도 거의 완벽한 수준의 번역이 가능하다. 

앞으로 품질과 속도도 상승할 예정이기도 하고

이제 언어의 장벽을 통한 학습의 제한이 없어질예정이다.

때문에 교육의 중앙화가 이루어지지않을까 싶다.

 

이것은 내 바램이기도 하다.

 

국가차원의 고품질 학습영상을 제작하는것 

 

다른 국가들은 이미 그런 고품질의 온라인 강의같은것이 많은데

 

유독 한국만 저퀼리티에 제한적 정보만 존재했다. (물론내생각)

 

그런데 이제 언어의 장벽이 사라짐으로써 

배우고자 하는 의지만 있다면 

학습의 자유가 생긴것이다..

 

어설픈 번역으로 고생했던 날들에 비하면 

너무나도 감격스럽지 않을 수 없다.

 

 

 

 

추가정보.

SRT 형식은 아래와 같다.

1
00:00:19,440 --> 00:00:22,320
- I just got here, and I think
I'm loosing signal already.

2
00:00:22,320 --> 00:00:25,312
Hello? Can you hear me now?

3
00:00:25,312 --> 00:00:28,461
(wind buffeting)