[Python] 오프라인 AI 자막 생성기 'K-Sub' - 인터넷 없이 로컬에서 Whisper 음성인식 + 번역 + LLM 후처리
·
개발/AI · 머신러닝
CORE FEATURESAI 5개 모델 100% 오프라인 완전한 프라이버시DOWNLOADK-Sub 다운로드 Windows Mac SUMMARYK-Sub (Kwon-Subtitle)인터넷 연결 없이 100% 로컬에서 동작하는 AI 자막 생성기입니다.Whisper 음성 인식 → KE-T5/NLLB 번역 → Qwen LLM 후처리까지 모든 AI가 내 컴퓨터에서 실행되어, 영상 데이터가 외부로 전송되지 않습니다.주요 기술적 도전: 오프라인 AI 파이프라인 구축, NLLB→KE-T5 2단계 번역, 고유명사 보호 시스템TABLE OF CONTENTS목차왜 오프라인인가? 아키텍처 주요 기능 기술적 도전과 해결 사용 모델WHY OFFLINE왜 오프라인 AI인가?클라우드 서비스의 문제점프라이버시 우려 — 영상을 외부 ..
파이썬과 친해지기 - 3일차 (Malloc, Stack)
·
아카이브/일기
우선 malloc에 대해서 검색해봤다. C 동적 메모리 할당은 동적 메모리 할당을 위한 수동 메모리 관리를 수행하는 것을 말하며 C에 담긴 malloc, realloc, calloc 그리고 free 등의 함수를 말한다. 메모리 동적 할당을 위한 포인터 변수를 선언하여 동적 할당을 하는 순간 일반 변수를 저장하는 stack이 아닌 heap에 저장되기 때문에 free로 동적 할당을 해제하지 않는 이상 메모리가 반납되지 않으며, 따라서 함수가 끝나더라도 메모리의 값은 유지된다. 그래서 C언어 교재나 강의에서 문자열, 구조체 주소를 반납하는 함수를 다룰 때 malloc 사용을 반드시 하거나, static을 사용하라고 한다. 뭔가 어려운 글자의 압박때문에 순식간에 피로감을..
파이썬과 친해지기 - 2일차 (Garbage Collection, Reference Counting)
·
아카이브/일기
오늘은 파이썬의 가비지 컬렉터와 레퍼런스 카운팅에 대해 알아보려고 한다. GC(Garbage Collection) GC는 Python 내부적으로 메모리를 자동으로 관리해주는 과정 및 도구이다. 다만, 완벽하게 메모리를 최적화 시키지는 못한다. 그렇기 때문에 개발자가 직접 메모리를 관리할 줄 알아야 한다. RC(Reference Counting) RC는 메모리를 관리하기 위한 전략이다. Python의 모든 Object에 Count를 주고, 각 객체가 참조될 때 증가하고 참조가 삭제될 때 감소하는 방식으로 작동한다. 이때, Count가 0이 되면 메모리 할당이 삭제된다. 먼저 RC에 대해 살펴보고 GC를 알아보자. import sys # RC(Reference Counting)은 아래와 같이 서로를 참조하는..