https://github.com/xororz/local-dream
local dream 앱의 백그라운드에서 실행되는 API 서버에 대한 문서입니다.
서버의 가동 상태를 확인합니다.
- URL:
/health
https://github.com/xororz/local-dream
local dream 앱의 백그라운드에서 실행되는 API 서버에 대한 문서입니다.
서버의 가동 상태를 확인합니다.
/health| import srt | |
| from datetime import timedelta | |
| from dataclasses import dataclass | |
| from typing import List, Tuple | |
| # ===== 설정값 ===== | |
| MAX_CHARS_PER_LINE = 20 # 한 줄에 들어갈 최대 글자 수 (대충 감으로 잡는 값) | |
| MAX_LINES_PER_SENTENCE = 3 | |
| LEAD_TIME = 0.5 # 자막을 미리 땡겨서 보여줄 시간(초) | |
| MIN_EFFECTIVE_DURATION = 0.3 # 너무 짧은 자막 방지용 최소 길이(초) |
| import json | |
| import datetime | |
| import logging | |
| import requests # pip install requests | |
| from typing import Literal | |
| from websocket import WebSocket # pip install websocket-client | |
| from http.cookiejar import MozillaCookieJar | |
| from dataclasses import dataclass | |
| # ------------------------------------- |
| { | |
| "很遗憾您这没有能用的显卡来支持您训练": "죄송하지만, 훈련에 필요한 호환 가능한 GPU가 제공되지 않습니다.", | |
| "是": "네", | |
| "step1:正在处理数据": "1단계: 데이터 처리중", | |
| "step2a:无需提取音高": "2단계a: 음높이 추출 생략", | |
| "step2b:正在提取特征": "2b단계: 특징 추출 중입니다.", | |
| "step3a:正在训练模型": "단계3a: 모델 훈련이 시작됨", | |
| "训练结束, 您可查看控制台训练日志或实验文件夹下的train.log": "학습이 완료되었습니다. 콘솔에서 학습 로그를 확인하거나 실험 폴더에서 'train.log' 파일을 확인할 수 있습니다.", | |
| "全流程结束!": "모든 과정이 완료되었습니다!", | |
| "本软件以MIT协议开源, 作者不对软件具备任何控制力, 使用软件者、传播软件导出的声音者自负全责. <br>如不认可该条款, 则不能使用或引用软件包内任何代码和文件. 详见根目录<b>使用需遵守的协议-LICENSE.txt</b>.": "이 소프트웨어는 MIT 라이선스로 오픈 소스로 공개되었습니다. 저자는 이 소프트웨어를 제어할 수 없습니다. 소프트웨어를 사용하고 소프트웨어로 내보낸 소리를 배포하는 사용자는 전적으로 책임을 집니다. <br>이 조항에 동의하지 않는 경우 소프트웨어 패키지 내의 모든 코드와 파일을 사용하거나 참조할 수 없습니다. 자세한 내용은 루트 디렉토리의 <b>사용 계약-LICENSE.txt</b>를 참조하세요.", |
| import speech_recognition as sr | |
| import argparse | |
| import os | |
| from tqdm import tqdm | |
| args = argparse.ArgumentParser() | |
| args.add_argument('--audio-input-dir', '-i', type=str, dest='audio_input_dir', required=True) | |
| args.add_argument('--txt-output-path', '-o', type=str, dest='txt_output_dir', required=False, default='') | |
| args.add_argument('--lang', '-l', type=str, dest='lang', required=False, default='ko-KR') |
| import argparse | |
| import os | |
| import glob | |
| import librosa | |
| import numpy as np | |
| import soundfile as sf | |
| import torch | |
| from tqdm import tqdm |