AsrTools简介
AsrTools
是一款智能语音识别转文本工具,具有操作简便、效率高、兼容性强等特点。如果你经常需要处理视频字幕、会议记录、采访稿件等语音或者视频转文字或者字幕的工作,却又苦恼于各种复杂的环境配置和昂贵的专业软件,那么这款开源工具绝对能让你眼前一亮!
功能特点
无需复杂配置
:无需 GPU 和繁琐的本地配置,降低了使用门槛,即使是没有专业技术背景的用户也能轻松上手。
多线程并发处理
:支持批量处理音频文件,利用多线程技术,可同时处理多个任务,大幅提升语音转文字的效率,适合需要处理大量音频数据的场景。
多种输出格式
:支持生成 SRT、TXT、ASS 等多种格式的字幕文件,满足不同用户对于字幕文件的需求,例如视频创作者可以根据后期制作的要求选择合适的格式。
支持视频处理
:可直接处理视频文件,自动将其转换为音频文件并进行字幕转换,无需用户手动先将视频转换为音频,简化了操作流程。
调用大厂接口
:通过逆向技术调用剪映、快手、必剪等大厂的 ASR 服务,借助大厂成熟的语音识别技术,提供稳定快速的文字转换体验。
界面友好
:基于 PyQt5 和 qfluentwidgets 构建图形用户界面,界面美观,操作直观便捷,用户可以轻松找到所需的功能按钮。
快速上手
启动应用
:运行下载的可执行文件或通过命令行启动 GUI 界面。
选择 ASR 引擎
:在下拉菜单中选择你需要使用的 ASR 引擎。
添加文件
:点击"选择文件"按钮或将文件/文件夹拖拽到指定区域。
开始处理
:点击"开始处理"按钮,程序将自动开始转换,并在完成后在原音频目录生成 .srt 或 .txt 字幕文件。(默认保持 3 个线程运行)
多格式支持
:支持生成 .srt 和 .txt 、ass字幕文件,满足不同需求。