软件大小:44.60 MB软件语言:简体中文授权方式:免费软件
更新时间:2020-09-25运行环境:Win ALL
推荐下载 软件大小 版本说明 下载地址
字幕大师(OKVoice)是一款高准确率语音识别技术的字幕制作软件,字幕大师(OKVoice)将视频中的声音自动识别为文字,自动将声频文字匹配为时间轴(对齐声音和文字),生成字幕文件,并拥有自动对齐、批量上传、断点续传三个特点,让字幕工作者告别传统的“手拍字幕”,操作起来更便捷,更节省时间。
字幕大师(OKVoice)主要特性
1、1个小时的音视频
duang一下,妥妥搞定!效率提高五倍以上!
2、自动生成时间轴
快速精准高效,字幕大师采用高精准的语音识别技术,自动判断音视频中的声音波形,准确匹配相应的字幕文本,一键生成字幕时间轴
3、字幕文件一键搞定
字幕大师运用了领先的语音识别技术,可以快速精准的将音视频转写为文字,并可自动生成对应的时间轴,适用于电影/电视剧/电视节目/在线课程/视频会议/采访录音等领域
字幕大师(OKVoice)软件功能
1、语音合成
是将文本状态的文字信息转换为可闻其声的语音信息处理技术。
字幕大师涉及语音学、语言学、数字信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术。
随着语音合成技术不断的发展与成熟,文字信息不仅限于眼睛的阅读,而是耳朵对文字的聆听,让生活更加的方便快捷。
2、语音识别
将人类的自然语言转化为计算机可以理解的数据语言,这种转化是达成语音识别的基础。
语音识别的应用范围广泛,如:语言拨号、语音导航、语音智能家居、语音检索、听写录入等。
随着语音识别技术的发展和完善,不同语言语音机器翻译就会出现,人类将迎来无语言沟通障碍的世界。
3、声纹识别
是根据语音波形反映说话人声音和行为特征的语音参数,能自动识别说话人身份的技术。
与语音识别不同的是,声纹识别是采取语音信号中说话人的身份信息,并不考虑语音中的字词意思。
由于每个人的生物特征具有与其他人不同的唯一性,不易伪造和假冒,所以利用声纹识别技术进行身份认证,更加安全可靠。
4、低速率编码
先进的编码技术,最低通讯编码可以在600bps以下。
高质量的语音通讯质量,600bps以下速率的PESQ分可达2.6。
稳定的通讯效率,可在各种极端环境下保证信道传输稳定。
5、智能对话
精准智能的对话理解,支持多种应用场景对话内容理解。
面向垂直领域的语义解析准确率高达95%以上。
自有的数千G规模互联网语料,确保各种词汇的理解。
字幕大师(OKVoice)使用教程
字幕大师(OKVoice)怎么用呢?请看细解:
第一步:下载“字幕大师”
第二步:解压
下载后解压,打开oksrtmaster.exe
第三步:注册充值
字幕大师需要注册和充值。
下图标红框里有注册按钮。根据要求填好信息,到注册邮箱里激活,账号即可使用。
账号信息里可以看到自己的账户,包括充值、余额、剩余使用时间、修改密码、取消自动登录等。
第四步:导入音视频文件和文本文件
音视频文件支持普遍格式如mp3、mp4、wav、wmv、avi、mpg、mpeg;文本文件仅支持txt文件。
点击“打开文件”按钮
进入该界面
然后依次选择音视频文件和文本文件(注:二者需是对应关系),点击“添加”
如需批量处理多个字幕文件,可重复“选择音视频+选择文本+添加”步骤。
第五步:生成字幕文件
依次导入音视频文件和文本文件后,点击“确认”,字幕大师即可开始对齐工作。稍等片刻,页面下进度条完成后,时间轴即可生成,如下图:
各处功能如图所示:
一般字幕对齐没有问题的情况下,字体为黑色,如果机器识别该处不准确或不正确,会标红提示,如图:
此时可以拖动时间轴上的竖线来完成修改(或手动修改“开始时间”和“结束时间”的数值)
校对完成之后,选择保存即可,默认为srt格式。
字幕大师(OKVoice)注意
(1)该软件必须联网使用
(2)TXT文本文件有要求,里面内容每行不要超过15个字
(3)该软件对背景音乐、视频内的环境音、说话人口音有要求,背景音越干净、口音越准确,识别准确率越高
(4)一般一小时内的音视频文件处理起来没问题
(5)不能识别歌曲、唱词
字幕大师(OKVoice)更新日志
1.全新界面,底层优化
2.新增工程项目,支持打开工程二次修改
3.可根据语音识别生成字幕
4.优化降噪算法
5.支持导入srt文件进行修改
6.支持字幕批量前置、批量后置
7.字幕修改支持上下行合并、删除行、切分、标记
8.优化时间轴操作
9.多任务管理功能优化,支持批量操作、单独操作
媒体工具
媒体工具
媒体工具
媒体工具
媒体工具
媒体工具
媒体工具
媒体工具