出色的语音合成工具

共计2629字,阅读大约9分钟。
出色的语音合成工具 | 一个栈
试听与下载
此内容为免费资源,请登录后查看
0积分
免费资源

合成声音试听

图片[1] | Web Stack | 出色的语音合成工具 | 一个栈
试听念的都是女神的诗


常记溪亭日暮,沉醉不知归路。

兴尽晚回舟,误入藕花深处。

争渡,争渡,惊起一滩鸥鹭

---------------------------------<<如梦令>>
古风
四川方言
朗诵
童声
学生

项目地址

功能介绍

图片[2] | Web Stack | 出色的语音合成工具 | 一个栈

文本转语音

 在文本菜单中,有文本SSML两个标签页面。 文本菜单的文本标签页:可以输入要转换为语音的文字。 文本菜单的SSML标签页:可以输入要转换为语音的 SSML 标签语言。

在设置区域,可以设置语音的语言语音 说话风格角色扮演语速音调选项。

语速默认为1,为正常语速;音调默认为1,为正常音调;

点击保存配置可以保存当前设置区域的配置,并在下方的下拉选择框中选择已保存的配置。

打开软件默认选择默认配置。想要修改默认配置,可以在保存配置时,给配置起名为默认即可替换默认配置。

点击开始转换即可通过中间文本/SSML 区域内容以及右侧配置选项生成语音。

语音生成成功后,即可在下方点击播放进行试听。

播放按钮右侧绿色下载按钮,点击可以下载当前试听的声音为.mp3,默认保存位置为桌面。

文本批量转语音

图片[3] | Web Stack | 出色的语音合成工具 | 一个栈

批量菜单中,可以批量的将多个.txt 文件转为.mp3 文件。

点击选择文件可以选择多个文本文件,选择完成后,可以看到文件的路径、字数以及当前为ready状态。

不需要的文件可以点击同行的删除按钮。

在右侧的设置区域配置好相应的选项后,点击开始转换,即可转换多个文件为 mp3。默认保存路径为桌面。

程序设置

图片[4] | Web Stack | 出色的语音合成工具 | 一个栈

设置菜单中,可以进行以下设置:

  • 文件保存路径:修改文件保存路径并点击确认
  • 是否自动播放:配置为时,文本转为语音后,可以自动播放。批量转换时无效。
  • 配置模板编辑:保存的模板可以在这里查看或删除。鼠标放在配置名字上可以显示全部配置内容。
图片[5] | Web Stack | 出色的语音合成工具 | 一个栈

修改完成后其实已经自动保存完成,可以点击刷新配置以立即应用。

其他说明

关闭软件:左上角红色圆圈按钮 最小化:左上角绿色圆圈按钮

可能出现的问题

  • 如何调整多音字的读音或添加中断或暂停等 ?
    • 解决方法:文本内容输入这个试试,简单的读音例子: 你好啊 读<phoneme alphabet="sapi" ph="chong 2 liang 4">重量</phoneme>是不对的 要读成“重量” 详情可以看:使用音素改善发音
图片[6] | Web Stack | 出色的语音合成工具 | 一个栈
  • 批量转换失败或者听到都是“汪汪汪”(one one one)的声音
    • 可能出现问题的原因:
      • 微软那个接口只允许utf-8,其他编码的文本都会变成1,英文读起来就是one,连着就是汪汪汪了。#10 (comment)
    • 解决方法:
      1. 已经存在的ANSI编码的文本文档,可以点击文件->另存为->编码:UTF-8。
      2. 新建的文本文档保存文件格式及的选择UTF-8。 以下节选自官方:
      • 文件是纯文本 (.txt) 或 SSML 文本 (.txt)。
      • 文件已编码为包含字节顺序标记 (BOM) 的 UTF-8 格式。
      • 文件是单个文件,而不是 zip 文件。
      • 文件包含 400 多个字符(对于纯文本),或 400 个可计费字符(对于 SSML 文本),并且少于 10,000 个段落。
        • 对于纯文本,通过点击 Enter/Return 来分隔每个段落。 请参阅纯文本输入示例。
        • 对于 SSML 文本,每个 SSML 部分都被视为一个段落。 按不同段落分隔 SSML 部分。 请参阅 SSML 文本输入示例。
  • 点击下载没反应,下载文件为文本文档?
    • 可能出现问题的原因:
      1. 正确的下载方法是转换完成后点击绿色的下载图标,而不是播放器控件的扩展下载,点播放器控件的下载会默认保存为 xxxx.txt。
      2. 点击绿色下载没反应?因为默认保存位置是桌面,所以要检查当前登录的账户有没有写入桌面文件的权限。
    • 解决方法:
      1. 尝试更改默认下载位置为其他盘。
      2. 以管理员身份运行此软件。
      3. 要是想直接用播放器控件下载音乐,可以在保存的时候更改文件名后缀为.mp3 即可。(如果你已经下载完了,可以尝试更改下载的文本文档.txt 后缀名为.mp3)

更新

V1.5.0

  • 使用 Pinia 进行状态控制,重构大部分的代码。
  • SSML标签页可以同步文本标签页的内容了。
  • 批量转换页面,批量转换完成后,可以播放打开所在文件夹
  • 批量转换页面,允许清空当前文件表格中的内容(不会删除文件)。
  • 设置页面,可以直接打开配置文件进行修改。修改完了记得刷新配置
  • 去除 Bilibili 按钮,添加 Gitee 按钮
  • 修复了一些莫名其妙的 BUG。

V1.6.0

  • 添加版本检测功能。
  • 添加转换时配置为空的检测。
  • 更新语音库,新增一个晓伊声音。
  • 修改了一些 UI。

V1.7.0

  • 添加窗口最大化。修改部分属性为响应式。
  • 修改了一些 UI。

V1.7.1

  • 修复BUG:批量转换的清空功能不能正确清除组建的文件列表。
  • 优化样式,window tools 增加 icon,优化下载按钮 loading #11
  • 优化窗口控制按钮图标显示
  • 优化更新检测/提示功能(可以在设置页面配置是否提示)
  • 其他UI修改
  • 提示:1.6.0更新的版本检测:左下角的版本号右边的 🔄 标志,颜色为绿色时代表当前版本为最新版,黄色时代表有新版本更新。

V1.7.2

  • 说话风格和角色扮演的下拉显示为emoji和中文。
  • 修改部分UI:donate,MainOptions,Version

V1.7.3

  • 紧急修复webscoket连接问题

此次更新一定程度上加快了一点转换速度。

V1.8.0

  • 大文件、长文本支持切片拼接。即转换内容过长时,可自动拆分成多个小的内容并分别转换,转换完成后自动拼接成一个文件。拆分的原则按“,。?,.?”进行断句。
  • 添加声音试听功能。在右侧选择“语音”时,点击人名旁边的播放按钮即可播放试听内容。试听的文本内容可以在配置页面或配置文件中修改 。
  • 添加日志功能。操作和转换过程中产生的日志会被保存到该文件中。记得定期在日志文件的保存路径下清理无用日志文件~
  • 修改部分UI。
  • ToDoList:
    • FFmpeg集成
    • 进度条/进度提示
    • 其他

温馨提示:本文最后更新于2022-09-12 05:20:31,某些文章具有时效性,若有错误或已失效,请在下方留言或联系雅舍站长
© 版权声明
THE END
有所帮助就支持一下吧
点赞5当赏 分享
箴言区 抢沙发
头像
达瓦里希请发言...
提交
头像

昵称

取消
昵称表情代码图片