2024年网页用哪种语音设计(3篇)_古城2024网站建设费用

2024年网页用哪种语音设计(3篇)

网页用哪种语音设计第1篇

可以使用终结点来获取某个特定区域或终结点的完整语音列表。在语音列表终结点前面加上一个区域前缀，以获取该区域的语音列表。例如，若要获取 westus 区域的语音列表，请使用终结点。有关所有受支持区域的列表，请参阅区域文档。

预览版声音和风格仅在以下三个服务区域提供：美国东部、西欧和东南亚。

下表列出了文本转语音请求的必需的和可选的标头：

对此终结点的 GET 请求不需要正文。

此请求只需要授权标头：

下面是一个 curl 命令示例：

应收到包含所有受支持的区域设置、声音、性别、风格和其他详细信息的 JSON 正文的响应。每个语音的 WordsPerMinute 属性可用于估计输出语音的长度。此 JSON 示例显示部分结果，以说明响应的结构：

每个响应的 HTTP 状态代码指示成功或一般错误。

网页用哪种语音设计第2篇

若要创建自定义神经声音，请使用 Speech Studio 上传录制的音频和相应的脚本，训练模型，然后将语音部署到自定义终结点。

在投资专业录音以创建更高质量的语音之前，可试用神经网络定制声音 (CNV) 精简版来演示和评估 CNV。

要创建优秀的神经网络定制声音，就需要在从语音设计和数据准备到将声音模型部署到系统的每个步骤中，仔细进行质量控制。

在开始使用 Speech Studio 之前，需要注意以下事项：

下面概述了在 Speech Studio 中创建神经网络定制声音的步骤：

你可以优化、调整和使用自定义语音，就像使用预生成的神经语音一样。实时将文本转换为语音，或者使用文本输入来脱机生成音频内容。使用 REST API、语音 SDK或 Speech Studio。

还可以使用语音 SDK 和定制声音 REST API 来训练神经网络定制声音。

请查看 GitHub 上的语音 SDK 存储库中的代码示例，了解如何在应用程序中使用神经网络定制声音。

经过训练的声音模型的风格和特征取决于用于训练的发音人的录音风格和质量。但在向声音模型发出 API 调用以生成合成语音时，可使用 SSML（语音合成标记语言）进行几项调整。 SSML 是标记语言，用于与文本转语音服务通信以将文本转换为音频。可以进行的调整包括改变音调、语速、声调和发音纠正。如果声音模型是用多种风格生成的，也可使用 SSML 来切换风格。

网页用哪种语音设计第3篇

支持的流式处理和非流式处理音频格式以 X-Microsoft-OutputFormat 标头的形式在每个请求中发送。每种格式都包含比特率和编码类型。语音服务支持 48 kHz、24 kHz、16 kHz 和 8 kHz 音频输出。每个预生成的神经网络声音模型在 24kHz 和高保真 48kHz 上可用。

如果选择 48kHz 输出格式，则会相应地调用具有 48kHz 的高保真语音模型。合成时，可以通过向上采样或向下采样来获取除 24kHz 和 48kHz 以外的采样率，例如，从 48kHz 向下采样。

如果所选语音和输出格式具有不同的比特率，则根据需要对音频重新采样。可以通过使用 Opus 编解码器来对 ogg-24khz-16bit-mono-opus 格式进行解码。

高端响应式模板免费下载

响应式网页设计、开放源代码、永久使用、不限域名、不限使用次数

什么是响应式网页设计？

2024年网页用哪种语音设计(3篇)

网页用哪种语音设计第1篇

网页用哪种语音设计第2篇

网页用哪种语音设计第3篇

快捷入口

最新文章

小程序常见问题

服务热线

高端响应式模板免费下载

响应式网页设计、开放源代码、永久使用、不限域名、不限使用次数

什么是响应式网页设计？

2024年网页用哪种语音设计(3篇)

网页用哪种语音设计 第1篇

网页用哪种语音设计 第2篇

网页用哪种语音设计 第3篇

猜你喜欢

热门内容

快捷入口

最新文章

小程序常见问题

服务热线

网页用哪种语音设计第1篇

网页用哪种语音设计第2篇

网页用哪种语音设计第3篇