帮助与文档 > 产品文档 > 实时语音翻译 > IOS_SDK文档 > 实时语音翻译服务
实时语音翻译服务

有道智云实时语音翻译 SDK简介

概念解释

实时语音翻译:可实现对连续音频流的实时识别,转换成文本信息并返对应文字流。

说明

Hi,您好,欢迎使用有道智云实时语音翻译iOS SDK。

本文档主要针对需要集成实时语音翻译服务iOS SDK的开发工程师,详细描述有道智云实时语音翻译能力及集成过程。

如果您有与我们商务合作的需求,可以通过一下方式联系我们:

商务邮箱: AIcloud_Business@corp.youdao.com

如果您对文档内容有任何疑问,可以通过以下几种方式联系我们:

客服QQ:1906538062

智云翻译技术交流QQ: 669384425

智云OCR技术交流QQ: 471638046

智云语音技术交流QQ群:861723255

联系邮箱: zyservice@corp.youdao.com

温馨提示:
本文档主要针对开发人员,接入测试前需要在后台创建iOS应用,并绑定实时语音翻译实例;如果您还没有,请按照新手指南操作。

平台向每个账户赠送50元的体验金,供用户集成前测试所用,具体资费规则详见实时语音翻译服务报价

功能介绍

有道智云实时语音翻译 SDK 是有道智云开放平台提供的云服务之一,是有道在线实时语音翻译接口的一种实现,支持在线实时语音翻译。

兼容性

支持设备:运行了iOS 8.0及以上系统的 iOS 设备

实时语音翻译SDK集成指南

集成前提

开始集成SDK之前开发者需要登录有道开放平台,创建应用获取应用ID(或者通过运营人员获取应用ID),以便使用实时语音翻译服务。

集成步骤

1. SDK包导入

实时语音翻译 SDK 由如下几个 SDK 组成,YDStreamSpeechTrans.h、libbase.a、libStreamSpeechTrans.a

(1). 添加头文件和库文件:将实时语音翻译 SDK 添加到工程中,包括 YDStreamSpeechTrans.h头文件、libbase.a和libStreamSpeechTrans.a文件。

(2). 设置工程Other Linker Flags为-ObjC。

(3). 在工程build Phases – Link Binary With Libraries中添加libbase.a, AdSupport.framework, CoreTelephony.framework, SystemConfiguration, libz.tbd和libsqlite3.tbd。

2. SDK初始化

说明:所有的查询都需要初始化key,只执行初始化一次即可。

//初始化key
YDTranslateInstance *yd = [YDTranslateInstance sharedInstance];
yd.appKey = @"your appkey";

功能集成

说明:支持实时实时语音翻译,目前支持中英文,请参考 demo 中 StreamSpeechTransVController 的使用;

1. 参数说明
格式支持:只支持wav格式。

采样率:8k或者16k。推荐16k。

编码:16bit位深的单声道

2. 构造识别器

YDSpeechTranslate *translate = [YDSpeechTranslate sharedTranslate];
translate.delegate = self;
YDSpeechTranslateParam *param = [YDSpeechTranslateParam param];
param.from = @"zh-CHS";//源语言类型,目前支持两种,中文:@"zh-CHS",英文:@"en"
param.to = @"en";//源语言类型,目前支持两种,中文:@"zh-CHS",英文:@"en"
param.rate = @"16000";//采样率
param.format = @"wav";//语音文件格式
param.vadBOS = 2000;//前端点静音检测时长,ms
param.vadEOS = 2000;//后端点静音检测时长,ms
translate.delegate = param;

3. 执行识别过程

执行[self.translate startListening];开始实时语音翻译,结果将在代理方法中回调给开发者;

#pragma mark - YDSpeechTranslateDelegate
- (void)onBeginOfSpeech {
  [self startSpeakingAnimation];
  NSLog(@"------speech start-----");
}

- (void)onEndOfSpeech {
  [self endSpekingAnimation];
  NSLog(@"------speech end-----");
}

- (void)onResults:(NSDictionary *)result {
    NSString *context = result[@"context"];
    NSString *tranContent = result[@"tranContent"];
    BOOL isPartial = [result[@"partial"] boolValue];

    NSString *showContext = [NSString stringWithFormat:@"%@%@", self.displayingText, context];
    NSString *showTranContent = [NSString stringWithFormat:@"\n\n%@%@", self.displayingTranText, tranContent];

    NSMutableAttributedString *contextAtt = [self getShowText:showContext textColor:[UIColor grayColor] font:[UIFont systemFontOfSize:13]];
    NSMutableAttributedString *tranContentAtt = [self getShowText:showTranContent textColor:[UIColor blackColor] font:[UIFont boldSystemFontOfSize:15]];

    [contextAtt appendAttributedString:tranContentAtt];

    self.recognizedTV.attributedText = contextAtt;

    if (!isPartial) {
        [self.displayingText appendString:context];
        [self.displayingTranText appendString:tranContent];
    }
}

- (void)onCompleted:(NSError *)speechError {
  [self endSpekingAnimation];
  NSLog(@"------speech completed-----");
}

- (void)onConstantlyQuietIsBOS:(BOOL)isBOS {
  NSLog(@"检测到%@静音", isBOS ? @"前端点" : @"后端点");
}

4. 识别结果说明

参数含义说明
bg分句开始时间单位毫秒/ms
ed分句结束时间单位毫秒/ms
context识别结果
tranContent翻译结果
partial是否是中间结果true:中间结果;false:完整句子
segId分句 id从 0 开始递增

支持语言

语言代码
中文zh-CHS
英文en

错误码

错误码含义
101缺少必填的参数,出现这个情况还可能是 et 的值和实际加密方式不对应
102不支持的语言类型
103翻译文本过长
104不支持的 API 类型
105不支持的签名类型
106不支持的响应类型
107不支持的传输加密类型
108appKey 无效,注册账号, 登录后台创建应用和实例并完成绑定, 可获得应用ID和密钥等信息,其中应用ID就是appKey( 注意不是应用密钥)
109batchLog 格式不正确
110无相关服务的有效实例
111开发者账号无效,可能是账号为欠费状态
201解密失败,可能为 DES,BASE64,URLDecode 的错误
202签名检验失败
203访问 IP 地址不在可访问 IP 列表
301辞典查询失败
302翻译查询失败
303服务端的其它异常
401账户已经欠费停
-1000未知错误
-2000查询输入为空

常见问题及注意事项

(1). 运行程序崩溃?

检查下是否对应的 SDK静态库包 是否放到当前工程目录下。

(2). 语音翻译没结果?

检查下语音翻译接口回调的错误信息,保证申请的 appKey 是有效且提前绑定了。

(3). 如何获得 appKey

注册账号, 登录后台创建应用和实例并完成绑定, 可获得应用ID和密钥等信息,其中应用ID就是appKey( 注意不是应用密钥)。

版本更新记录

上线日期版本号更新内容
2019.06.20v1.0.0增加流式语音翻译