亲宝软件园·资讯

展开

Android 语音合成

​ 灵魂的沉浮   ​ 人气:0

简介

科大讯飞:合成速度快,准确度高,模型多。但问题也是相当明显,只有在线合成是免费的,离线则是一笔不小的开销。

百度:是专门为他的导航做的一套,性能相对也还可以,但是他只支持离在线混合模式,默认是在wifi情况下是使用在线模式,4g或无网络情况下使用离线模式。

云知声:则可以实现完全的离线合成模式,相比于前两个,性能可能没那没完美,不过对合成的语音要求不高的应用来说,可以考虑接入,缺点就是模型比较少。

在线合成和离线合成(合成速度)

在线合成必须将数据传到第三方平台,调用他们的服务接口进行合成,这中间牵扯到网络状况,在网络良好的情况下,合成速度和离线模式没有太大的差别,但是有时候服务器也会来开个小差,无法保证网络一直都是畅通无阻的。在线模式虽然不太稳定,但是不需要把模型和合成底层代码放在本地,离线合成虽然稳定快速,但是apk体积增加的有点小夸张。

云知声的解决办法:把语音合成模型放在服务器后端,你要使用的时候下载到本地。

集成方法

注册云知声开发者,创建应用,下载离线语音合成sdk,里面就两个文件。

将这里面的所有东西都拷贝到你的项目的对应的libs下(比如app目录下的libs)

在app模块的 build.gradle的defaultConfig括号下加上

        ndk {
            abiFilters 'armeabi'
        }
        sourceSets {
            main {
                jniLibs.srcDirs = ['libs']
            }
        }

截图如下:

在AndroidManifest.xml设置所需要的权限

    <!-- 网络权限 -->
    <uses-permission android:name="android.permission.INTERNET"/>
    <!-- sd卡获得写的权限 -->
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
    <!-- 获取网络状态 -->
    <uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
    <!-- 获取WiFi状态 -->
    <uses-permission android:name="android.permission.ACCESS_WIFI_STATE"/>
    <!-- 改变网络状态 -->
    <uses-permission android:name="android.permission.CHANGE_NETWORK_STATE"/>
    <!-- 改变WiFi状态 -->
    <uses-permission android:name="android.permission.CHANGE_WIFI_STATE"/>
    <!--唤醒锁定-->
    <uses-permission android:name="android.permission.WAKE_LOCK"/>
    <!--清除应用缓存-->
    <uses-permission android:name="android.permission.RECORD_AUDIO"/>
    <!--麦克风权限组-->
    <uses-permission android:name="android.permission.READ_CALENDAR"/>
    <!-- 允许应用写(非读)用户的外部存储器 -->
    <uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE"/>
    <!--允许读取电话的状态-->
    <uses-permission android:name="android.permission.READ_PHONE_STATE"/>
    <!--允许应用读取用户的联系人数据-->
    <uses-permission android:name="android.permission.READ_CONTACTS"/>
    <!--允许使用电源锁定管理以使进程休眠或屏幕变暗-->
    <uses-permission android:name="android.permission.WAKE_LOCK" />

为了方便使用我这里将云知声语音合成做了进一步的封装,以方便调用,以下是示例,方便大家进行参考

import android.content.Context;
import android.media.AudioManager;
import android.util.Log;

import cn.yunzhisheng.tts.offline.TTSPlayerListener;
import cn.yunzhisheng.tts.offline.basic.ITTSControl;
import cn.yunzhisheng.tts.offline.basic.TTSFactory;
import cn.yunzhisheng.tts.offline.common.USCError;

/**
 * 云知声离线语音封装类
 */
public class SpeechUtilOffline implements TTSPlayerListener {
    public static final String TAG ="SpeechUtilOffline";
    public static final String appKey = "_appKey_";
    private ITTSControl ittsControl;
    private Context context;
    public SpeechUtilOffline(Context context) {
        this.context = context;
        init();
    }

    /**
     * 初始化引擎
     */
    private void init() {
        // 初始化语音合成对象
        ittsControl = TTSFactory.createTTSControl(context, appKey);
        // 设置回调监听
        ittsControl.setTTSListener(this);
        // 设置音频流
        ittsControl.setStreamType(AudioManager.STREAM_MUSIC);
        // 设置播报语速,播报语速,数值范围 0.1~2.5 默认为 1.0
        ittsControl.setVoiceSpeed(2.5f);
        // 设置播报音高,调节音高,数值范围 0.9~1.1 默认为 1.0
        ittsControl.setVoicePitch(1.1f);
        // 初始化合成引擎
        ittsControl.init();
    }

    /**
     * 停止播放
     */
    public void stop(){
        ittsControl.stop();
    }

    /**
     * 播放
     */
    public void play(String content) {
        ittsControl.play(content);
    }

    /**
     * 开始缓冲回调
     */
    @Override
    public void onBuffer() {
        Log.i(TAG, "onBuffer");
    }

    /**
     * 开始播放回调
     */
    @Override
    public void onPlayBegin() {
        Log.i(TAG, "onPlayBegin");
    }

    /**
     * 取消播放回调
     */
    @Override
    public void onCancel() {
        Log.i(TAG, "onCancel");
    }

    /**
     * 语音合成错误回调
     */
    @Override
    public void onError(USCError uscError) {
        Log.i(TAG, "onError");
    }

    /**
     * 播放完成回调
     */
    @Override
    public void onPlayEnd() {
        Log.i(TAG, "onPlayEnd");
        ittsControl.stop();
    }

    /**
     * 初始化成功回调
     */
    @Override
    public void onInitFinish() {
        Log.i(TAG, "onInitFinish");
    }
}

使用方法

SpeechUtilOffline speechUtilOffline = new SpeechUtilOffline(this);
speechUtilOffline.play("此处是需要播放的文本内容")

总结

在集成的时候遇到过很多bug,比如模型文件放在不正确的地方会导致没有声音,模型文件不完整的时候回导致程序崩溃,发音不是预期的效果等等,还有一些参数的设置,具体参数还是得看官方的开发文档。

加载全部内容

相关教程
猜你喜欢
用户评论