Amazon Pollyを使って、ニュースのタイトルを読み上げてみた

AKANE278130712_TP_V

サーバー開発担当の木下です。

Meltdown/Spectreが騒がれていますね。クラウドベンダーは早々に対策を打っていたようで木下的には一安心ですが、IntelのCEOによるインサイダーが疑われたり対策方法にツッコミが入ったりと、問題自体はまだまだ長引きそうです。

さて今回は、テキスト読み上げをしてくれるAmazon Pollyを使ってみました。

Amazon Pollyとは

Amazon Web Servicesで提供されているサービスの一つで、テキストを音声に変換してくれるものです。テキストと一緒に音声合成マークアップ言語もリクエストすることで、よりリアルな話し声に変換できるようです。
料金ですが、テキストのリクエストであれば100万文字ごとに4USDで使用できるので、国内ベンダーの音声合成サービスより安価に運用できると思います。

使ってみた

今回はJavaScriptを使って、NHK NEWS WEBRSSフィードを取得して新しい記事があったらそのタイトルを読み上げる、というものを作ってみました。

まずはPollyのリクエストに使う認証情報(IAMユーザー)の作成です。

1. AWSコンソールにログインします。

2. 「セキュリティ認証情報」ページの左ペインにある「ユーザー」を開きます。
Image 2018-02-06 11-45-36

3. 「ユーザーを追加」ボタンを押します。
Image 2018-02-06 11-46-08

4. 「ユーザー名」を入れます。適当なもので良いと思います。アクセスの種類は「プログラムによるアクセス」のみチェックを入れ、「次のステップ:アクセス権限」を押します。
Image 2018-02-06 11-47-41

5. 「既存のポリシーを直接アタッチ」をクリックします。下部の検索窓に「polly」とか入れると下のテーブルに「AmazonPollyFullAccess」が出てくると思うので、チェックをいれ、「次のステップ:確認」を押します。
Image 2018-02-06 11-48-24

6. 「ユーザーの作成」を押します。

7. アクセスキーIDとシークレットアクセスキーをどこかにコピーしておき、「閉じる」を押します。
Image 2018-02-06 11-49-10

これで、IAMユーザーの作成が完了しました。

次に、JavaScriptでスクリプトを書いてみました。AWS SDK for JavaScriptとjQueryを読み込んでいます。
NHKのRSSフィードを30000ms(=30秒)ごとに読み込んで先頭の記事の公開日時を参照し、前回の読み込み時刻(30秒前)より新しければその記事の件名をPollyにリクエストして、返ってきたmp3を読み上げるというロジックです。

<script src="https://sdk.amazonaws.com/js/aws-sdk-2.189.0.min.js"></script>
<script src="https://cdnjs.cloudflare.com/ajax/libs/jquery/3.3.1/jquery.min.js"></script>
<script>
    var intervalMs = 30000;    // 何ミリ秒ごとに実行するか
    var awsPollyRegion = 'ap-northeast-1';    // Amazon Pollyを実行するリージョン
    var awsAccessKeyId = '〜IAMユーザーのアクセスキーID〜';    // IAMユーザーのアクセスキーID
    var awsSecretAccessKey = '〜IAMユーザーのシークレットアクセスキー〜';    // IAMユーザーのシークレットアクセスキー

    var lastParsedTime = 0;
    var pollyParams = {
        OutputFormat: "mp3",
        SampleRate: "8000",
        Text: '',
        TextType: "text",
        VoiceId: "Mizuki"
    };

    AWS.config.update({accessKeyId: awsAccessKeyId, secretAccessKey: awsSecretAccessKey, region: awsPollyRegion});
    var polly = new AWS.Polly({apiVersion: '2016-06-10'});

    $(function(){
        setInterval(function(){
            exec(); // intervalMsで定義したmsごとに実行
        }, intervalMs);
    });

    exec(); //初回実行

    function exec(){
        $.ajax({
            url: 'https://www3.nhk.or.jp/rss/news/cat0.xml',
            dataType: 'xml',
            success: function(res) {
                var item = $(res).find('item');
                var title = item.find('title')[0].innerHTML;
                var pubDate = item.find('pubDate')[0].innerHTML;
                var pubDateMs = new Date(pubDate).getTime();
                if (pubDateMs > lastParsedTime) {
                    // ここで読み上げ
                    pollyParams.Text = title;
                    polly.synthesizeSpeech(pollyParams, function(err, data){
                        if (err) console.log(err);
                        else     console.log(data);
                        var audioElement = document.createElement('audio');
                        audioElement.setAttribute('id', 'audioElement' + pubDateMs);
                        document.body.appendChild(audioElement);
                        var uInt8Array = new Uint8Array(data.AudioStream);
                        var blob = new Blob([uInt8Array.buffer]);
                        audioElement.src = URL.createObjectURL(blob);
                        audioElement.play();
                    });
                    console.log(title);
                }
                var lastParsedDate = new Date();
                lastParsedTime = lastParsedDate.getTime();
                console.log(lastParsedDate);
            }
        });
    }
</script>

gistでも公開しています

音声認識・合成はぜひイーディーエーへ!

イーディーエーでは、音声認識や音楽を活用したアプリの開発実績があります。
お気軽にお問い合わせください!

木下 晴晶
e.d.aではWeb全般の開発・運用を担当。Plamo->Fedora->Ubuntu->CentOS->Ubuntuと移り住んできたLinux好き。趣味はゆったりした鉄道旅行。最近脂肪肝の診断を受けるも、未だに座右の銘は「ニンニクいれますか?」