エンタープライズギークス (Enterprise Geeks)

企業システムの企画・開発に携わる技術者集団のブログです。開発言語やフレームワークなどアプリケーション開発に関する各種情報を発信しています。ウルシステムズのエンジニア有志が運営しています。

Cognitive Servicesと Raspberry Piによる音声デバイスの作成

先日、弊社ではプロジェクト事例の知見の交換や社内の技術者交流を目的として、社内向けの技術イベントを開催した。

私はこの4月から Amazon Echo の調査、Cognitive Services の LUIS を使用したチャットボットの作成など、機械学習自然言語処理サービスを仕事で扱ってきたため、そこで得た知識を整理することを目的とした発表を行った。

ただ自然言語処理サービスの内容をまとめるだけでは面白くないので、Raspberry Pi を使って次のような特徴を持った音声デバイスの自作にも挑戦した。

  • 日本語による命令を受けつける
  • Raspberry Pi 経由でインターネットに接続できない家電を操作する(※)

Amazon Echo はライトのオン/オフなどを音声で制御する機能を備えているが、そのためには家電がインターネットに接続できる必要がある。

発表資料は以下の通りだ。

www.slideshare.net

実際に音声で操作を行う様子は以下のビデオをご覧いただきたい。

www.youtube.com

発表資料でも触れたが、Raspberry Pi には赤外線モジュールや、SIM カードも搭載できるので、音声を使って、テレビやエアコンなどのリモコン操作を代替したり、遠隔地からの操作などができたりする可能性がある。

また、Cognitive Services に代表される機械学習による成果を使用したサービスが急速に普及しているため、機械学習の深い知識が無くとも、高度な処理が実現できることを実感した。

これらの技術を適用すれば、今までに思ってもみなかったことや難しかったことも比較的容易に実現できるようになってきている。
興味を持っていただければ幸いである。

[前多 賢太郎]