米グーグル(Google)や米アマゾン・ドット・コム(Amazon.com)が覇を競うAIスピーカー。家庭に入り始めたIoTデバイスの定番だが、想定外の質問にはにべもない。イライラを募らせるくらいなら、いっそ自作してしまおう。

米グーグル(Google)の「Voice Kit」。AIのDIYをうたう「Google AIY」プロジェクトが開発したAIスピーカー自作キット
[画像のクリックで拡大表示]

 AIスピーカーの機能の多くはクラウド側で提供される。グーグルやアマゾンはAPIを公開し、アプリケーションやAIスピーカー開発者の呼び込みを図っている。そうした状況下で、グーグルが開発者向けに提供しているAIスピーカーの自作キットが「Voice Kit」。AIのDIYをうたう「Google AIY」プロジェクトの一環で、手のひらサイズのPCボード「Raspberry Pi(ラズパイ)」を中心に、マイクとスピーカー、そしてグーグルのクラウドサービスを組み合わせたものだ。

 第1世代のVoice Kitは、ラズパイが別売りで4000円程度。スイッチサイエンスでは3500円で入手できる。ラズパイ3が4000円程度で購入できるので、合わせて8000円ほど。Google Home Miniよりは高価だが、Google Homeの半値ほどの費用で自作できる計算だ*1

*1 2018年4月16日発売の第2世代製品は、「Raspberry Pi Zero WH」を同こんして49.99ドル(1ドル110円換算で約5500円)。日本向けにはまだ未出荷の状態だ。ただラズパイZeroはシングルコアCPUでメモリーが512Mバイトと、クアッドコアCPUで1Gバイトメモリーのラズパイ3よりかなり非力。あえて第1世代製品を選んでもいいだろう。

 自作の手順は、大きく次の5つ。

  • Voice Kitを組み立てる
  • OSをインストールする
  • Google Cloudに登録する
  • サンプルスクリプトを実行する
  • 音声コマンドをカスタマイズする

 基本形は、組み立てに30分、OSのインストールに15分、クラウドサービス「Google アシスタント」機能の有効化と実行に15分、計1時間ほどでできあがる。

 ただ自作の醍醐味は、中身をいじれること。ローカルで認識する音声コマンドの定義を編集すれば、任意の操作を実行できる。ここではVoice Kitのラズパイの再起動やシャットダウン操作が可能なカスタマイズを加える。