磯野です。
日曜日に帰国しました。帰りの飛行機は空いていて隣が空席だったため、広く使えて快適なフライトでした。
4日目のキーノートでのDeepLensの発表でワークショップの存在を知り、DeepLensのワークショップには参加できませんでしたが、ワークショップとは何だろうと疑問も抱いたので参加して来ました。
参加したセッションは三つです。
- ALX305 - Designing Far-Field Speech Processing Systems with Intel and Amazon Alexa Voice Service
- ABD340 - NEW LAUNCH! Stream video from edge devices to AWS for playback, storage and processing using Amazon Kinesis Video Streams
- ALX307-R - [REPEAT] Integrate Alexa into Your Product Using the AVS Device SDK
ワークショップの流れ
参加したどれもがある入力(音声/動画)を受け取って、AWS側のサービスと連携するものということで、RaspberryPiと対応した入力デバイスが提供されました。
参加したワークショップが全てハードウェアを使ったものだということで、傾向が似てしまった可能性はありますが、いずれのワークショップもSession Level:Advanced (300 level)
ではありますが、初心者でも取り組みやすくなっていました。
実際の流れはこんな感じです
- 最初の30分程度で構成システムの説明
- 作業内容のpdfの共有
- pdfにしたがってのワーク
- わからないこと・うまくいかないことがあれば講師、サポートメンバーに質問する
- ワークが終了次第、各自解散
ALX305 - Designing Far-Field Speech Processing Systems with Intel and Amazon Alexa Voice Service
Far-Field、つまり離れた場所からの音声を認識し処理するデバイスでAlexaを呼び出す開発キットを使って行うものです。 Amazon Echo を自分で作成する為のキットと思ってもらえればだいぶ近いと思います。
提供していただいたものは以下の4つです。
- RaspberryPi3
- MicroSD (OSやソースコード)
- Intel Speech Development Kit
- イヤホン
提供されたインテルの音声キットとRaspberryPiを組み合わせてハードウェアを構築し(基盤むき出しですけど)、そこでAVS(Alexa Voice Service)デバイスSDKを利用したサンプルコードをビルドし、実行することが目的です。 OSやら基本のソースやらが全て設定済みのSDカードも提供されているので、簡単にできました。
ワークショップの内容はこちら https://avs-dvk-workshop.github.io/
ABD340 - NEW LAUNCH! Stream video from edge devices to AWS for playback, storage and processing using Amazon Kinesis Video Streams
NEW LAUNCH!
について:キーノートで発表されたサービスに関するセッションであることを表しています。
このワークショップはKinesis Video Streamsの発表を受けて実際に使ってみる為のワークショップです。
Kinesis Video Streamsに動画データを配信する為、RaspberryPiにカメラのキットを繋いで、動画配信プログラムを実行します。 参照はKinesis Video Streamsの標準の動画ビューアーで行います。
提供していただいたものは以下の3つです。
- RaspberryPi3
- MicroSD (OSやソースコード)
- RaspberryPi Camera Module V2
ワークショップの内容は非公開でした。 外部IPからのダウンロードをできないようにしていたので、ここでも公開はしないでおこうと思います。
ALX307 - [REPEAT] Integrate Alexa into Your Product Using the AVS Device SDK
[REPEAT]
について:人気のあるセッションはすぐに埋まってしまいますが、希望者があまりに多い場合には、追加でセッションが開催されます。
とても人気のあるものだと[REPEAT 2], [REPEAT 3]のように増えていくことになります。
こちらは、USBマイクをRaspberryPiにつけて行うワークショップです。ABD340との違いは、Far-FieldではなくHands-Free端末向けという部分です。
提供していただいたものは以下の3つです。
- RaspberryPi3
- MicroSD (OSやソースコード)
- USBマイク
- イヤホン
これを利用して作られるようなデバイスとしては、スマートフォンやスマートウォッチなどでしょうか。 マイクの性能・接続方法とそれによるビルド方法の違いを除いて同じような内容だったので、内容についてより深く理解することができました。
ワークショップの内容はこちら https://avs-sdk-workshop.github.io/
ワークショップに参加しての感想
そこまで高度な技術力は要求されていないので、セッションレベルがAdvancedだとしても興味がある場合には参加してみることをお勧めします。 なお、質問の際は講師の方が席まで来て、しっかり状況を確認して話してくれるので、多少の英語力があれば大丈夫です。
ワークショップは2時間という限られた時間ですので、基本的な部分を中心に学ぶこととなります。そこから、より深く学ぼうとすれば、後ほど自分で調査し、拡張していく、といった取り組みを行う必要がありそうです。 興味があるけど、どこから手を付けるべきか・・・というときには、最初の一歩としてのハードルを下げる、良い内容だと感じました。
次回にまとめの投稿を行って本シリーズは最後したいとおもいます。