スマスピ研究所

芝浦工業大学のスマスピについて研究しているブログ

スマスピ研究員、研究内容発表する

前にブログで、大学の卒業研究をブログにすることを宣言しました。

imajo-diary.hatenadiary.jp

今回は、卒業研究の内容について書きます。
ちょっと長くなるんで、結論だけ書くと

Alexaを「アレクサ」って呼ばないでも反応させよう。体の動きで反応させようプロジェクト!!!

決めるにあたって考慮したこと

卒業研究を決めるにあたって、絶対外せない条件などがありました。
(ちなみに、新しくできた研究室ってこともあって研究内容は割と自由に決められます。)

まずは、僕的に外せないポイント

1. スマートスピーカーが関わっていること

はい、最も重要ですね。
まあ、正直スマートスピーカーじゃないとやらないわけじゃないけど、多分僕の学校でスマートスピーカー関連やったことある人いないしちょうどいいかな。

2. 先輩の引き継ぎじゃないこと

先輩の引き継ぎだと、スマートスピーカーやっている人がいないからです。
もちろん、先輩の研究も素晴らしいものばかりでした。

3. 自分の代で終わること

中途半端に終われせるのが嫌なだけ。

4. お金にならないこと

意外と重要。てか、大学生の研究だから当たり前ですが。
卒業して、社会にでたらいやでもお金になることをやっていくと思います。
そうなると、世の中に利益のあるものだったり、誰かが得するものを生み出していくことになるけど、
その必要もない(いや、大学的にはあるけど)今だからこそちょっと遊び心で変なもの作ってやろうかと思ってます。

そんで、教授的に外せないこと

できれば画像処理を関連させてほしい。

まあ、研究室自体が画像処理研究室なんで当たり前っすね。笑

結局なににすんの?

アレクサを体の動きで反応させよう。
現在販売しているスマートスピーカーのほとんどが何かしらの名前を呼んで会話がスタートします。
例えば、「アレクサ」だったり「OK, Google」だったりと。
でも、意外と多い意見が名前を呼ぶのってなんか恥ずかしい。
日本人特有かもですね。慣れないと確かに恥ずかしいかも。

じゃあ、音以外をトリガーにしてみるのもありかも?
手をあげたら反応する。コマネチしたら反応する(嘘)。目線で反応も面白いかも。
多分単純な動きだと、呼んでもいないのに反応しちゃうからどの動きが最適かを研究します。

ラズパイにアレクサを入れて、OpenCVって画像処理ライブラリ使ったりして。
(実は、ラズパイにアレクサ入れたこともあるし、OpenCVも使ったことあるのは秘密ね)

研究の動向は、随時ブログにします!!