「her 世界でひとつの彼女」の優れたインターフェース①

すこし(というか、だいぶ)間が空いてしまいました。今日は、卓越したインターフェースを数多く見られる映画「her」を見ながら考察をしてみたいと思います。この映画は、以下から観ることができますよ。

優れたインイヤー・イヤホン型インターフェース

インイヤー・ヘッドセット

この映画の中で出てくるコンピューターは「OS One」と呼ばれ、世界初の人工知能型OSなのだそうです。OSですので、コンピューターにインストールするのでしょうか。最初はデスクトップ型コンピューターの前でセットアップを行っています。その作業は、音声による対話の方式をとっています。

最初の作業は自宅のPCの中のドキュメントを整理するという、事務的な内容だったのですが、翌朝、主人公のセオドアはコンピューターの「サマンサ」にアクセスするのにインイヤー・イヤホンを使います。そして、ここから先、自宅のPCがクローズアップされることはありません。

映画の全編を通して、後述するプレート型インターフェースのほかはこのインイヤーインターフェースが中心となります。

新たに習得すべき技術が不要

インイヤー型のインターフェースは、コンピューターの発話と音声認識が自然であれば、非常に快適なものとなるでしょう。

私達にとって、「喋りながら(あるいは耳で情報を得ながら)手足は別のことをする」というのは日常生活の中で習得済みの体験です。そのため、特段の訓練を必要とせず、馴染むことができる。これは大きなメリットです。

そのため、会話形インターフェースはSFの世界でも広く使用されていて、それを逆手に取った有名なコメディーシーンもありますね。

情報の取得時間が長くなる課題

しかし、その一方で、音声情報は視覚で得る情報と違い、「ひと目で分かる」ということがないため、冗長に感じがちです。例えば、大量のペーパードキュメントの中から目的の情報を探せ、と言われたら何とか努力のしようもあるように感じますが、24時間分の録音データから目的の音を探せと言われたら、絶望的な気分になるでしょう。

会話形インターフェースは、視覚や触覚インターフェースと併用して補助的に用いる場合や、他の作業と並行させる「ながら作業」に効果が大きいとも考えられます。

「空気を読む」技術

もう一つ、会話形インターフェースの欠陥としてSFで散見されるシーンは、「求めていない情報を長々と説明しはじめて、途中で遮られる」というものです。この体験は、Google Homeや、Amazon Echoなどでも体験できます(笑)

例えば、Alexaに「現在の気温」と聞けば、「現在の○○町の天気は晴れ・・・」と天気予報を喋り出します(記事執筆時点)。Google Homeなら単に「11度です」と言ってくれますが、会話形インターフェースでは結論に到達するまでの時間が視覚型にくらべて長いため、的確に必要な情報に絞って回答しないといけません。

そのためには前後の文脈を読み取る「空気を読む」技術が必要です。サマンサはどうやら四六時中セオドアの行動をチェックしているようですし、過去にセオドアが作った全資料を一瞬で読み込む理解力もあるようなので、快適な情報取得が可能です。

感情を乗せる技術

不思議なことに、スタートレックでは24世紀の世界でもまだ実現されていないようですが、音声情報には「感情」を伴うべきです。感情を音声に乗せることで、会話形インターフェースの情報の質は格段に高まるからです。実は、この点で「her」のサマンサのインターフェースは秀逸です。

含み笑いなどの感情が込められた「her」の会話形インターフェース

電話で会話をする場合を考えるとわかりますが、人間の声は実に正確に感情を表現できます。文字によるチャットであれば、相手がどのような感情をもって情報を発信しているかを正確に把握することは困難ですが、電話で相手が怒っているのか喜んでいるのかを知ることは容易です。

カーナビゲーションシステムが「右方向です」と発話するとき、そこには感情の情報はありません。これが人間なら「右!」という単語を発した時、それが「自信なさげな案内」だったり「お願い」だったり「命令」だったり「苛立ちを含んだ命令」だったり、わずか1語の中に異なった大きな情報を盛り込める。

このように見ていくと、会話形インターフェースは大きな可能性があるものの、あと僅かに、解決すべき課題を含んでいるように思えますね。

会話形インターフェースは、フェイス・トゥ・フェイスの(つまり、表情を読みながらの)コミュニケーションに並んで、人間のコミュニケーション法の根源につながるものなので、奥が深いのかもしれません。

投稿者: holo_admin