パスワードを忘れた? アカウント作成
12339256 story
ビジネス

Amazon、クラウド型自然言語処理サービスの開発者向けプレビューを開始 21

ストーリー by hylom
日本語対応はまだですか 部門より
matlay 曰く、

米Amazon.comが、自然言語応答サービス「Alexa Voice Service(AVS)」の開発者向け無料プレビューを開始した(Engadget JapaneseReadWrite)。

AVSは音声認識や自然言語解析を行えるクラウドサービスで、これを利用することでさまざまなデバイスに音声操作や会話機能を追加できるという。この技術は、先日米国で一般販売が開始された多機能スピーカー「Echo」でも採用されているという。さらに、合計最大1億ドルという「Alexa Fund」なる投資も実施するそうだ。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by matlay (32743) on 2015年08月05日 21時01分 (#2859519) 日記

    日本語対応というか、他言語対応するのかな?
    Amazon なので、いきなりサービス終了はなさそう(Googleよりは)。
    どっちかというとある一定以上の使用は有料にする線だと思うけど。
    #偏見です

    多分、「文句言うな、英語で喋れや」と思ってても不思議ではない。
    #偏見です

    「Queen's English? Pijin English? そんなもん知るか」と思ってても不思議ではない。
    #偏見です
    ##Queen's Englishは対応するかも

    人口比からすると、日本語は後回しになってもおかしくない。
    結構面倒そうだし。ガチの津軽弁とか広島弁とか文字で表記すらできないらしいし。
    #ごく一部の漫画(『さんさん録』 (こうの史代 [wikipedia.org] 双葉社) 『うちの姉様』 [wikipedia.org] (野広実由 竹書房))とか、小説(『いとみち』 越谷オサム [wikipedia.org] 新潮社)だけが情報源の超偏見です

    --
    #存在自体がホラー
    • by acountname (43053) on 2015年08月06日 11時48分 (#2859813) 日記

      > ガチの津軽弁とか広島弁とか文字で表記すらできないらしいし。
      これは発音記号(カナ)の問題ではなかろうか。
      Vを表現するのに う゛ が発明されたように、とあるロボットのために ま゛ が発明されたように、新しい発音記号を作ればいいのではないかと思う。

      親コメント
    • by nemui4 (20313) on 2015年08月06日 14時29分 (#2859926) 日記

      >結構面倒そうだし。ガチの津軽弁とか広島弁とか文字で表記すらできないらしいし。

      方言はともかく、ある音節に対してこういうアクションを取るようにとか学習させていけるようになるんじゃないすかね。
      その仕組やAIはこれからできていくんだと信じて待つ。

      大阪人助教授:アンタの論文(棚に)直しといたからな。
      東京人助教授:オレの論文を勝手にに直す(修正する)な!

      というコントみたいな喧嘩を思い出したけどちょと違うか。

      親コメント
      • by matlay (32743) on 2015年08月06日 14時45分 (#2859937) 日記

        >結構面倒そうだし。ガチの津軽弁とか広島弁とか文字で表記すらできないらしいし。
        超偏見ですってば...。
        #実は文字での表記はあまり本質じゃない気がしたけど、ちょっと頭にあったネタなんで、無理やりねじ込んでみました。

        そういう問題を真面目に各言語でやると手に負えないので、カスタマイズと人間系からのすりよりの妥協点で落ち着くという事なんでしょうね。
        #Alexa ちゃんに分かるように喋りましょう

        >その仕組やAIはこれからできていくんだと信じて待つ。
        「Alexa Fund」って、「金は置いとくから、誰か作ってね」という事なのかもしれない。

        --
        #存在自体がホラー
        親コメント
  • by Anonymous Coward on 2015年08月05日 17時39分 (#2859442)

    将来的には家電から自動車まで何でもかんでも音声で一通りの操作ができるようになるのだろうし、
    操作ボタンの殆ど無い、すっきりとしたインターフェイスの機械たちはスマートで便利なのだろうなあ、とは思うのだけれど、
    声が出ない人、吃音の人、滑舌の悪い人は肩身の狭い思いをしながら
    ボタン操作のできる機械を探して回らなきゃいけなくなるのかもしれない、とか考えてしまう。
    自分が滑舌悪いだけに。

    • by matlay (32743) on 2015年08月05日 20時39分 (#2859511) 日記

      >吃音の人、滑舌の悪い人
      は、カスタマイズで工夫するんですかね。単純命令(二語文ぐらい)なら、単語は意味を違わせてもいけるかな?
      #自分も必要になるかもしれない。

      人間系で対応とか言って、物に言うことをきかせるためのボイストレーニング(?)が流行ったりして。
      #何でこの人は物に命令するときだけ流暢に喋るんだろう?とか

      >声が出ない人
      は難しいですけど、もしかしたら、指のスナップの回数で置き換えたりしたりして。
      #1杯のコーヒーと2杯のコーヒーのオーダーには苦労しなくなったとか
      ##口に加えたラッパを鳴らす回数で....ってのは観たことないな
      ###喋る携帯端末で命令させる手もあるけど、何が何やら

      今の社会で左利きがどう適応しているか、適応するためのサービス(製品)が用意されているか?に通じるかもしれない。つーか、ユニバーサルデザイン [wikipedia.org]をどこまで指向するかという話なのか。
      #スコープをどこに置くかはそれぞれ

      #雑なタレコミをうまく編集していただき、ありがとうございます。

      --
      #存在自体がホラー
      親コメント
      • by matlay (32743) on 2015年08月05日 21時05分 (#2859524) 日記

        >物に言うことをきかせるためのボイストレーニング(?)

        というか、命令用の英語の体系が出来ていったりして。規格化されたりもして。
        #いつの間にか、プログラム言語を喋らされるようになったりして。LOGOのタートルグラフィックみたいな感じになるか?

        --
        #存在自体がホラー
        親コメント
    • by Anonymous Coward on 2015年08月05日 23時40分 (#2859607)

      将来的には家電から自動車まで何でもかんでも音声で一通りの操作ができるようになるのだろうし、
      操作ボタンの殆ど無い、すっきりとしたインターフェイスの機械たちはスマートで便利なのだろうなあ、とは思うのだけれど~

      音声認識研究・実用化の歴史は長いのですが、そんなことはまったくあり得ません
      いちいち声を出すなんて面倒くさいだけです
      かつて音声認識機能を備えたワープロが存在しましたが、当然のごとく市場から消え去りました
      口述筆記(昔の米国映画などで見られる、重役の傍らに控えた秘書がボスの言葉をその場でタイプして手紙を作成するというアレです)の文化があった米国なら受けいられる素地はあったかもしれませんが、日本ではそんなもん実用になるものかというのが音声屋の共通認識でした
      #同じく当然のごとく実現しなかったTRON電脳住宅の夢(?)を語る人がいまだにいるのも大変不思議

      親コメント
      • by matlay (32743) on 2015年08月06日 15時00分 (#2859946) 日記

        実際にやってみると合理的でないとしても、それがイメージとして判りやすい夢なんでしょうね。

        要するに、召使い・執事・メイドがいるイメージ。

        実際にやってみると、相手は「家」そのものだったり、ワープロだったりして、ふと我に返ると虚しさが残る。
        望んでいたものではなかったと気がつく。欲しかったのは効率ではなかったのだと。

        ただ、(執事|メイド)が欲しかっただけなんだ.....orz。
        #なんか変な結論になったな

        --
        #存在自体がホラー
        親コメント
    • 合成音声を流せばいいかも。
      たぶんよく使う命令はボタン一つで実行できた方がいいから、
      テレビのリモコンのようなものを持ち歩く未来に。
      # そして、テレビのリモコンを間違って持っていくんですね。
      # と思ったが、音声認識だからテレビのリモコンは存在しないではないか。

      --
      svn-init() {
        svnadmin create .svnrepo
        svn checkout file://$PWD/.svnrepo .
      }
      親コメント
    • by Anonymous Coward

      何より、音声では英語版ソフトが途端に使えなくなるのは辛い。
      従来インタフェースは必須でお願いします。

    • by Anonymous Coward

      音声はねーわ。念じただけで動作を受け付けるようにしてほしい

      • by matlay (32743) on 2015年08月05日 21時13分 (#2859527) 日記

        本当に念じた通りに動いていいの?

        #音声だって、ついうっかり口走るとか、言い間違いとか結構ありそうだ。
        ##右左とか難しいよね。どっちから見てとか考えると。
        ###相対的位置関係を含む命令に伴う問題という風に拡張できるのか

        --
        #存在自体がホラー
        親コメント
        • by Anonymous Coward

          勝手に工口画像の検索とか表示とかされると凄い困るのでやめて欲しいですね。
           
          文字入力もヤバイ気がする。

          • by matlay (32743) on 2015年08月06日 2時30分 (#2859652) 日記

            それ、デバイスの問題じゃないんじゃないか?
            #命令元の問題じゃないですよ、検索したら画像まで即表示するのが悪いって事ですよ。つまりGoogleさん(?)が悪いと。
            ##つーか、セーフサーチの設定で自衛しとくべきか?
            ###検索キーワードが可視化されてたら、まずいだろ

            --
            #存在自体がホラー
            親コメント
          • by Anonymous Coward

            検索?エロい妄想を立体投影できるくらいにして欲しいですね。

            • by matlay (32743) on 2015年08月06日 6時42分 (#2859675) 日記

              >エロい妄想を立体投影できるくらい

              それ、本当に投影していいの?

              エロい妄想って、場合によっては視覚化するとグロいんじゃなかろうか。
              #人によるというか、嗜好によるというか
              #実際、視覚化したらグロいと感じる実例もあるしな。妄想の視覚化じゃなくて、エロの表現を極端にしてみた違和感(希少感)を売りにしてるのかもしれないけど。

              つーか、場合によってではないかも。妄想って、表現という形でフィルターかけたり規格化してないとまずい代物なのかもしれない。
              #風呂糸さんに話を聞きたくなったので、ちょっと小田原行ってくる [wikipedia.org](嘘)
              ##URLこれでいいのか。スラッシュのエンコードしてないような。

              --
              #存在自体がホラー
              親コメント
        • by Anonymous Coward

          手や足が思った(「念じる」というレベルですらない)通りに動いてくれなきゃ困ります。
          # たぶんそういう反応するってことは現在のデスクトップメタファから思考が一歩も抜け出せていないんだろう。

          • by matlay (32743) on 2015年08月06日 3時23分 (#2859658) 日記

            単に、#2859532のようなコメントを引き出すためのコメントだったんですけど。
            そこまでがテンプレ。

            さて、「念じたとおりに動く」という事を考えると、「それ、安全上どうなのよ?」という疑問が出ます。ありがちな論点でもあるし、まあ、#2859532のようなコメントがそのものですね。

            手足を動かしても大概は「安全」であるのは、デバイスそのものの機能(可動域など)の制限自体もあるし、その機能的制限を前提とした「手足の動かし方」を身につけているおかげでもありますし、そもそも重要な要素としては、動いている途中で感覚的なフィードバック(主に触覚)があるからだと考えられます。
            真っ暗な中で手を動かす時はゆっくり動かすし、何かにぶつかったら止める。こわれそうなもの、倒れそうなものに触ったような気がしたらなおの事で。

            #「手足」を動かし始めるのは「意志」(念じる)ではなく、もっと前の段階でもう動いている [srad.jp]という話がありますね。

            実際はまだまだそこまでは行かないでしょうから、杞憂というか、思考実験に過ぎませんが。

            「利便性」と「安全」とのせめぎあいは思考制御だろうが、音声だろうが、マウスとキーボードだろうが、永遠の課題ですよね。重要な命令を受けたら、ユーザに確認をとるようにしろというのはセオリーです。
            #不可逆の処理とか、逆に確認を省略したいなら、可逆にしろとか

            「利便性」という観点のコメントを見たら、「安全」という観点でツッコミたくなるという事です。

            #『サイバネティックス』(ノーバート・ウィーナー [wikipedia.org] 岩波書店)にはその辺の事書いてあるのかな?

            --
            #存在自体がホラー
            親コメント
          • by Anonymous Coward

            身体を思った通りに動かせるようになるのには、数年の学習期間を要するのですよ。
            幼児のころの体験なので、はっきりと記憶に残っていないだけで。

            両腕を失った(あるいは生まれつき無い)人の中には、訓練で足を手のように自在に操れるようになった人がいますが、
            一朝一夕でできるようになったわけではありません。

            PCを使うのにそれだけの訓練をする気がありますか?

            • by matlay (32743) on 2015年08月06日 6時46分 (#2859677) 日記

              >PCを使うのにそれだけの訓練をする気がありますか?

              現在でも、身体機能を機械で拡張する事に対してはそれなりの訓練だったり、なんだったりは必要になってますね。
              #自動車とか

              PCってのは別の意味で危険でもありますし。何がリスクなのかその時点では不確定ってのが、またたちが悪いのかもしれない。

              --
              #存在自体がホラー
              親コメント
typodupeerror

アレゲはアレゲ以上のなにものでもなさげ -- アレゲ研究家

読み込み中...