アカウント名:
パスワード:
先日キーボードも使いこなす高校生に話を聞いたら「一番早い入力は音声」って返ってきて驚いた。確かに、音声認識率が上がっているので、ひとまず喋り続けて初稿を入力して、後から切って貼って並べ替えて編集すれば、下手なキーボード入力より早いのかも。
今のところはそれでも色々考えるとキーボードが早いと思ってしまうけれど、これも理想の入力デバイスでないのは確かだから、音声認識がさらに良くなったら特に自宅などの個人で居られる空間ではパラダイムシフトが起きるのかも。
> 高校生に話を聞いたら「一番早い入力は音声」
うん、確かにうちの息子もスマフォに向かって話しているなー。私は受け入れないけど、UIの進化としては良いことかもしれない。
おっさんとしては「コンピューター」のシーンが普通になることが嬉しいかも。
30半ばのおっさんですが、原稿書くとき初稿は音声で入力してます。なんせ楽ちん。みんな使っていないの?
こんな楽な入力方法ないよ。Lineの返事とかも音声でやります。めっちゃ楽。
そうか?長い変数名とか関数名やメソッド名とか地獄だと思うが。
「かっこかっこかっこ かっことじ 中かっことじ」「あい しょうなりいこーる えむえいえっくす セミコロン」「i != MAX_INPUT」
mallocとかcharAtとか登録されてるのかなあ。#同音異義語や大文字と小文字,カタカナとひらがなは、どうやって区別してるんだろう……#char は「ちゃー」でいいのかな?evalは威張る?
最近はたいてい最初の数文字入れると補間してくれましてね...
秀丸ですらできたりする
「」とか句読点とか入力できないし。そこだけあとから手入力だと入れ忘れが怖い。
あと滑舌悪いから誤認識がひどい。削除して再入力(再認識)とか手間がかかる。削除せずに続けて再入力だと削除忘れが怖い。
結局、最初から手入力したほうが早い。
へー。じゃあちょっとこのビデオの再現実験やってみてくれないかい?現状の音声認識だとどんなもんになるの?https://www.youtube.com/watch?v=KyLqUf4cdwc [youtube.com]
Windows 10 の音声認識は相変わらずこんな感じだよ。「音声認識の向上」で提示されたテキスト1セット読み上げたくらいじゃほとんど変わらなかった。ひょっとすると Android や iPhone のはもう少しマシかもしれない。
検索とか、音声入力を使用して言いますけど、なぜか周りから笑われます。
# 昔の映像の名残で、コンピュータに対して会話を求める# 「使い方を知らない人」扱いされるのでしょうか?
コンピュータ!< 🖯
WindowsPCで音声入力しようとしたらセットアップの時点で挫折PCでの音声認識は軽く10年位は進歩が止まってませんかね?コルタナさんは聞き取りできるのに、それをPCを扱う事に一切活かせてないのはもったいない…
#3353983ですが、PC用途ならGoogleドキュメントの音声入力がかなりオススメです。
Google Document の「ツール」→「音声入力」だと「今朝の朝ごはんはピザパンとアップルパイとフルーツグラノーラとイチゴ入りのブルガリアヨーグルトにオリゴ糖をかけたものを食べました」って一発でした。これはちょっと感動。
しかし Android の音声入力だと、「今日の朝ごはんはピザハットアップルパイとフルーツグラノーラとイチゴ入野ブルガリアヨーグルトにオリゴ糖をかけたものを食べました」となったので、認識率は今ひとつみたいです。
Windows 10 の音声認識(「コントロールパネル」→「音声認識」→「音声認識の開始」)に至っては、「今日も朝晩は絶版とアップルパイTOEFLツムラのが当15位のブルガリアヨーグルトにリポートをかけたものかれました 」を始めとして他9つ程候補が出てきましたが、とても使えたもんじゃないです。仕方がないので細切れにして1文節ずつくらいで分けて喋っても、各所毎に酷い時は10回以上リトライしないといけない始末。「今日の朝晩はピザパンとアップルパイとフルーツ」まで頑張ってみましたが、どうやってもフルーツグラノーラが入力できず、ここで挫折しました。
iOS 系は持ってないので、どなたかよろしく。
はい、どーぞ。
今朝の朝ごはんはピザパンとアップルパイとフルーツグラノーラとイチゴ入りのブルガリアヨーグルトにオリゴ糖かけたものを食べました
惜しい、「を」が欠落しました。が、ここは単に私の話し方が悪かっただけかも知れません。
ちなみに、私は時たま音声入力を使います。Siriさんを起動して「*に電話をかける」とか「ウェブで*を検索する」とか。外では人目がないことを確認してから、ですが。
# チキン野郎。
難解バカボン思い出した。
音声ガイドは現在主流は2系統あり、一つは言語解析の処理主体をネットワーク上のセンターサーバで行うものもう一つは、ローカル側のリソースで言語認識率を上げるもの。ローカル側で処理させているのかも(利用者からの情報はクラウド上でラーニングした結果を共有して適度に更新する感じ。)
まぁこの企業はあと10年もすれば、消えてなくなるだっけ?惜しいなぁ
Windowsの音声認識はクラウドを使わないので、止まっているといえば止まっているかもコルタナの認識にはクラウドを使うようです
自分、喋るよりは速く打てる。タッチタイプ練習ソフトとかの結果から見る限り、高々、中の上ぐらいのクラスでそんなにタイプが速い方ではないけど。
日本語でも英語でも喋る速度の 2、3倍ぐらいでは文字打てちゃうよね。音声にすると、そこがボトルネックで、思考が中断されちゃうからイラっとするんだよな。音声認識使わないのは、後で編集するのが手間ってのもあるけど、普通にキーボード入力してる感じからすれば、遅すぎて使えないというのが大きいと思うのだよ。
自分の所要時間測ってみた
GoogoleDocumentの音声入力朝ごはんはピザパンとアップルパイとフルーツグラノーラとイチゴ入りのブルガリアヨーグルトにオリゴ糖をかけたものを食べました10s
Windows 10 IME今朝の朝ご飯はピザパンとアップルパイとフルーツグラノーラと苺入りのブルガリアヨーグルトにオリゴ糖をかけたものを食べました。25s
ミスタイプもあったけど、喋るほうが (1/10)/(1/25) = 2.5 倍速かった。
自分のe-typing [e-typing.ne.jp]のスコアは
スコア 325レベル Thunder入力時間 59秒19入力文字数 342ミス入力数 7WPM 346.62正確率 97.95%苦手キー ITM-
くらいなので、喋る速度の 2〜3 倍ってなると、この 2.5 * 2 〜 2.5 * 3 倍(= 5〜7.5 倍)くらい打ち込まないといけない計算。それ、ローマ字入力だと 1,700〜2,600打鍵/分くらいになるんだけど?
スコアと打鍵/分の換算式わからないので微妙だけど少なくとも e-typing の過去20回、第875~856回全国ランキング(2018/1/23~~2017/9/19)では第872回全国ランキング(2018/1/2~2018/1/9)の830が最高スコア。
「ご飯」「苺」と入れたかった場合、結局修正に時間かかるじゃん。
つかなんでMS-IMEのほうが例文長いの?端から同じデータで比較する気ないじゃん。
変換は第一候補で入力。GoogleDocument は下線引かれた箇所は右クリックで候補から選べば学習してくれる模様。辞書にないのは手で打ち直しかな?自分の場合、打鍵より口述のほうが2.5倍速いわけですから、下書きとしては十分でしょう。
長さは事故です。他意はありません。議論してるオーダーの 1〜2 桁下の精度の話なので気になるようでしたら、僕に噛みつくよりは検証してもらったほうが有益と思います。
そりゃそうですよね。なんせ、口語の書き起こしにはこういう特殊なシステムが必要なわけで。https://www.youtube.com/watch?v=vSRpF8eTBJ0 [youtube.com]動画の後半に、普通のキーボードを使って最速クラスの人がタイプする場面があるけど、しゃべる速度よりも明らかに遅い。
ステノワード [google.co.jp]ですね。これ秋葉ですら売られてるの見たことがないんですが、専門学校直販なんだろうか?
一時期、漢直 [google.co.jp]に手を出したことがあったんですが、学習コスト高過ぎて半月立たずに挫折した経験からすると、ステノワードをマスターするとか凄過ぎと思います。職業として成り立つから出来るのかなー???
e-typing 800 レベルの人はなんか根本的にスペックが違うのか、練習方法が違うのか。会議でメモ取り続けてますけど漫然とタイピングしているだけでは今の速度で頭打ち状態なので、単に慣れの問題だけだと自分はこの辺りが限界で、これ以上を望むとなると意識的に練習しないと無理みたいです。
http://www.math.tsukuba.ac.jp/~tsuboi/und/14logic3.pdf [tsukuba.ac.jp]こういうのはどうやって入力すんの?分量があるので音声入力できると助かるが
GoogleIMEなら気合い入れれば20秒で打てるよ。だいぶ疲れるけど(笑)
# かれこれ30年以上KBD叩いてる
来栖川先輩が困りそう
#マイクの感度を最大限に上げれば大丈夫か
日本語だとそうかもしれませんが、日本語以外を入力する機会も多いのでキーボードは手放せなさそうです。
インタビューの文字起こしをするのに最適なのは「イヤホンで実際の録音を聴きながらスマホに向かって喋りなおす」なのだそうで。もはや人間は言語インタプリタかなんかになってるな
「会話風」を打鍵で苦心しつつ表現してチャットしていた時代があったなあ話し言葉がしっかり句読点までつけた文章になってますってNHKからフリーになったアナウンサーさんが居たけど将来はそういう人が増えるのかな(ボイスレコーダで小説を書いた志茂田景樹先生は、そういう意味では時代の最先端だったのか)
実は、Androidの音声入力による検索ってWeb版のGoogle検索同様に、電卓代わりにもなるんですよ。
まぁ、認識ミスが無いかは確認しないといけませんけどタッチパネルの感度が悪い端末や、小さすぎる端末だとタッチパネルで入力するよりミスは少なかったりします。
いくら音声認識の精度が上がっても、キーボード入力より早くするためには早口で喋らなくてはならないうえに、言い間違いや噛んだときの修正に時間がかかりそうなので、やっぱ無理。
キー入力のほうが喋るより速いしね。
車の運転中とかお料理中に短いメッセージを打つ程度ならいいかもね。
そもそもスペルや個々の漢字はわかるけど読めない単語を音声だと入力できないじゃないですか。
専門用語だとへんな略語とかあって大変なんですよ。
#スカジはちゃんとSCSIって変換してくれるのかしら
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
音声認識 (スコア:0)
先日キーボードも使いこなす高校生に話を聞いたら「一番早い入力は音声」って返ってきて驚いた。
確かに、音声認識率が上がっているので、ひとまず喋り続けて初稿を入力して、
後から切って貼って並べ替えて編集すれば、下手なキーボード入力より早いのかも。
今のところはそれでも色々考えるとキーボードが早いと思ってしまうけれど、
これも理想の入力デバイスでないのは確かだから、音声認識がさらに良くなったら
特に自宅などの個人で居られる空間ではパラダイムシフトが起きるのかも。
Re:音声認識 (スコア:1)
> 高校生に話を聞いたら「一番早い入力は音声」
うん、確かにうちの息子もスマフォに向かって話しているなー。
私は受け入れないけど、UIの進化としては良いことかもしれない。
おっさんとしては「コンピューター」のシーンが普通になることが嬉しいかも。
maruken
Re: (スコア:0)
30半ばのおっさんですが、原稿書くとき初稿は音声で入力してます。
なんせ楽ちん。みんな使っていないの?
こんな楽な入力方法ないよ。Lineの返事とかも音声でやります。めっちゃ楽。
Re: (スコア:0)
しかし、社内の人間が皆音声入力を始めたりすれば、
うるさくて仕事にならないでしょう。
黙々とPC(キーボード入力)やタブレット(フリック入力)でお願いします。
Re: (スコア:0)
そうか?長い変数名とか関数名やメソッド名とか地獄だと思うが。
「かっこかっこかっこ かっことじ 中かっことじ」
「あい しょうなりいこーる えむえいえっくす セミコロン」
「i != MAX_INPUT」
mallocとかcharAtとか登録されてるのかなあ。
#同音異義語や大文字と小文字,カタカナとひらがなは、どうやって区別してるんだろう……
#char は「ちゃー」でいいのかな?evalは威張る?
Re: (スコア:0)
最近はたいてい最初の数文字入れると補間してくれましてね...
秀丸ですらできたりする
Re: (スコア:0)
「」とか句読点とか入力できないし。
そこだけあとから手入力だと入れ忘れが怖い。
あと滑舌悪いから誤認識がひどい。
削除して再入力(再認識)とか手間がかかる。
削除せずに続けて再入力だと削除忘れが怖い。
結局、最初から手入力したほうが早い。
Re: (スコア:0)
へー。じゃあちょっとこのビデオの再現実験やってみてくれないかい?現状の音声認識だとどんなもんになるの?
https://www.youtube.com/watch?v=KyLqUf4cdwc [youtube.com]
Re:音声認識 (スコア:2)
Windows 10 の音声認識は相変わらずこんな感じだよ。
「音声認識の向上」で提示されたテキスト1セット読み上げたくらいじゃほとんど変わらなかった。
ひょっとすると Android や iPhone のはもう少しマシかもしれない。
uxi
Re: (スコア:0)
検索とか、音声入力を使用して言いますけど、
なぜか周りから笑われます。
# 昔の映像の名残で、コンピュータに対して会話を求める
# 「使い方を知らない人」扱いされるのでしょうか?
Re: (スコア:0)
コンピュータ!< 🖯
Re: (スコア:0)
WindowsPCで音声入力しようとしたらセットアップの時点で挫折
PCでの音声認識は軽く10年位は進歩が止まってませんかね?
コルタナさんは聞き取りできるのに、それをPCを扱う事に一切活かせてないのはもったいない…
Re:音声認識 (スコア:1)
#3353983ですが、PC用途ならGoogleドキュメントの音声入力がかなりオススメです。
おぉ、凄い! (スコア:5, 興味深い)
Google Document の「ツール」→「音声入力」だと
「今朝の朝ごはんはピザパンとアップルパイとフルーツグラノーラとイチゴ入りのブルガリアヨーグルトにオリゴ糖をかけたものを食べました」
って一発でした。これはちょっと感動。
しかし Android の音声入力だと、
「今日の朝ごはんはピザハットアップルパイとフルーツグラノーラとイチゴ入野ブルガリアヨーグルトにオリゴ糖をかけたものを食べました」
となったので、認識率は今ひとつみたいです。
Windows 10 の音声認識(「コントロールパネル」→「音声認識」→「音声認識の開始」)に至っては、
「今日も朝晩は絶版とアップルパイTOEFLツムラのが当15位のブルガリアヨーグルトにリポートをかけたものかれました 」
を始めとして他9つ程候補が出てきましたが、とても使えたもんじゃないです。
仕方がないので細切れにして1文節ずつくらいで分けて喋っても、各所毎に酷い時は10回以上リトライしないといけない始末。
「今日の朝晩はピザパンとアップルパイとフルーツ」
まで頑張ってみましたが、どうやってもフルーツグラノーラが入力できず、ここで挫折しました。
iOS 系は持ってないので、どなたかよろしく。
uxi
Re:おぉ、凄い! (スコア:2)
はい、どーぞ。
今朝の朝ごはんはピザパンとアップルパイとフルーツグラノーラとイチゴ入りのブルガリアヨーグルトにオリゴ糖かけたものを食べました
惜しい、「を」が欠落しました。
が、ここは単に私の話し方が悪かっただけかも知れません。
ちなみに、私は時たま音声入力を使います。
Siriさんを起動して「*に電話をかける」とか「ウェブで*を検索する」とか。
外では人目がないことを確認してから、ですが。
# チキン野郎。
死して屍 拾う者なし
Re: (スコア:0)
難解バカボン思い出した。
中の人に聞くと結構面白い (スコア:0)
音声ガイドは現在主流は2系統あり、一つは言語解析の処理主体をネットワーク上のセンターサーバで行うもの
もう一つは、ローカル側のリソースで言語認識率を上げるもの。ローカル側で処理させているのかも
(利用者からの情報はクラウド上でラーニングした結果を共有して適度に更新する感じ。)
まぁこの企業はあと10年もすれば、消えてなくなるだっけ?
惜しいなぁ
Re: (スコア:0)
Windowsの音声認識はクラウドを使わないので、止まっているといえば止まっているかも
コルタナの認識にはクラウドを使うようです
Re: (スコア:0)
自分、喋るよりは速く打てる。タッチタイプ練習ソフトとかの結果から見る限り、高々、中の上ぐらいのクラスでそんなにタイプが速い方ではないけど。
Re: (スコア:0)
日本語でも英語でも喋る速度の 2、3倍ぐらいでは文字打てちゃうよね。
音声にすると、そこがボトルネックで、思考が中断されちゃうからイラっとするんだよな。
音声認識使わないのは、後で編集するのが手間ってのもあるけど、普通にキーボード入力してる感じからすれば、遅すぎて使えないというのが大きいと思うのだよ。
マジ速すぎw (スコア:3)
自分の所要時間測ってみた
GoogoleDocumentの音声入力
朝ごはんはピザパンとアップルパイとフルーツグラノーラとイチゴ入りのブルガリアヨーグルトにオリゴ糖をかけたものを食べました
10s
Windows 10 IME
今朝の朝ご飯はピザパンとアップルパイとフルーツグラノーラと苺入りのブルガリアヨーグルトにオリゴ糖をかけたものを食べました。
25s
ミスタイプもあったけど、
喋るほうが (1/10)/(1/25) = 2.5 倍速かった。
自分のe-typing [e-typing.ne.jp]のスコアは
くらいなので、
喋る速度の 2〜3 倍ってなると、
この 2.5 * 2 〜 2.5 * 3 倍(= 5〜7.5 倍)くらい打ち込まないといけない計算。
それ、ローマ字入力だと 1,700〜2,600打鍵/分くらいになるんだけど?
スコアと打鍵/分の換算式わからないので微妙だけど
少なくとも e-typing の過去20回、第875~856回全国ランキング(2018/1/23~~2017/9/19)では
第872回全国ランキング(2018/1/2~2018/1/9)の830が最高スコア。
uxi
Re: (スコア:0)
「ご飯」「苺」と入れたかった場合、結局修正に時間かかるじゃん。
つかなんでMS-IMEのほうが例文長いの?
端から同じデータで比較する気ないじゃん。
Re:マジ速すぎw (スコア:2)
変換は第一候補で入力。
GoogleDocument は下線引かれた箇所は右クリックで候補から選べば学習してくれる模様。
辞書にないのは手で打ち直しかな?
自分の場合、打鍵より口述のほうが2.5倍速いわけですから、下書きとしては十分でしょう。
長さは事故です。他意はありません。議論してるオーダーの 1〜2 桁下の精度の話なので気になるようでしたら、僕に噛みつくよりは検証してもらったほうが有益と思います。
uxi
Re: (スコア:0)
そりゃそうですよね。
なんせ、口語の書き起こしにはこういう特殊なシステムが必要なわけで。
https://www.youtube.com/watch?v=vSRpF8eTBJ0 [youtube.com]
動画の後半に、普通のキーボードを使って最速クラスの人がタイプする場面があるけど、しゃべる速度よりも明らかに遅い。
Re:マジ速すぎw (スコア:2)
ステノワード [google.co.jp]ですね。
これ秋葉ですら売られてるの見たことがないんですが、専門学校直販なんだろうか?
一時期、漢直 [google.co.jp]に手を出したことがあったんですが、学習コスト高過ぎて半月立たずに挫折した経験からすると、ステノワードをマスターするとか凄過ぎと思います。
職業として成り立つから出来るのかなー???
e-typing 800 レベルの人はなんか根本的にスペックが違うのか、練習方法が違うのか。
会議でメモ取り続けてますけど漫然とタイピングしているだけでは今の速度で頭打ち状態なので、単に慣れの問題だけだと自分はこの辺りが限界で、これ以上を望むとなると意識的に練習しないと無理みたいです。
uxi
Re: (スコア:0)
http://www.math.tsukuba.ac.jp/~tsuboi/und/14logic3.pdf [tsukuba.ac.jp]
こういうのはどうやって入力すんの?
分量があるので音声入力できると助かるが
Re: (スコア:0)
GoogleIMEなら気合い入れれば20秒で打てるよ。だいぶ疲れるけど(笑)
# かれこれ30年以上KBD叩いてる
Re: (スコア:0)
来栖川先輩が困りそう
#マイクの感度を最大限に上げれば大丈夫か
Re: (スコア:0)
日本語だとそうかもしれませんが、日本語以外を入力する機会も多いのでキーボードは手放せなさそうです。
Re: (スコア:0)
インタビューの文字起こしをするのに最適なのは「イヤホンで実際の録音を聴きながらスマホに向かって喋りなおす」なのだそうで。
もはや人間は言語インタプリタかなんかになってるな
Re: (スコア:0)
「会話風」を打鍵で苦心しつつ表現してチャットしていた時代があったなあ
話し言葉がしっかり句読点までつけた文章になってますってNHKからフリーになったアナウンサーさんが居たけど将来はそういう人が増えるのかな
(ボイスレコーダで小説を書いた志茂田景樹先生は、そういう意味では時代の最先端だったのか)
Re: (スコア:0)
実は、Androidの音声入力による検索って
Web版のGoogle検索同様に、電卓代わりにもなるんですよ。
まぁ、認識ミスが無いかは確認しないといけませんけど
タッチパネルの感度が悪い端末や、小さすぎる端末だと
タッチパネルで入力するよりミスは少なかったりします。
Re: (スコア:0)
いくら音声認識の精度が上がっても、キーボード入力より早くするためには早口で喋らなくてはならないうえに、言い間違いや噛んだときの修正に時間がかかりそうなので、やっぱ無理。
キー入力のほうが喋るより速いしね。
車の運転中とかお料理中に短いメッセージを打つ程度ならいいかもね。
Re: (スコア:0)
そもそもスペルや個々の漢字はわかるけど読めない単語を音声だと入力できないじゃないですか。
専門用語だとへんな略語とかあって大変なんですよ。
#スカジはちゃんとSCSIって変換してくれるのかしら