アカウント名:
パスワード:
一文字一文字いわゆる全角かどうか判定してるんですかね?言語に限らず280文字にしたほうが楽そうだけど...
31文字で十分ですよ。
そこは5-7-5-7-7で書いてほしかった(笑)
No, thirty-one. Five, seven, five, seven, seven, thirty-one.
「17文字で十分ですよ」
3行で頼む
Twitter サポートかどうか知らないけど、アラビアとか、ヒンディーの文字幅は、固定長ではないのですが、、。
日本語と中国語は表意文字と表音文字の組み合わせですから、140字でもアルファベットよりはたくさんの情報が詰め込めるのでしょうが、ハングルって表音文字ですよね。2バイト文字だからって日本語や中国語と同じ扱いにされると、ちょっと複雑なんじゃないかなあ。
ハングルは漢字の読みを1文字で表現する表音文字。いわば、発音記号を組み合わせて1文字にしてる。漢字と置き換えても字数は変わらないはず。そもそもハングルの字数自体も2000字以上あったはず。
ハングルは(数え方によるけど)1万文字以上あるやで。
ハングルは実際には一文字を複数の文字に分解できるので…
だからなに?
一文字で英単語一個分くらいの意味がある。或いは漢字一文字分の意味がある。
そうなんですねただ経験的に、アプリのGUIの多言語化のときいつもハングルだけやたら長くなって嫌だったのだけど翻訳者の力量がなかっただけかな?
定番のHello Worldで調べると、( http://brian.hatenablog.jp/entry/hello-world [hatenablog.jp] )英語:10文字、日本語:7文字、韓国語:5文字、中国語:4文字だそうです
文字の機能としてはあっても、韓国語として存在しない単語なら別の表現にしなきゃいけないだろうし、そのせいで長くなってるんじゃ?
「今日は世界」 5文字です。
文字数で比較するにのひらがな表記はずるいです。
「きょうは」となってしまうので、「こんにちは」を漢字で書くのは一般的じゃ無いと思うんだ。
「もしもし世界」「オッス世界」「やあ世界」
世界に乾杯
少なくとも「1文字」が1音とは限らない。たとえば「ロ|」みたいなので一音で、さらに下側に子音が1~2文字付けられる。
平均で「ハングル1文字 = ひらがな 1.5文字」くらいの感じか?漢字ほどじゃないけどアルファベットに比べれば随分多いんじゃね。
ハングル1文字は漢字1文字の読み仮名って考えると大体しっくりくる。例えば、ムン・ジェインは漢字で書くと「文在寅」で、「문재인」、パク・クネは「朴槿恵/박근혜」で、これらは全て字ごとに対応してる。
これを日本語で考えると、「佐藤」の「さとう」が2文字で、鈴木の「すずき」も2文字、って感じだから、ひらがな1.5文字でもいいが、「山」や「川」を「やま・サン」「かわ・セン」って読むことを考えると、読みがカナ一音節になる漢字は意外と少ないから、ハングル1文字の情報量は、大体カナの2文字分くらいあると思う。
うん、むしろ「日本語、中国語、韓国語では(これまでどおりの)140文字までに制限している」状態だよね。全角半角の判断はUnicode文字データベースを参照すればすぐわかる話なのでコーディング的には難しくない。
HALFWIDTH KATAKANAとFULLWIDTH KATAKANAですねわかります。#どっちもUTF-8では3オクテット。
ほんとにツイートの文字を解析しているの?最近は英語のネットユーザーも日本由来の全角顔文字を使うことがあるけど、使った瞬間に上限が280文字から140文字に下がっちゃうような仕様と大ブーイングが起きるだろうから、もし文字解析で決めているのなら、全角文字を何%以上使ってると日本語と認定するとかそういう仕組みが必要になる。
でも、そんなめんどくさいことしてんのかな。単にTwitterクライアントのUI言語設定を見て判断してるだけじゃないの。
だって、特に日本人にはそういうおもちゃ渡すと…
…あえて書かなくても各自思い当たることがあるだろ?だろ?
縛りがキツイ方が燃える奴も多いが。
部門名♪部門名♫
なるほど。手書きした文章を画像として出力できる入力方法か、連動するアプリがあればいいんだ。
いやいや、全角も半角も1字だろ。いつの時代の話をしてるんだ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds
日本語、中国語、韓国語以外 (スコア:-1)
一文字一文字いわゆる全角かどうか判定してるんですかね?
言語に限らず280文字にしたほうが楽そうだけど...
Re:日本語、中国語、韓国語以外 (スコア:2, おもしろおかしい)
31文字で十分ですよ。
Re:日本語、中国語、韓国語以外 (スコア:1)
そこは5-7-5-7-7で書いてほしかった(笑)
Re: (スコア:0)
No, thirty-one. Five, seven, five, seven, seven, thirty-one.
Re:日本語、中国語、韓国語以外 (スコア:1)
「17文字で十分ですよ」
Re: (スコア:0)
3行で頼む
Re:日本語、中国語、韓国語以外 (スコア:1)
Twitter サポートかどうか知らないけど、
アラビアとか、ヒンディーの文字幅は、固定長ではないのですが、、。
Re: (スコア:0)
日本語と中国語は表意文字と表音文字の組み合わせですから、
140字でもアルファベットよりはたくさんの情報が詰め込めるのでしょうが、
ハングルって表音文字ですよね。
2バイト文字だからって日本語や中国語と同じ扱いにされると、
ちょっと複雑なんじゃないかなあ。
Re:日本語、中国語、韓国語以外 (スコア:3)
ハングルは漢字の読みを1文字で表現する表音文字。いわば、発音記号を組み合わせて1文字にしてる。漢字と置き換えても字数は変わらないはず。そもそもハングルの字数自体も2000字以上あったはず。
Re:日本語、中国語、韓国語以外 (スコア:1)
ハングルは(数え方によるけど)1万文字以上あるやで。
Re: (スコア:0)
ハングルは実際には一文字を複数の文字に分解できるので…
Re: (スコア:0)
ハングルは実際には一文字を複数の文字に分解できるので…
だからなに?
Re: (スコア:0)
一文字で英単語一個分くらいの意味がある。或いは漢字一文字分の意味がある。
Re: (スコア:0)
そうなんですね
ただ経験的に、アプリのGUIの多言語化のときいつもハングルだけやたら長くなって嫌だったのだけど
翻訳者の力量がなかっただけかな?
Re: (スコア:0)
定番のHello Worldで調べると、( http://brian.hatenablog.jp/entry/hello-world [hatenablog.jp] )
英語:10文字、日本語:7文字、韓国語:5文字、中国語:4文字
だそうです
Re: (スコア:0)
文字の機能としてはあっても、韓国語として存在しない単語なら
別の表現にしなきゃいけないだろうし、そのせいで長くなってるんじゃ?
Re:日本語、中国語、韓国語以外 (スコア:1)
「今日は世界」 5文字です。
文字数で比較するにのひらがな表記はずるいです。
Re: (スコア:0)
「きょうは」となってしまうので、
「こんにちは」を漢字で書くのは一般的じゃ無いと思うんだ。
Re: (スコア:0)
「もしもし世界」
「オッス世界」
「やあ世界」
Re:日本語、中国語、韓国語以外 (スコア:1)
世界に乾杯
Re: (スコア:0)
少なくとも「1文字」が1音とは限らない。
たとえば「ロ|」みたいなので一音で、さらに下側に子音が1~2文字付けられる。
平均で「ハングル1文字 = ひらがな 1.5文字」くらいの感じか?
漢字ほどじゃないけどアルファベットに比べれば随分多いんじゃね。
Re: (スコア:0)
ハングル1文字は漢字1文字の読み仮名って考えると大体しっくりくる。例えば、ムン・ジェインは漢字で書くと「文在寅」で、「문재인」、パク・クネは「朴槿恵/박근혜」で、これらは全て字ごとに対応してる。
これを日本語で考えると、「佐藤」の「さとう」が2文字で、鈴木の「すずき」も2文字、って感じだから、ひらがな1.5文字でもいいが、「山」や「川」を「やま・サン」「かわ・セン」って読むことを考えると、読みがカナ一音節になる漢字は意外と少ないから、ハングル1文字の情報量は、大体カナの2文字分くらいあると思う。
Re: (スコア:0)
うん、むしろ「日本語、中国語、韓国語では(これまでどおりの)140文字までに制限している」状態だよね。
全角半角の判断はUnicode文字データベースを参照すればすぐわかる話なのでコーディング的には難しくない。
Re:日本語、中国語、韓国語以外 (スコア:1)
HALFWIDTH KATAKANAと
FULLWIDTH KATAKANAですねわかります。
#どっちもUTF-8では3オクテット。
Re: (スコア:0)
ほんとにツイートの文字を解析しているの?
最近は英語のネットユーザーも日本由来の全角顔文字を使うことがあるけど、使った瞬間に上限が280文字から140文字に下がっちゃうような仕様と大ブーイングが起きるだろうから、もし文字解析で決めているのなら、全角文字を何%以上使ってると日本語と認定するとかそういう仕組みが必要になる。
でも、そんなめんどくさいことしてんのかな。単にTwitterクライアントのUI言語設定を見て判断してるだけじゃないの。
Re: (スコア:0)
だって、特に日本人にはそういうおもちゃ渡すと…
…あえて書かなくても各自思い当たることがあるだろ?だろ?
Re: (スコア:0)
縛りがキツイ方が燃える奴も多いが。
Re: (スコア:0)
部門名♪部門名♫
Re: (スコア:0)
なるほど。手書きした文章を画像として出力できる入力方法か、連動するアプリがあればいいんだ。
Re: (スコア:0)
いやいや、全角も半角も1字だろ。
いつの時代の話をしてるんだ。