
Twitter、日本語/中国語/韓国語以外で文字数制限を緩和 42
ストーリー by hylom
いっぽう日本人は長文を画像化した 部門より
いっぽう日本人は長文を画像化した 部門より
backyarD 曰く、
Twitterの公式ブログで、日本語、中国語、韓国語以外の言語における投稿文字数制限を従来の140文字から280文字に緩和する実験を行うとのこと(Twitter公式ブログ、Engadget Japanese)。
言語特性や過去の投稿/文字数を調査したうえでの決定のようですが、やはり古参ユーザーの意見や見解を気にされているような文面。はたして結果はどうなるか、また、対象外となった3国のユーザーがどういう反応や意見を示すか、気になるところです。
なお、システム上では日本語でも280文字までの投稿がサポートされているようで、ブラウザ上でTwitterのWeb UIのコード等を書き換えることで140文字を超える投稿が行えるようだ。
一方で凍結祭りも開催中 (スコア:1)
また例によってアルファメンヘラソフトウェアエンジニア界隈が続々凍結されていて、問い合わせると凍結理由に5年以上前の「@piyo 殺す」みたいなツイートが上がってきたり、問い合わせた瞬間に一方的に永久凍結されたりするなんて話題になってますね。
常にどこかから理由もなく通報され続けているような伝統芸能化した集団があって、それらが例外ケースを順に全部踏み抜いて行った先が無人システムだと、そこに全部吸い込まれちゃうんでしょうね。
Re:一方で凍結祭りも開催中 (スコア:1)
言語設定を"英語"にしたらTwitterJPの一発凍結仕様からは逃れられるのではという仮説
https://togetter.com/li/1154205 [togetter.com]
沢山書いたらフォントサイズ縮小 (スコア:0)
140文字までは今まで通り。
それを越えたらフォントサイズ縮小。
って仕様にしてくれ。
Re: (スコア:0)
……なんの利点が?
Re:沢山書いたらフォントサイズ縮小 (スコア:1)
意外と悪くない。むしろ140文字オーバーした分はクリックしないと続きが見れないように
すれば完璧かもしれぬ。
280文字びっちり文字で埋め尽くされたTLを延々見るのはなんかヤだ。
Re: (スコア:0)
長文を書きたい人は好きにしてね。
その代わり読みづらくなるから、ちゃんと読んでもらえないかもね。
と言う事で今までの短文投稿のメリットを残しつつ、長文投稿にも対応。
Re: (スコア:0)
EXCELみたいだな…
もうUTF-8でバイト数制限にしちゃえば? (スコア:0)
だからさ、UnicodeでUTF-16でみんな幸せなんて幻想だったってことが、はっきりしたよね。
マルチバイト文字の思想の方が合理性があったってことだよ。意味量の少ない文字は情報量も少なく、意味量の多い文字は情報量も多い。これがあるべき文字コードの姿だ。
Twitterがやろうとしてることを真面目にやろうと思ったら、言語ごと、文字ごとに重さを定義して、総計が一定値を超えないように制限する感じになるよね。
簡便のために、UTF-8で420バイトまでって制限にしちゃえばいいんじゃないか?
Re: (スコア:0)
文字数制限には、データ領域の都合だけじゃなくて、GUIというか、見た目の都合もあると思うけど。
Re: (スコア:0)
じゃあTwitter標準フォントを定義して一定の長さまで許可にしますか?
それでもいいと思いますよ。
すべての文字が同じ重みを持つとする思想よりよほど健全だ。
Re: (スコア:0)
そういう変な仕様提案してくるのがクライアントにいると困るんだよねぇ...
Re: (スコア:0)
国旗絵文字(Regional Indicator Symbol)は8バイト必要だけどあれも情報量が多いって言えるのだろうか。
単に後から入った文字はいい位置を貰えなかっただけって気がする。
Re:日本語、中国語、韓国語以外 (スコア:2, おもしろおかしい)
31文字で十分ですよ。
Re:日本語、中国語、韓国語以外 (スコア:1)
そこは5-7-5-7-7で書いてほしかった(笑)
Re: (スコア:0)
No, thirty-one. Five, seven, five, seven, seven, thirty-one.
Re:日本語、中国語、韓国語以外 (スコア:1)
「17文字で十分ですよ」
Re: (スコア:0)
3行で頼む
Re:日本語、中国語、韓国語以外 (スコア:1)
Twitter サポートかどうか知らないけど、
アラビアとか、ヒンディーの文字幅は、固定長ではないのですが、、。
Re: (スコア:0)
日本語と中国語は表意文字と表音文字の組み合わせですから、
140字でもアルファベットよりはたくさんの情報が詰め込めるのでしょうが、
ハングルって表音文字ですよね。
2バイト文字だからって日本語や中国語と同じ扱いにされると、
ちょっと複雑なんじゃないかなあ。
Re:日本語、中国語、韓国語以外 (スコア:3)
ハングルは漢字の読みを1文字で表現する表音文字。いわば、発音記号を組み合わせて1文字にしてる。漢字と置き換えても字数は変わらないはず。そもそもハングルの字数自体も2000字以上あったはず。
Re:日本語、中国語、韓国語以外 (スコア:1)
ハングルは(数え方によるけど)1万文字以上あるやで。
Re: (スコア:0)
ハングルは実際には一文字を複数の文字に分解できるので…
Re: (スコア:0)
ハングルは実際には一文字を複数の文字に分解できるので…
だからなに?
Re: (スコア:0)
一文字で英単語一個分くらいの意味がある。或いは漢字一文字分の意味がある。
Re: (スコア:0)
そうなんですね
ただ経験的に、アプリのGUIの多言語化のときいつもハングルだけやたら長くなって嫌だったのだけど
翻訳者の力量がなかっただけかな?
Re: (スコア:0)
定番のHello Worldで調べると、( http://brian.hatenablog.jp/entry/hello-world [hatenablog.jp] )
英語:10文字、日本語:7文字、韓国語:5文字、中国語:4文字
だそうです
Re: (スコア:0)
文字の機能としてはあっても、韓国語として存在しない単語なら
別の表現にしなきゃいけないだろうし、そのせいで長くなってるんじゃ?
Re:日本語、中国語、韓国語以外 (スコア:1)
「今日は世界」 5文字です。
文字数で比較するにのひらがな表記はずるいです。
Re: (スコア:0)
「きょうは」となってしまうので、
「こんにちは」を漢字で書くのは一般的じゃ無いと思うんだ。
Re: (スコア:0)
「もしもし世界」
「オッス世界」
「やあ世界」
Re:日本語、中国語、韓国語以外 (スコア:1)
世界に乾杯
Re: (スコア:0)
少なくとも「1文字」が1音とは限らない。
たとえば「ロ|」みたいなので一音で、さらに下側に子音が1~2文字付けられる。
平均で「ハングル1文字 = ひらがな 1.5文字」くらいの感じか?
漢字ほどじゃないけどアルファベットに比べれば随分多いんじゃね。
Re: (スコア:0)
ハングル1文字は漢字1文字の読み仮名って考えると大体しっくりくる。例えば、ムン・ジェインは漢字で書くと「文在寅」で、「문재인」、パク・クネは「朴槿恵/박근혜」で、これらは全て字ごとに対応してる。
これを日本語で考えると、「佐藤」の「さとう」が2文字で、鈴木の「すずき」も2文字、って感じだから、ひらがな1.5文字でもいいが、「山」や「川」を「やま・サン」「かわ・セン」って読むことを考えると、読みがカナ一音節になる漢字は意外と少ないから、ハングル1文字の情報量は、大体カナの2文字分くらいあると思う。
Re: (スコア:0)
うん、むしろ「日本語、中国語、韓国語では(これまでどおりの)140文字までに制限している」状態だよね。
全角半角の判断はUnicode文字データベースを参照すればすぐわかる話なのでコーディング的には難しくない。
Re:日本語、中国語、韓国語以外 (スコア:1)
HALFWIDTH KATAKANAと
FULLWIDTH KATAKANAですねわかります。
#どっちもUTF-8では3オクテット。
Re: (スコア:0)
ほんとにツイートの文字を解析しているの?
最近は英語のネットユーザーも日本由来の全角顔文字を使うことがあるけど、使った瞬間に上限が280文字から140文字に下がっちゃうような仕様と大ブーイングが起きるだろうから、もし文字解析で決めているのなら、全角文字を何%以上使ってると日本語と認定するとかそういう仕組みが必要になる。
でも、そんなめんどくさいことしてんのかな。単にTwitterクライアントのUI言語設定を見て判断してるだけじゃないの。
Re: (スコア:0)
だって、特に日本人にはそういうおもちゃ渡すと…
…あえて書かなくても各自思い当たることがあるだろ?だろ?
Re: (スコア:0)
縛りがキツイ方が燃える奴も多いが。
Re: (スコア:0)
部門名♪部門名♫
Re: (スコア:0)
なるほど。手書きした文章を画像として出力できる入力方法か、連動するアプリがあればいいんだ。
Re: (スコア:0)
いやいや、全角も半角も1字だろ。
いつの時代の話をしてるんだ。