![人工知能 人工知能](https://srad.jp/static/topics/ai_64.png)
Universal Dependencies 2.5がリリース 4
ストーリー by headless
解析 部門より
解析 部門より
yasuoka 曰く、
Universal Dependencies 2.5がリリースされた。
Universal Dependencies 2.5は90の言語にまたがるツリーバンクで、UDPipe・StanfordNLP・NLP-Cubeなどの解析エンジンと組み合わせて、係り受け解析に用いることができる。半年前のUniversal Dependences 2.4から、ボージュプリー語、コミ・ペルミャク語、リッヴィ・カレリア語、モルドビン語(モクシャ)、スコットランド・ゲール語、スコルト・サーミ語、スイス・ドイツ語が増えている。また、日本語ツリーバンクUD_Japanese-GSDはCC-BY-SAライセンスに変更された(NCが消えた)ので、商用利用も可能となった。古典中国語(漢文)ツリーバンクUD_Classical_Chinese-Kyotoともども、ぜひ言語解析に使ってほしい。
Re:1get!!!! (スコア:3, 参考になる)
開発者の関わった論文 [jst.go.jp]より:
Universal Dependencies (UD) ... は,言語間で共通のアノテーション方式を用いて多言語の構文構造コーパス(ツリーバンク)を開発する国際プロジェクトである.
中略
UD は全ての言語で共通のアノテーション方式を用いるため,異なる言語間の構文的対応関係が明示的に記述される.したがって,多言語構文解析器の開発,構文解析器を用いた多言語アプリケーションの処理の共通化 (Straka and Strakov ́a 2017),コーパスを用いた言語間比較 (Noji and Miyao 2015) などさまざまな研究開発に利用されており,
中略
日本語構文解析やその応用の研究を国際的な研究の俎上に載せ,国際的な研究の流れに取り残されないようにするためには,UD に基づく日本語コーパスの整備が必須である.
つまり、UD で日本語文法をしっかり記述→(中略)→機械翻訳が賢くなる→あなたは英語を勉強しなくてよくなる。
Re: (スコア:0)
Re: (スコア:0)
それは便利…便利かなぁ。
一応、日本人が千年以上繰り返してきた事業を自動化する偉大な発明、と言えなくもないんかね?
多少は似たようなことは既にできてただろうけど。
まぁ高校の授業から漢文や古文が省略されるようなことになれば偉大な発明と言っていいかな。
yasuokaさんはどんどん細かなどうでも良い方向に行ってた印象はあるけどここ数カ月は面白そうなツールの話をしてるね。
でも使うかって言えば使わん。