User:Suisui
Jump to navigation
Jump to search
- 英語版の漢字でのリストを見ていておもいついた2次利用用途
- かな漢字変換辞書の基礎データ
- 形態素解析の基礎データ
- 翻訳ソフト用の基礎データ
そのまま使うよりも、フォーマットを思い切り統一してダンプを別のところに利用するほうが日本語的には価値がありそう。多言語辞書になってるのを分割するのはそんなに手間じゃないはず。
まずは目指せ英辞郎、あれってデータはフリー? コーパス関連の人がくるといいかも。
現状の英語版と同様のやり方だと辞書としてはつらいかも。? 攻め方としては名詞、副詞、動詞がいいような。
メモ
- 他言語版のinterlanguageにあるf,mは女性、男性日本語は常になし。名前のみ。
あ い う え お か き く け こ
さ し す せ そ た ち つ て と
な に ぬ ね の ま み む め も
や ゆ よ わ を ん