SJ3辞書公開

このサイトの管理人に何らかの形でSJ3の辞書が来たら公開されます。

不具合を取り除いた:SJ3融合辞書2

取り急ぎ提供します:SJ3解説のページで取り上げた辞書をマージしたものです。

2019-10-12 再構築

品詞タグの融合をやめて、sj3-egg>pubdic>visual+の優先順位で単語を登録
マージのやりかたを 品詞&&読み の違いで別けたので精度向上

10万を越える品詞があなたを支えます。

sj3-advance-dic-3.tar.gz

できたぜ!mecab-naist-jdic変換の増補辞書

mecab-naist-jdicの豊富な語句と品詞の正確な特定を活かした、
ついに名詞や豊富な地名も収録した、更に上のメイン辞書と異なる品詞だけを搭載し協調する、
sj3-naistdic-3.tar.gzが登場しました。

2019-09-13 なにか変換がおかしいと思っていたら辞書フォーマットの間違いが見つかって手修正に成功

何を忘れていたのかはbuild.shをよんでね

2019-10-02 辞書データを追加 なんと忘れていただけ 今まではファイル2と4が同じだったはず

2019-10-12 再構築 不具合のすくない、語句が多く、矛盾なくキレイな変換候補が出ます

シェルを駆使してデータプロセッシング(今どき?)し、手作業を減らすことに成功
できなかったことができるようになりました。

この強化辞書の使い方

build.shを実行して、バイナリ辞書を作ってください。

強化辞書をおそらく/usr/local/var/sj3/dictにいれたら、
sj3のサーバーをとめ、
/usr/local/etc/sj3serv.luaを編集して強化辞書をよみこむようにして、
sj3サーバーが使っているユーザー辞書ディレクトリのファイルを全部消して再起動してください。
それは恐らく/usr/local/var/sj3/dict/user/(ユーザー名)/study.datのはずです。

参考 sj3serv.luaのsj3.append_opendictをこのようにふやしてみて



sj3.append_opendict {
   -- file: String
   --  main dictionaly name
   -- Note: this file is opened after chroot
   file = "NAIST3.dic",
}
sj3.append_opendict {
   -- file: String
   --  main dictionaly name
   -- Note: this file is opened after chroot
   file = "NAIST4.dic",
}
sj3.append_opendict { -- file: String -- main dictionaly name -- Note: this file is opened after chroot file = "NAIST1.dic", } sj3.append_opendict { -- file: String -- main dictionaly name -- Note: this file is opened after chroot file = "NAIST2.dic", }
sj3.append_opendict { -- file: String -- main dictionaly name -- Note: this file is opened after chroot file = "adic1.dic", } sj3.append_opendict { -- file: String -- main dictionaly name -- Note: this file is opened after chroot file = "adic2.dic", }

SJ3は、システム辞書ファイルが9万語しか入らないといいますけれど
実は最近のluaが使えるバージョンでは、同じディレクトリに2つ3つ増やせます。

それらに違う単語を登録。

複数の辞書に同じ単語が入っていると、候補ウィンドウも同じ言葉が複数出ます。

ご感想は、まで。(え、M$っていわないで)


SJ3強化辞書プロジェクト - トップページ - コンピュータ系

inserted by FC2 system inserted by FC2 system