ホーム

日本語入力システム用はてなキーワード変換辞書・ニコニコ大百科変換辞書

サポート掲示板

はじめに

はてなキーワードニコニコ大百科を日本語入力システムに登録する辞書ファイルです。
毎日0時頃(GMT+9)に巡回し、必要があれば更新します。

最終更新日時

はてなキーワード
ニコニコ大百科

ダウンロード

「固有名詞」にすると、変換辞書として使った場合に変換を阻害しやすくなります。
「サジェスト」はGoogle日本語入力・Google日本語入力(Android)でのみ有効で、それ以外は「固有名詞」と同じ扱いになります。

郵便番号データの地名と重複しているデータの扱いを指定します。
該当するデータは内蔵辞書に登録されている可能性が高いため、除去することで変換効率の低下や辞書の肥大化を防ぐことができます。

NAIST Japanese Dictionaryと重複しているデータの扱いを指定します。
該当するデータは内蔵辞書に登録されている可能性が高いため、除去することで変換効率の低下や辞書の肥大化を防ぐことができます。

日本語入力システムによっては変換時にコメントが表示されます。
Google日本語入力(Android)では「あり」を選択しても「なし」と同じ扱いになります。

MS-IME互換はMS-IMEのユーザー辞書・ATOKのユーザー辞書・ATOKのサジェスト・Google日本語入力(PC版)のユーザー辞書などにインポートできます。

FAQ

はてなキーワードとニコニコ大百科の重複単語数はどれくらいですか?
2013/08/14時点では、概ね10%程度です。
登録に時間がかかります
日本語入力システムによっては、対象のユーザ辞書と本テキストファイルをRAMディスクに置いて登録することで、大幅に高速化できます。
Android版のATOKにインポートできません
Android版のATOKは登録可能容量が32KBしかないため、全データを登録できません。
そのため、Android版のATOKで使えるデータは扱っていません。
ATOK Sync経由でAndroid版のATOKに登録できません
Android版のATOKはATOK Sync経由でも1MB(約2.5万語)しか登録できないため、全データを登録できません。
Android版のGoogle日本語入力でうまく動きません
OSバージョンが古すぎるか、メモリが少なすぎます。
どの日本語入力システムでどの出力形式を使えばいいですか?
新しい辞書にインポートすることをおすすめします。
IME出力形式備考
MS-IMEMS-IME互換新しくユーザー辞書を作ってシステム辞書化することをおすすめします。
ATOK(パソコン版)MS-IME互換新しくユーザー辞書を作ってシステム辞書化することをおすすめします。
Google日本語入力(パソコン版)Google日本語入力(PC)
ATOK(Android版)非対応容量不足
Google日本語入力(Android版)Google日本語入力(Android)1つずつ新しい辞書にインポートして下さい。
simeji非対応容量不足

ほとんどの日本語入力システムはMS-IME互換をインポートできます。
Google日本語入力(パソコン版)でもMS-IME互換をインポートできますが、サジェストを使う場合はGoogle日本語入力(PC)を使う必要があります。

使い方

  • ZIPファイルをダウンロードして解凍し、中に入っているファイルを日本語入力システムにインポートしてください。
  • 後から削除する時のため、メインのユーザ辞書と分けることをおすすめします。
  • 登録単語は増減します。
    新たな単語が登録されるだけでなく、間違った単語が修正される事もあるため、たまに全削除→再登録で更新することをおすすめします。

データの仕様について

  • 品詞を「固有名詞」にしてあります。
  • 「よみがな」の「ゎ」「ゐ」「ゑ」はそれぞれ「わ」「い」「え」に変換してあります。
  • 以下のキーワードは削除してあります。
    「ふりがな」または「キーワード」が空
    登録できないため。
    「キーワード」に制御文字が含まれる
    制御文字は登録できないため。
    「リスト::」で始まる(はてなキーワード)
    変換辞書にふさわしくないため。
    「一覧」で終わる(ニコニコ大百科)
    変換辞書にふさわしくないため。
  • 以下のキーワードは「要注意データ」に分類してあります。
    「ふりがな」が16・32文字(はてなキーワード)
    「ふりがな」の上限は16・32文字であり、文字数が足りず不正確な読みであることが多いため。
    「ふりがな」が64文字(ニコニコ大百科)
    「ふりがな」の上限は64文字であり、文字数が足りず不正確な読みであることが多いため。
    「ふりがな」が「キーワード」より短い
    一般的な単語で変換前より変換後の方が長くなることはないため。
    「キーワード」が1文字
    内蔵辞書に登録されている可能性が高く、変換候補が上位に上がって変換の阻害になるため。
    「キーワード」に英数字・記号が含まれる(例:えむえすあいえむいー→MS-IME)
    そのまま打った方が速いと思われるため。
    「キーワード」に含まれる仮名文字が「ふりがな」に含まれていないか順序が間違っている(例:あじゅばんど→アジュバント)
    読みが間違っている可能性が高いため。

データの利用規約について

本サイトで生成されたデータの利用規約は、提供元の利用規約に基づきます。

意見・要望等について

サポート掲示板に書いて下さい。

更新履歴

2020/07/04
リスト::誤記がなくなっていたので削除。(はてなキーワード)
2013/08/23
「一覧」で終わるキーワードを削除するようにした。(ニコニコ大百科)
2013/08/16
「リスト::」で始まるキーワードを削除するようにした。(はてなキーワード)
「リスト::誤記」を含むキーワードに含まれるキーワードを削除するようにした。(はてなキーワード)
2013/08/15
日本の地名を分けるようにした。
2013/08/13
データ形式を細かくカスタマイズできるようにした。
2013/08/12
ニコニコ大百科を追加。
2013/08/10
はてなキーワードで「ふりがなが16文字以上の場合に要注意にする」という処理を「ふりがなが16文字・32文字の場合に要注意にする」に変更。