Home > BLOG Root

★Ken's Databank Project

Posted by Ken at August 28,2007



資料を溜め込む類の趣味をお持ちの方なら誰でも経験があるかと思うのですが、

「あ、アレなんだっけ?」

と調べ物をする時に自分の記憶だけを頼りに資料あさりをすることがあるかと思います。その時、うまく探すことが出来ればいいのですけど、なかなかお目当ての資料が出てこず、結局ネットで調べてしまったり・・・。そうなると何のための資料かわからなくなってしまいます。

そこで、私なりにひとつの解決策を考えてみました。

理想は紙媒体の文字列を全てテキストデータ化し、全文検索すること。そうすれば手持ちの資料をスミからスミまで有効活用できます。しかし、それには大変な労力がかかり、現実的ではありません。

・・・であれば、とりあえずは蔵書の目次をテキストデータ化して、それを検索に使ってしまおうと考えました。具体的には以下のとおりです。


【1.蔵書目次のテキストデータ化】

まず、一蔵書に付き、一テキストファイルを作成します。ページ数とコンテンツを一行にします。その際、

入力規則
1.英数はすべて半角とする
2.カタカナはすべて全角とする

情報価値付加(あくまでも自分のニーズに合わせたものを目指す)
1.大戦機 → ★
2.現用機 → ☆
3.歴史(技術史、通史) → □

のように表記を統一し、コンテンツをカテゴリ化します。航空ファンを例にすると下図のような形になります。




【2.同一フォルダにテキストファイルを格納】

1で作成したテキストファイルを雑誌毎、カテゴリごとのフォルダに放り込みます。


▲「航空ファン」フォルダ内のテキストファイル群(ここまでが下準備)。


【3.秀丸エディタのgrep検索を利用する】

現在プログラマに広く利用されている「秀丸」というテキストエディタを文字列検索に用います(「秀丸」というキーワードで検索をかけるとすぐに見つかります)。

秀丸をダウンロード後、インストールして準備完了です。秀丸を開き、検索メニューの「grepの実行・・・」をクリックすると検索ダイアログが表示されます。

そこで検索したい文字列を入力し、検索フォルダを指定してOKをクリック!



すると、上図のように新しいウィンドウが開き、検索結果を表示します。写真の例で言えば、「ミグ」でひっかかったコンテンツはこれだけ、ということになります。

その検索結果一覧を見て、航空ファン何月号の何ページにそれがある!とわかります。そうすると迷うことなくたくさんの資料の中から欲しい情報を取り出すことが出来るのです。

ケン流紙媒体有効活用のご提案、ということでざっとご説明してきましたが、我ながら実に泥臭く、稚拙な情報検索方法だと思っています。とりあえず将来的に自分のスキルが向上した時にも使える汎用性の高いテキストデータにはしてあるので今はこれでよいかな?なんて思っています。

実はこの紙媒体の資料検索方法は私の構想のほんの一部でしかなく、将来的には、「身の回りの事象の総データベース化」を考えております(おいおい)。

自分の構想に対し、自分のPCスキルが全然足りないのが歯がゆい限りですが、別に自分で作れなくてもいいものがあればどんどん組み合わせて利用していけばよいと考えています。

この途方もない、なかば頓挫することを宿命付けられている構想に名前を付けてみました。

Ken's Databank Project 略して KDP

(ダサイぞ)です。もっといい方法を知っているぞ!という方、よろしければご教示下さい(できればノンプログラミングで!)。

※本記事は旧ブログ「ダイキャストモデルの誘惑 Blog版」より転載したものです。
※友人Mくんからのアドバイス  
Category Tag: Topic
Permalink: http://blog.airmodel.jp/?eid=36
Page Top ▲