PDIC & DokoPop! 会議室

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

ログ内検索
・ キーワードを複数指定する場合は 半角スペース で区切ってください。
・ 検索条件は、(AND)=[A かつ B] (OR)=[A または B] となっています。
・ 過去ログから探す場合は過去ログを選択。

キーワード/ 検索条件 /
検索範囲/ 強調表示/ ON (自動リンクOFF)
結果表示件数/

No.879 の関連記事表示

全ページ数 / [0]
No.879/中辞郎作成について
■投稿者/ hikkoto -(2003/02/09(Sun) 12:56:40)

    以前より、中辞郎を作成しようとして、色々な情報を見てまいりました。しかしながら、パソコンの知識があまり無いので、Perlを使うと言われても、どうしたらよいのか分からず、かなり困惑して状況です。 皆さんお忙しい中、大変恐縮ですが、どなたか、私でも中辞郎を作成できるような、なにか良い方法があれば、御教授を頂けないでしょうか?何卒よろしくお願いいたします。
親記事 / 関連記事表示
削除チェック/

No.886/Re[1]: 中辞郎作成について
■投稿者/ Ted -(2003/02/11(Tue) 08:56:15)

    中辞郎って何ですかぁ?
記事No.879 のレス / 関連記事表示
削除チェック/

No.890/Re[2]: 中辞郎作成について
■投稿者/ 関根 -(2003/02/12(Wed) 09:26:15)
□ U R L/ http://tsekine.hp.infoseek.co.jp/

    英辞郎は巨大すぎてCFカードに入りきらないという人のために、人名や複
    合語を取り去ってサイズを小さくした(約1/3とか)のが中辞郎です。さら
    に小さくした小辞郎(こじろう)もあるようです。

    要はあまり使わないものを削除するわけですから、エディタでも不可能で
    はないでしょう。正規表現で「人名」「3語以上からなる単語」などを検
    索して行削除、これを希望のサイズになるまで繰り返せばいいわけです。

    Perlで、公開されたスクリプトを使うだけなら、インストール後DOS窓か
    ら1行入力するだけなのでもっと簡単だと(私は)思うのですが。インスト
    ール自体はPDICのそれと大差ないし、Downloadが面倒なのかな? だった
    ら何冊も出ているActivePerlのCD-ROM付き入門書の中でインストール方法
    が詳しく載っているものを入手すればいいのでは?

    そーゆー面倒な作業はいやだ、というのなら、大容量のCFカードにして英
    辞郎をまるっと((c)TRICK)入れましょう。256MBでも1万円ちょっとまで下
    がってきましたし。
記事No.879 のレス / 関連記事表示
削除チェック/

No.892/Re[3]: 中辞郎作成について
■投稿者/ ObaQ -(2003/02/12(Wed) 14:00:44)

    なるほど、英辞郎のデータを削って、中くらいのサイズにするってことですね。
    見出語を1単語だけに限定した小辞郎が昔ありましたが、英語学習や
    翻訳では、1単語だけの辞書では約に立たないですよね。
    2語以上組み合わさって、ぜんぜん違う意味になる言葉もあるしね。

    ここからは、データを絞り込みたい方々へのコメントです。

    もし、1単語だけにしぼりこむのなら、英辞郎のテキストファイルに
    対して、以下の処理をほどこせばOKです。(SEDを利用した場合)

    SED "/^■[^ ]+ [a-zA-Z]/d" EIJIRO52.TXT > KOJIRO.TXT

    固有名詞だけを除去するなら

    SED "/{[人地組書チ局]/d" EIJIRO52.TXT > KOJIRO.TXT

    これで、人名、地名、組織名、書名、チーム名が除去される。

    ポイントは;
    テキスト加工ツールをダウンロードして使い方を習得する。
    英辞郎のテキストファイルの構成をじっくり調べる。
    ということですね。


記事No.879 のレス / 関連記事表示
削除チェック/



全ページ数 / [0]

パスワード/

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

- Child Tree -