PDIC/Unicode会議室
HOME
HELP
新規作成
新着記事
ツリー表示
スレッド表示
トピック表示
発言ランク
検索
過去ログ
ログ内検索
・ キーワードを複数指定する場合は 半角スペース で区切ってください。
・ 検索条件は、(AND)=[A かつ B] (OR)=[A または B] となっています。
・ 過去ログから探す場合は過去ログを選択。
キーワード
/
検索条件
/
(AND)
(OR)
検索範囲
/
(現在のログ)
(過去ログ1)
(過去ログ2)
強調表示
/
ON
(自動リンクOFF)
結果表示件数
/
20件
30件
40件
50件
No.879 の関連記事表示
ヒット / 4件
(1-4 を表示)
全ページ数 / [
0
]
No.879/中辞郎作成について
■投稿者/ hikkoto -
(2003/02/09(Sun) 12:56:40)
以前より、中辞郎を作成しようとして、色々な情報を見てまいりました。しかしながら、パソコンの知識があまり無いので、Perlを使うと言われても、どうしたらよいのか分からず、かなり困惑して状況です。 皆さんお忙しい中、大変恐縮ですが、どなたか、私でも中辞郎を作成できるような、なにか良い方法があれば、御教授を頂けないでしょうか?何卒よろしくお願いいたします。
親記事 /
関連記事表示
削除チェック/
No.886/Re[1]: 中辞郎作成について
■投稿者/ Ted -
(2003/02/11(Tue) 08:56:15)
中辞郎って何ですかぁ?
記事No.879 のレス /
関連記事表示
削除チェック/
No.890/Re[2]: 中辞郎作成について
■投稿者/ 関根 -
(2003/02/12(Wed) 09:26:15)
□ U R L/
http://tsekine.hp.infoseek.co.jp/
英辞郎は巨大すぎてCFカードに入りきらないという人のために、人名や複
合語を取り去ってサイズを小さくした(約1/3とか)のが中辞郎です。さら
に小さくした小辞郎(こじろう)もあるようです。
要はあまり使わないものを削除するわけですから、エディタでも不可能で
はないでしょう。正規表現で「人名」「3語以上からなる単語」などを検
索して行削除、これを希望のサイズになるまで繰り返せばいいわけです。
Perlで、公開されたスクリプトを使うだけなら、インストール後DOS窓か
ら1行入力するだけなのでもっと簡単だと(私は)思うのですが。インスト
ール自体はPDICのそれと大差ないし、Downloadが面倒なのかな? だった
ら何冊も出ているActivePerlのCD-ROM付き入門書の中でインストール方法
が詳しく載っているものを入手すればいいのでは?
そーゆー面倒な作業はいやだ、というのなら、大容量のCFカードにして英
辞郎をまるっと((c)TRICK)入れましょう。256MBでも1万円ちょっとまで下
がってきましたし。
記事No.879 のレス /
関連記事表示
削除チェック/
No.892/Re[3]: 中辞郎作成について
■投稿者/ ObaQ -
(2003/02/12(Wed) 14:00:44)
なるほど、英辞郎のデータを削って、中くらいのサイズにするってことですね。
見出語を1単語だけに限定した小辞郎が昔ありましたが、英語学習や
翻訳では、1単語だけの辞書では約に立たないですよね。
2語以上組み合わさって、ぜんぜん違う意味になる言葉もあるしね。
ここからは、データを絞り込みたい方々へのコメントです。
もし、1単語だけにしぼりこむのなら、英辞郎のテキストファイルに
対して、以下の処理をほどこせばOKです。(SEDを利用した場合)
SED "/^■[^ ]+ [a-zA-Z]/d" EIJIRO52.TXT > KOJIRO.TXT
固有名詞だけを除去するなら
SED "/{[人地組書チ局]/d" EIJIRO52.TXT > KOJIRO.TXT
これで、人名、地名、組織名、書名、チーム名が除去される。
ポイントは;
テキスト加工ツールをダウンロードして使い方を習得する。
英辞郎のテキストファイルの構成をじっくり調べる。
ということですね。
記事No.879 のレス /
関連記事表示
削除チェック/
全ページ数 / [
0
]
パスワード/
HOME
HELP
新規作成
新着記事
ツリー表示
スレッド表示
トピック表示
発言ランク
検索
過去ログ
-
Child Tree
-