PDIC/Unicode会議室
HOME
HELP
新規作成
新着記事
ツリー表示
スレッド表示
トピック表示
発言ランク
検索
過去ログ
ログ内検索
・ キーワードを複数指定する場合は 半角スペース で区切ってください。
・ 検索条件は、(AND)=[A かつ B] (OR)=[A または B] となっています。
・ 過去ログから探す場合は過去ログを選択。
キーワード
/
検索条件
/
(AND)
(OR)
検索範囲
/
(現在のログ)
(過去ログ1)
(過去ログ2)
強調表示
/
ON
(自動リンクOFF)
結果表示件数
/
20件
30件
40件
50件
No.1143 の関連記事表示
ヒット / 6件
(1-6 を表示)
全ページ数 / [
0
]
No.1143/英次郎txtをDOS用PDICに変換できない
■投稿者/ パンキー -
(2003/06/25(Wed) 19:03:12)
DOSのpdicで英次郎を使いたくて、eijiro63.txtをコンバートしようとしているのですが、
ラージ辞書の上限が45万語までのためか、変換できません。
試しに比較的小さいフリー辞書のgene.txtでやったところ、変換できました。
どうにかして、英次郎をdos用に使うためのコンバート方法はありますか?
親記事 /
関連記事表示
削除チェック/
No.1144/Re[1]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ 関根 -
(2003/06/26(Thu) 09:31:35)
□ U R L/
http://tsekine.hp.infoseek.co.jp/
パンキー さん
PDIC DOS版のドキュメントによると、ラージ辞書の登録は最大45万語、ま
た辞書は7つまで同時に扱えるので、理論上45万語x7=315万語まで扱える、
とあります。したがって英辞郎(100万語強)も複数に分割してマルチ辞書
構成にすれば扱えるのではないでしょうか。試していませんが。
記事No.1143 のレス /
関連記事表示
削除チェック/
No.1150/Re[2]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ パンキー -
(2003/07/01(Tue) 13:25:30)
お礼送れましてすいません。関根さん。どうもresありがとうございます。
じつは分割にまだ成功していません。
PDIC付属のpdutyで分割しようとしているのですが、自動的に単語の「L」の前後で分割
します。と言う表示がでてプロセスが進んでしまうので、7つに分割することが出来ません。
ヘルプで探しているのですが、ちょっと見つけきれていない状況です。
WIN版の方で分割しようかとも思ったのですが、こちらでもいまのところ成功してません。やはりふたつに分割しようと言う動作に入ってしまうので、、。
pduty以外で分割する方法があるのでしょうね。きっと、、。
記事No.1143 のレス /
関連記事表示
削除チェック/
No.1153/Re[3]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ tsekine -
(2003/07/01(Tue) 21:11:13)
□ U R L/
http://tsekine.hp.infoseek.co.jp/
この手のやっつけ仕事は作ったほうが早いんじゃないかと。
次のスクリプトで、perl bunkatsu.pl eijiroxx.txt とすれば、
40万行ごとに分割した eiji1, eiji2, eiji3 を出力します(拡張子
付けたほうが良かったかな?)。行数など適当に変えてやってみては?
BASICやCでやるのもおしゃれかと。(^_^)
[bunkatsu.pl]
$GYOSUU = 400000;
$FLNAME = "eiji";
open(outf, ">" . $FLNAME . "1");
while (<>) {
if ($. % $GYOSUU == 0) {
open(outf, ">" . $FLNAME . int($. / $GYOSUU + 1));
}
print outf $_;
}
記事No.1143 のレス /
関連記事表示
削除チェック/
No.1162/Re[4]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ パンキー -
(2003/07/04(Fri) 12:47:14)
tsekineさん、どうもありがとうございます。
perlはあまり使ったことなかったのですが、これなら出来そうです。
ご丁寧にスクリプトをありがとうございました。
早速やってみます。
ありがとうございました。
記事No.1143 のレス /
関連記事表示
削除チェック/
No.1164/Re[5]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ tsekine -
(2003/07/04(Fri) 20:24:05)
□ U R L/
http://tsekine.hp.infoseek.co.jp/
あ~、バグめっけ。(^_^;)
あのままだとeiji1だけ指定行より1行少なくなります。大勢に影響はない
けれど、ツッコミが入る前に直しておこうっと。
正しくは、while文中のprint文をif文の前に持ってくる必要があります。
記事No.1143 のレス /
関連記事表示
削除チェック/
全ページ数 / [
0
]
パスワード/
HOME
HELP
新規作成
新着記事
ツリー表示
スレッド表示
トピック表示
発言ランク
検索
過去ログ
-
Child Tree
-