PDIC & DokoPop! 会議室

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

ログ内検索
・ キーワードを複数指定する場合は 半角スペース で区切ってください。
・ 検索条件は、(AND)=[A かつ B] (OR)=[A または B] となっています。
・ 過去ログから探す場合は過去ログを選択。

キーワード/ 検索条件 /
検索範囲/ 強調表示/ ON (自動リンクOFF)
結果表示件数/

No.1143 の関連記事表示

全ページ数 / [0]
No.1143/英次郎txtをDOS用PDICに変換できない
■投稿者/ パンキー -(2003/06/25(Wed) 19:03:12)

    DOSのpdicで英次郎を使いたくて、eijiro63.txtをコンバートしようとしているのですが、
    ラージ辞書の上限が45万語までのためか、変換できません。

    試しに比較的小さいフリー辞書のgene.txtでやったところ、変換できました。
    どうにかして、英次郎をdos用に使うためのコンバート方法はありますか?
親記事 / 関連記事表示
削除チェック/

No.1144/Re[1]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ 関根 -(2003/06/26(Thu) 09:31:35)
□ U R L/ http://tsekine.hp.infoseek.co.jp/

    パンキー さん

    PDIC DOS版のドキュメントによると、ラージ辞書の登録は最大45万語、ま
    た辞書は7つまで同時に扱えるので、理論上45万語x7=315万語まで扱える、
    とあります。したがって英辞郎(100万語強)も複数に分割してマルチ辞書
    構成にすれば扱えるのではないでしょうか。試していませんが。
記事No.1143 のレス / 関連記事表示
削除チェック/

No.1150/Re[2]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ パンキー -(2003/07/01(Tue) 13:25:30)

    お礼送れましてすいません。関根さん。どうもresありがとうございます。

    じつは分割にまだ成功していません。
    PDIC付属のpdutyで分割しようとしているのですが、自動的に単語の「L」の前後で分割
    します。と言う表示がでてプロセスが進んでしまうので、7つに分割することが出来ません。
    ヘルプで探しているのですが、ちょっと見つけきれていない状況です。
    WIN版の方で分割しようかとも思ったのですが、こちらでもいまのところ成功してません。やはりふたつに分割しようと言う動作に入ってしまうので、、。
    pduty以外で分割する方法があるのでしょうね。きっと、、。
記事No.1143 のレス / 関連記事表示
削除チェック/

No.1153/Re[3]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ tsekine -(2003/07/01(Tue) 21:11:13)
□ U R L/ http://tsekine.hp.infoseek.co.jp/

    この手のやっつけ仕事は作ったほうが早いんじゃないかと。

    次のスクリプトで、perl bunkatsu.pl eijiroxx.txt とすれば、
    40万行ごとに分割した eiji1, eiji2, eiji3 を出力します(拡張子
    付けたほうが良かったかな?)。行数など適当に変えてやってみては?
    BASICやCでやるのもおしゃれかと。(^_^)

    [bunkatsu.pl]
    $GYOSUU = 400000;
    $FLNAME = "eiji";
    open(outf, ">" . $FLNAME . "1");
    while (<>) {
    if ($. % $GYOSUU == 0) {
    open(outf, ">" . $FLNAME . int($. / $GYOSUU + 1));
    }
    print outf $_;
    }
記事No.1143 のレス / 関連記事表示
削除チェック/

No.1162/Re[4]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ パンキー -(2003/07/04(Fri) 12:47:14)

    tsekineさん、どうもありがとうございます。
    perlはあまり使ったことなかったのですが、これなら出来そうです。
    ご丁寧にスクリプトをありがとうございました。

    早速やってみます。
    ありがとうございました。
記事No.1143 のレス / 関連記事表示
削除チェック/

No.1164/Re[5]: 英次郎txtをDOS用PDICに変換できない
■投稿者/ tsekine -(2003/07/04(Fri) 20:24:05)
□ U R L/ http://tsekine.hp.infoseek.co.jp/

    あ~、バグめっけ。(^_^;)

    あのままだとeiji1だけ指定行より1行少なくなります。大勢に影響はない
    けれど、ツッコミが入る前に直しておこうっと。

    正しくは、while文中のprint文をif文の前に持ってくる必要があります。
記事No.1143 のレス / 関連記事表示
削除チェック/



全ページ数 / [0]

パスワード/

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

- Child Tree -