PDIC/Unicode会議室

HOME HELP 新規メッセージ 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

[160]  「和英辞書の作成」でフリーズ
□投稿者/ BMH 1回-(2004/03/26(Fri) 10:15:58)

     イタリア語辞書データファイルを作成しているBMHです。私の分かる範囲で考えて見ましょう。

    > 韓日辞書をPDIC Unicode版で作成しています。韓日辞書から日韓辞書を作成したいのですが、「和英辞書の作成」でやると、0%のままフリーズしてしまいます。

    -TaNさんが現行のPDIC/U(ver.0.56)の「正式版までの...」のところに明記しているように、まだ「言語判別DLL」が付属していないので、「和英辞書の作成」ツールではハングル文字を認識できないので、はっきり作成に入ることができません、つまりフリーズします。このDLLができるまで待つか、どなたか作ってくださるといいのですが(すいません、こう言ってる私もできません)。

    > PDIC一行テキスト形式に書き出して、日本語WindowsXP上で秀丸で開くと、文字化けせず表示できました。
    > >1. 韓国語と日本語訳を正規表現で入れ替えようとすると、置換後に韓国語部分が消えてしまいます。

    -ファイルの読み込み表示はできても、編集を施すとハングル文字を再表記できないということですので、おそらく秀丸がUTF-8としてBOCU1を読み込むことはできても、UTF-8そのものとして再表記できないのだろうと思います。BOCU1に対応しているテキスト・エディターの存在って?です。
     それで、秀丸で1行ファイルを開いてから、何も編集せずに、「別名で保存」(すいません、秀丸を使ってないので何と言ってるか)を選んで、別名をつけて、UTF-8を指定して一旦保存してから、そのファイルがPDIC/UでPDIC/U辞書ファイルに戻せるかどうか試してください。問題なく戻るようでしたら、日韓辞書を作成する方策がないわけではないです(もし、戻らないようでしたら別な方策を考えなくてはならないでしょう)。

    > >2. 複数のカンマで区切られている日本語訳(訳語部)のそれぞれを分けて見出しに登録することができません。

    -(もしテキスト・エディターでの編集が可能になるようでしたら)これを実現するのはやはり、PDICによるのが妥当かと思うので、日韓辞書作成のために次のような方策も考えられますので参考にしてください。

    1行テキストに変換してから、「ハングル文字」部分を「ローマ字変換」して、PDIC/U辞書ファイルに戻し、「和英辞書の作成」ツールで辞書を作成するのは可能と思われます。更に1行テキストに変換して、ローマ字から「ハングル文字」に戻して、PDIC辞書ファイルに戻します。
     このための、ハングル文字とローマ字を相互に変換するツールがフリーウェアであるようですので、試してみる価値はあります。ただし韓国語のためのコード方式が幾つも存在するようですので、変換ツールに合うかどうか。Web検索エンジンで「ハングル、ローマ字変換」でヒットしますので、そのツールを発見できると思います。

     全く別の方法として、PerlによればPDIC/U辞書ファイルのテキスト・ファイルやXMLファイルへの変換、多彩な正規表現による確実な抽出・置換など、つまり、1行テキスト形式での日韓辞書ファイルへの出力、PDIC/U辞書ファイルへの再変換の可能性はありますが、現行のPerl5.8がUTF-8には十分対応してますがBOCU1に対応できるかどうか確かめていませんので、ちょっと分からないところですし、可能となれば、他のプログラム言語ほど難しくないですが、多少時間をかけてスクリプトを自分を作成しなければならなくなるでしょう。
     その場合、Perlを活用している黒田さんの PDIC Toolkit (PDICwin32版に有効で、かつUTF-8テキストとXMLへの変換はギリシア語にだけ対応)がかなり参考になります。このキットは編集フリーですし、或る程度Perl言語を学ぶとこのキットを元にハングルにも対応できるツールにすることができる可能性は十分にあります。
    http://lambdapage.dhs.org/lexiko/tool-kit/pdic-toolkit.html

     どれも可能性が遠いとなると、やはりTaNさんがDLLを作ってくれるのを待つしかないようです。ほかにいいアイデアが出てきたらまたお知らせします。
  [メール受信/ON] 削除キー/

前の記事(元になった記事) 次の記事(この記事の返信)
←Re[1]: 「和英辞書の作成」でフリーズ /かずお →Re[3]: 「和英辞書の作成」でフリーズ /かずお
 
上記関連ツリー

Nomal 「和英辞書の作成」でフリーズ /かずお (04/03/23(Tue) 12:31) [158]
Nomal Re[1]: 「和英辞書の作成」でフリーズ /かずお (04/03/24(Wed) 12:48) [159]
  ┗Nomal Re[2]: 「和英辞書の作成」でフリーズ /BMH (04/03/26(Fri) 10:15) [160] ←Now
    ┗Nomal Re[3]: 「和英辞書の作成」でフリーズ /かずお (04/03/26(Fri) 18:07) [161]
      ┗Nomal Re[4]: 「和英辞書の作成」でフリーズ /BMH (04/04/09(Fri) 09:26) [162]
        ┗Nomal Re[5]: 「和英辞書の作成」でフリーズ /かずお (04/04/09(Fri) 14:36) [163]
          ┗Nomal Re[6]:ハングル語末に区切り文字ができるため /BMH (04/04/11(Sun) 09:03) [164]
            ┗Nomal Re[7]: :ハングル語末に区切り文字ができるため /かずお (04/04/11(Sun) 16:20) [165]
              ┗Nomal Re[8]: :ハングル語末に区切り文字ができるため /BMH (04/04/12(Mon) 10:30) [166] 解決済み!
                ┗Nomal Re[9]: :ハングル語末に区切り文字ができるため /かずお (04/04/12(Mon) 14:02) [167] 解決済み!

All 上記ツリーを一括表示 / 上記ツリーをトピック表示
 
上記の記事へ返信

□ 書きこむ際の注意
Pass/

HOME HELP 新規メッセージ 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

- Child Tree -
Powered by CJ Club