PDIC/Unicode会議室

HOME HELP 新規メッセージ 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

[スレッド内全10レス(親記事-ResNo.4 表示)] 全ページ数 / [0] [1] [2]

■158 / 親記事)  「和英辞書の作成」でフリーズ
    □投稿者/ かずお 1回-(2004/03/23(Tue) 12:31:53)

      韓日辞書をPdic unicode版で作成しています。韓日辞書から日韓辞書を作成したいのですが、「和英辞書の作成」でやると、0%のままフリーズしてしまいます。解決方法があれば、どうぞよろしくお願いします。

      仮にPdic unicode版上でできない場合、どんな方法でもいいので、同様のことが実現できる方法があれば、お願いします。一行テキスト形式に書き出してエディタで開くなど試してみましたが、日本語Windows上でも韓国語Windows上でも、文字化けします。

      また、unicode版にも是非「用例も登録する」を追加して下さい。お願いします。


    →親記事 / メール受信=ON / 引用返信 / チェック-

■159 / ResNo.1)  Re[1]: 「和英辞書の作成」でフリーズ
    □投稿者/ かずお 2回-(2004/03/24(Wed) 12:48:02)

      追加報告です。
      Pdic一行テキスト形式に書き出して、日本語WindowsXP上で秀丸で開くと、文字化けせず表示できました。ただ、問題が2つあります。

      1. 韓国語と日本語訳を正規表現で入れ替えようとすると、置換後に韓国語部分が消えてしまいます。
      2. それ以前の問題ですが、複数のカンマ区切りの日本語訳それぞれを分けて見出しに登録することができません。

      お願いします。


    → メール受信=ON / 引用返信 / チェック-

■160 / ResNo.2)  Re[2]: 「和英辞書の作成」でフリーズ
    □投稿者/ BMH 1回-(2004/03/26(Fri) 10:15:58)

       イタリア語辞書データファイルを作成しているBMHです。私の分かる範囲で考えて見ましょう。

      > 韓日辞書をPDIC Unicode版で作成しています。韓日辞書から日韓辞書を作成したいのですが、「和英辞書の作成」でやると、0%のままフリーズしてしまいます。

      -TaNさんが現行のPDIC/U(ver.0.56)の「正式版までの...」のところに明記しているように、まだ「言語判別DLL」が付属していないので、「和英辞書の作成」ツールではハングル文字を認識できないので、はっきり作成に入ることができません、つまりフリーズします。このDLLができるまで待つか、どなたか作ってくださるといいのですが(すいません、こう言ってる私もできません)。

      > PDIC一行テキスト形式に書き出して、日本語WindowsXP上で秀丸で開くと、文字化けせず表示できました。
      > >1. 韓国語と日本語訳を正規表現で入れ替えようとすると、置換後に韓国語部分が消えてしまいます。

      -ファイルの読み込み表示はできても、編集を施すとハングル文字を再表記できないということですので、おそらく秀丸がUTF-8としてBOCU1を読み込むことはできても、UTF-8そのものとして再表記できないのだろうと思います。BOCU1に対応しているテキスト・エディターの存在って?です。
       それで、秀丸で1行ファイルを開いてから、何も編集せずに、「別名で保存」(すいません、秀丸を使ってないので何と言ってるか)を選んで、別名をつけて、UTF-8を指定して一旦保存してから、そのファイルがPDIC/UでPDIC/U辞書ファイルに戻せるかどうか試してください。問題なく戻るようでしたら、日韓辞書を作成する方策がないわけではないです(もし、戻らないようでしたら別な方策を考えなくてはならないでしょう)。

      > >2. 複数のカンマで区切られている日本語訳(訳語部)のそれぞれを分けて見出しに登録することができません。

      -(もしテキスト・エディターでの編集が可能になるようでしたら)これを実現するのはやはり、PDICによるのが妥当かと思うので、日韓辞書作成のために次のような方策も考えられますので参考にしてください。

      1行テキストに変換してから、「ハングル文字」部分を「ローマ字変換」して、PDIC/U辞書ファイルに戻し、「和英辞書の作成」ツールで辞書を作成するのは可能と思われます。更に1行テキストに変換して、ローマ字から「ハングル文字」に戻して、PDIC辞書ファイルに戻します。
       このための、ハングル文字とローマ字を相互に変換するツールがフリーウェアであるようですので、試してみる価値はあります。ただし韓国語のためのコード方式が幾つも存在するようですので、変換ツールに合うかどうか。Web検索エンジンで「ハングル、ローマ字変換」でヒットしますので、そのツールを発見できると思います。

       全く別の方法として、PerlによればPDIC/U辞書ファイルのテキスト・ファイルやXMLファイルへの変換、多彩な正規表現による確実な抽出・置換など、つまり、1行テキスト形式での日韓辞書ファイルへの出力、PDIC/U辞書ファイルへの再変換の可能性はありますが、現行のPerl5.8がUTF-8には十分対応してますがBOCU1に対応できるかどうか確かめていませんので、ちょっと分からないところですし、可能となれば、他のプログラム言語ほど難しくないですが、多少時間をかけてスクリプトを自分を作成しなければならなくなるでしょう。
       その場合、Perlを活用している黒田さんの PDIC Toolkit (PDICwin32版に有効で、かつUTF-8テキストとXMLへの変換はギリシア語にだけ対応)がかなり参考になります。このキットは編集フリーですし、或る程度Perl言語を学ぶとこのキットを元にハングルにも対応できるツールにすることができる可能性は十分にあります。
      http://lambdapage.dhs.org/lexiko/tool-kit/pdic-toolkit.html

       どれも可能性が遠いとなると、やはりTaNさんがDLLを作ってくれるのを待つしかないようです。ほかにいいアイデアが出てきたらまたお知らせします。


    → メール受信=ON / 引用返信 / チェック-

■161 / ResNo.3)  Re[3]: 「和英辞書の作成」でフリーズ
    □投稿者/ かずお 3回-(2004/03/26(Fri) 18:07:02)

      丁寧なご回答ありがとうございました。
      Pdicで一行テキスト形式やcsv形式に書き出して、その書き出したファイルを読み込むことはできない(フリーズする)ようです。

      TaNさんがDLLを作ってくれるのを待つことにします。
      ありがとうございました。m(__)m


    → メール受信=OFF / 引用返信 / チェック-

■162 / ResNo.4)  Re[4]: 「和英辞書の作成」でフリーズ
    □投稿者/ BMH 2回-(2004/04/09(Fri) 09:26:36)

      希望はなくもないものですね。
      昔、何度か韓国に行った事があるのでほんの少し私も韓国語を習いましたので、ユニコード版の韓日辞書から日韓辞書をできるだけ簡単に作成できる道を、試してみました。訳語部などで日本語とハングルが混在していると面倒になりそうですが、ここでは見出部にハングル、訳語部に日本語だけという条件のもとに、手順を追って説明します。

      1)PDIC/Unicode版(v.056)用のPDIC辞書ファイル(BOCU)の韓日辞書(例えば KJ_U.dic とします)を、PDIX(v.030)を使ってPDIC/Win32用のPDIC辞書ファイル(例えば KJ_W32.dic )に変換します。この時、ハングル文字の見出部には CP949.txt テーブルを所定のサイトからDLして用い、訳語部には CP932.txt を用いてください。

      2)PDIC/Win32版上でこの KJ_W32.dic を開いても、多分ハングル部分はすべて、半角カタカナや漢字に文字化けしてます!!が、全く気にしないでください(ハングルを表記できないだけでハングルの文字セットのコードは保持されています)。

      3)Toolメニューの「"和英"辞書の作成(TaNさん、変えて欲しいよ、この名称...)」で「日韓辞書」(例えば JK_W32.dic)を作成します。(もし細かな編集が必要ならば、この後で1行テキストに変換して、少なくとも日本語部分に対してはできます、なぜなら、ハングルを文字化けしたカタカナで読むのは妙な感じですから)

      4)PDIXを使って、JK_W32.dic をPDIC/Unicode版用の JK_U.dic に変換します。この時、変換テーブルとして見出部には CP932.txt を、訳語部には CP949.txt を用いてください。これで PDIC/Unicode版で閲覧できる「日韓辞書」ができました。

      やってみたら意外と簡単にうまく行きましたヨ。実験に作った辞書ファイルは20項目ほどの見出しだったからかもしれませんが。安全のため辞書ファイルはバックアップをとってから、とにかく、やってみてください。


    → メール受信=OFF / 引用返信 / チェック-


次のレス5件>

このスレッドの全ページ数 / [0] [1] [2]

このスレッドに書きこむ

□ 書きこむ際の注意
Pass/

HOME HELP 新規メッセージ 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

- Child Tree -
Powered by CJ Club