PDIC/Unicode会議室
HOME
HELP
新規メッセージ
新着記事
ツリー表示
スレッド表示
トピック表示
発言ランク
検索
過去ログ
[スレッド内全10レス(ResNo.5-9 表示)] 全ページ数 / [
0
] [
1
] [
2
]
■163
/ ResNo.5)
Re[5]: 「和英辞書の作成」でフリーズ
□投稿者/ かずお
4回-(2004/04/09(Fri) 14:36:19)
ありがとうございます。
早速やってみました。
変換は、無事完了しましたが、「行く」という意味の韓国語「カダ」の「カ」(フト ← こんな感じのハングル) や「~に」という意味の韓国語「エ」(o-11 ← こんな感じのハングル) など、いくつかの文字が消えてしまっています。和英変換の時に、削除のオプションはチェックしなかったので、それが原因ではないと思います。特定の文字だけが全て落ちてしまうというのは、何が原因なのでしょうか?
何はともあれ、希望が見えてきました。(^^)
→ メール受信=ON /
引用返信
/ チェック-
■164
/ ResNo.6)
Re[6]:ハングル語末に区切り文字ができるため
□投稿者/ BMH
3回-(2004/04/11(Sun) 09:03:16)
> 変換は、無事完了しましたが、「行く」という意味の韓国語「カダ」の「カ」(フト ← こんな感じのハングル) や「~に」という意味の韓国語「エ」(o-11 ← こんな感じのハングル) など、いくつかの文字が消えてしまっています。特定の文字だけが全て落ちてしまうというのは、何が原因なのでしょうか?
例示してくださったハングルのKAと0Eについてのエラーを再現してみました。
この2つのハングル文字は、PDIC/U版からPDIC/Win32版にPDIXで変換すると、それぞれKAは「ー。」に、0Eは「ソ。」になります。問題は語末にある場合です。見出語部の文字化けしているハングルの語末にある、どちらも日本語文字で言う半角の「マル句読点(。)」があって、韓日から「和英辞書の作成」ツールで日韓に変換する際に省かれてしまうことに原因があります。
従って、PDIXでPDIC/U版に戻し変換する際に、「MultiByte Error: [0xB0](或いは[0xBF]):[(日本語訳語)]とエラーメッセージが出て、辞書ファイルをPDIC/Uで閲覧すると上記の「語末にあるはずの」この2文字がないわけです。つまり、せっかく保持していた文字コードが日韓変換で欠損してしまうわけです。(この 0xB0 と 0x8F というコードはASCIIコード内の 0x80~0xFF という拡張部分に含まれるもので言語によって異なり、日本語文字セットでは、例えば上記の 0xB0 はUnicode16コードで言うと FF70 で音を延ばす意味に使う文字の半角の「ー」、0xBF は FF7F で半角の「ソ」ですが、ハングル文字セットではこの拡張部分のコードは単独では使われておらず、単独に入力或いはコードが存在しても表記できないことに、つまりハングル文字にすると「消える」、「ない」わけです。)
少なくとも例示のKAと0Eの場合に「和英辞書の作成」ツールで引き起こるマル句読点の削除は、PDICが語末にある句読点(, 、 。 ;)と全角スペースが「区切り文字」として認識するからで、ユーザーが設定を変更できないので、次の方法で対処するしかないようです。
* PDIC/Win32版上で見出部の語末にある半角のマル句読点のすぐ後ろに、【@】(@は半角・全角どちらでもよい)と書き入れ、「和英辞書作成」パネルの「詳細」の左下の「【@】カタカナ発音は削除する」だけをチェックオンにしてから変換を実行する。語末のマル句読点が残ります!!
このほかの方法も考えられますが、これが一番簡単なようです。これで語末のKAと0EについてはPDIXできれいにPDIC/U版に戻せます。
このほかの「消えた」文字については、上記の例を参考に、PDIXで変換後に出るエラーメッセージをメモして、どの文字が問題を起こしているか特定して対処みてください。
その際に、エラーメッセージに表示されている日本語訳語からハングルのどの文字に該当するか、また同じく表示されているコードをCP932.txtの中で検索するとUnicod16のコードが分かりますので、Windowsのアクセサリーの「文字コード表」においてコードで検索すると、この両方が合致するので特定できます。
状況によってはもうちょっと複雑で、別な条件が加わっている場合もあると思いますが少し落ち着いて探索して対処すると結構、段階的に少しずつエラーを回避できるようになれると思います。
どうぞ、お役に立てばさいわいです。
→ メール受信=OFF /
引用返信
/ チェック-
■165
/ ResNo.7)
Re[7]: :ハングル語末に区切り文字ができるため
□投稿者/ かずお
5回-(2004/04/11(Sun) 16:20:16)
素晴らしいお答えありがとうございました。m(__)m
> 少なくとも例示のKAと0Eの場合に「和英辞書の作成」ツールで引き起こるマル句読点の削除は、PDICが語末にある句読点(, 、 。 ;)と全角スペースが「区切り文字」として認識するからで、ユーザーが設定を変更できないので、次の方法で対処するしかないようです。
マル句読点が消えないオプションを設けるとか、TaNさんが対応して頂けると助かるのですが。。。
> * PDIC/Win32版上で見出部の語末にある半角のマル句読点のすぐ後ろに、【@】(@は半角・全角どちらでもよい)と書き入れ、「和英辞書作成」パネルの「詳細」の左下の「【@】カタカナ発音は削除する」だけをチェックオンにしてから変換を実行する。語末のマル句読点が残ります!!
Pdicに置換機能はないですよね。あると便利なのですが。量が多いので、一度、一行テキスト形式に書き出し、置換で@を入れ、Pdic形式に戻してから和英辞書作成をしました。マル句読点は残りましたが、@もなぜか残ってしまったので、また一行テキスト形式に書き出し、置換で@を削除して、Pdic形式に戻してから、unicode形式に変換しました。
結果、まだ一部文字化けはあるようですが、大部分はきちんと表示されています。この辞書は、公開予定ではありますが、一部の文字が落ちているかもしれない状態での公開はできないので、何か確実な方法があるとありがたいです。それでも、個人の実用としては十分な辞書ができましたので、感謝致します。ありがとうございました。m(__)m
→ メール受信=ON /
引用返信
/ チェック-
■166
/ ResNo.8)
Re[8]: :ハングル語末に区切り文字ができるため
□投稿者/ BMH
4回-(2004/04/12(Mon) 10:30:30)
> マル句読点が消えないオプションを設けるとか、TaNさんが対応して頂けると助かるのですが。
PDIC/Uはまだアルファ版という、ユーザーがPDIC/Win32を使い慣れていてかつ充分に使いこなせる人が自己責任において使うべきものです。なぜなら、辞書ファイルを破壊することがないとは言えない状態ですし、言語判別DLLがまだ実装されていないので、これまでの手順で所謂、韓日辞書の日韓変換をしたわけで、イレギュラーな対処方法です。そんなイレギュラーな使い方までフォローするようにプログラム作者に求めるのは酷ですよ。
> > * 見出部の語末にある半角のマル句読点のすぐ後ろに、【@】と書き入れ、「和英辞書作成」パネルの「詳細」の左下の「【@】カタカナ発音は削除する」だけをチェックオンにしてから変換を実行する。
> 置換で@を入れ、Pdic形式に戻してから和英辞書作成をしました。マル句読点は残りましたが、@もなぜか残ってしまったので、また一行テキスト形式に書き出し、置換で@を削除して...
私が書き入れるように指示したのは、【@】で、単に@ではありません。@だけ書き込んだのでは削除機能は実行されません。この程度のことに気がつかない、理解できないならば、PDIC/Uを使うよりは、まずPDIC/Win32を使いこなすことをお勧めしたいくらいです。
> Pdicに置換機能はないですよね。あると便利なのですが。
Fileメニューの「一括編集」の中にあります。PDICのヘルプでよくよく、PDICにはどんな機能があり、どのように使うのか、どのように活用できるのか、落ち着いて理解してください。それに、対処方法で語末のマル句読点の後に【@】を書き入れる作業は、「置換」では行えません。理由はゆっくりお考えくださいませ。
最後に、TaNさんのPersonal Dictionaryは通称でPDICと書き、Pdicとつづるべきではありません。
→
解決済み!
/ メール受信=OFF /
引用返信
/ チェック-
■167
/ ResNo.9)
Re[9]: :ハングル語末に区切り文字ができるため
□投稿者/ かずお
6回-(2004/04/12(Mon) 14:02:50)
こんにちは。
BMHさん、丁寧なご回答ありがとうございました。
> そんなイレギュラーな使い方までフォローするようにプログラム作者に求めるのは酷ですよ。
そうですね。すみませんでした。
> 私が書き入れるように指示したのは、【@】で、単に@ではありません。@だけ書き込んだのでは削除機能は実行されません。この程度のことに気がつかない、理解できないならば、PDIC/Uを使うよりは、まずPDIC/Win32を使いこなすことをお勧めしたいくらいです。
そうですね。言われたら理由も理解はできますが、おっしゃる通り、うっかりして気が付きませんでした。わざわざきちんと書いて頂いていたのに、私の不注意からお忙しい中、再度の書き込み、お手数かけて大変申し訳ございませんでした。
> 最後に、TaNさんのPersonal Dictionaryは通称でPDICと書き、Pdicとつづるべきではありません。
TaNさん、BMHさん、名前を間違えてしまって大変申し訳ございませんでした。私が書いたPdic unicode版も間違いで、PDIC/Unicode版ですね。大文字と小文字を間違えるべきではないというご意見、ありがとうございました。これからは十分、気を付けます。
BMHさんのご指摘の通り、現在、PDIC/Unicode版がアルファ版の状態ですので、韓国語辞書を公開するかどうかに関しても、もう一度、検討し直してみたいと思います。
BMHさん、丁寧にご回答ありがとうございました。
→
解決済み!
/ メール受信=OFF /
引用返信
/ チェック-
チェック記事を
編集
削除
削除キー/
このスレッドをツリーで一括表示
<前のレス5件
次のレス5件>
このスレッドの全ページ数 / [
0
] [
1
] [
2
]
このスレッドに書きこむ
ご質問される場合はまず
こちらをよく読んでください!
Name
/
E-Mail
/
└> 関連するレス記事をメールで受信しますか?
NO
YES
/ アドレス
非公開
公開
Title
/
URL
/
Comment/ 通常モード->
図表モード->
(適当に改行を入れて下さい)
> > 変換は、無事完了しましたが、「行く」という意味の韓国語「カダ」の「カ」(フト ← こんな感じのハングル) や「~に」という意味の韓国語「エ」(o-11 ← こんな感じのハングル) など、いくつかの文字が消えてしまっています。特定の文字だけが全て落ちてしまうというのは、何が原因なのでしょうか? > > 例示してくださったハングルのKAと0Eについてのエラーを再現してみました。 > この2つのハングル文字は、PDIC/U版からPDIC/Win32版にPDIXで変換すると、それぞれKAは「ー。」に、0Eは「ソ。」になります。問題は語末にある場合です。見出語部の文字化けしているハングルの語末にある、どちらも日本語文字で言う半角の「マル句読点(。)」があって、韓日から「和英辞書の作成」ツールで日韓に変換する際に省かれてしまうことに原因があります。 > > 従って、PDIXでPDIC/U版に戻し変換する際に、「MultiByte Error: [0xB0](或いは[0xBF]):[(日本語訳語)]とエラーメッセージが出て、辞書ファイルをPDIC/Uで閲覧すると上記の「語末にあるはずの」この2文字がないわけです。つまり、せっかく保持していた文字コードが日韓変換で欠損してしまうわけです。(この 0xB0 と 0x8F というコードはASCIIコード内の 0x80~0xFF という拡張部分に含まれるもので言語によって異なり、日本語文字セットでは、例えば上記の 0xB0 はUnicode16コードで言うと FF70 で音を延ばす意味に使う文字の半角の「ー」、0xBF は FF7F で半角の「ソ」ですが、ハングル文字セットではこの拡張部分のコードは単独では使われておらず、単独に入力或いはコードが存在しても表記できないことに、つまりハングル文字にすると「消える」、「ない」わけです。) > > 少なくとも例示のKAと0Eの場合に「和英辞書の作成」ツールで引き起こるマル句読点の削除は、PDICが語末にある句読点(, 、 。 ;)と全角スペースが「区切り文字」として認識するからで、ユーザーが設定を変更できないので、次の方法で対処するしかないようです。 > > * PDIC/Win32版上で見出部の語末にある半角のマル句読点のすぐ後ろに、【@】(@は半角・全角どちらでもよい)と書き入れ、「和英辞書作成」パネルの「詳細」の左下の「【@】カタカナ発音は削除する」だけをチェックオンにしてから変換を実行する。語末のマル句読点が残ります!! > > このほかの方法も考えられますが、これが一番簡単なようです。これで語末のKAと0EについてはPDIXできれいにPDIC/U版に戻せます。 > > このほかの「消えた」文字については、上記の例を参考に、PDIXで変換後に出るエラーメッセージをメモして、どの文字が問題を起こしているか特定して対処みてください。 > その際に、エラーメッセージに表示されている日本語訳語からハングルのどの文字に該当するか、また同じく表示されているコードをCP932.txtの中で検索するとUnicod16のコードが分かりますので、Windowsのアクセサリーの「文字コード表」においてコードで検索すると、この両方が合致するので特定できます。 > 状況によってはもうちょっと複雑で、別な条件が加わっている場合もあると思いますが少し落ち着いて探索して対処すると結構、段階的に少しずつエラーを回避できるようになれると思います。 > どうぞ、お役に立てばさいわいです。
解決済み!
BOX
解決したらチェックしてください! 解決理由も必ず記入してください。
削除キー
/
(半角8文字以内)
□ 書きこむ際の注意
ご質問される場合はまず
こちらをよく読んでください!
この掲示板はタグを利用できます。
名前、コメントは必須記入項目
です。記入漏れはエラーになります。
URLは自動的にリンクされます。
削除キー
を覚えておくと、
自分の記事の編集・削除
ができます。
Pass/
HOME
HELP
新規メッセージ
新着記事
ツリー表示
スレッド表示
トピック表示
発言ランク
検索
過去ログ
-
Child Tree
-
Powered by CJ Club