PDIC & DokoPop! 会議室

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

ログ内検索
・ キーワードを複数指定する場合は 半角スペース で区切ってください。
・ 検索条件は、(AND)=[A かつ B] (OR)=[A または B] となっています。
・ 過去ログから探す場合は過去ログを選択。

キーワード/ 検索条件 /
検索範囲/ 強調表示/ ON (自動リンクOFF)
結果表示件数/

No.1046 の関連記事表示

全ページ数 / [0]
No.1046/非英語辞書の「一括編集処理」について
■投稿者/ がうきち -(2003/05/08(Thu) 11:37:09)

    Ver.4.63を最近試用し始めました。
    専門のドイツ語の辞書をいろいろ探して、
    TRTextという別のソフトウェア用の辞書を
    PDIC用に変換して使っています。

    ところがこの辞書は、ウムラウトをたとえばa^と書いています。
    PDICの辞書ツール>一括編集処理で、
    a^をウムラウト付きのaに置換しようと思っても、
    置換先のボックスにaウムラウトは入力できません
    (キーボードレイアウトを変えていても)。
    何かいい方法はありませんか。

    また、いったん上記の作業を試みた後、PDICを終了しようとすると
    「編集中のオブジェクトがあります。強制終了してよろしいですか?」
    というメッセージが出ます。OKを押しても該当メッセージが再度出るだけで、
    タスクマネージャから終了させるしかなくなってしまいます。
    これはどうしたらよろしいのでしょうか。

    上述の辞書は、辞書チェックをしても異常はみつかりませんし
    最適化もやってみました。
    当方、WinXP Home SP-1、MS-IME2002の環境です。
    詳しい方、お知恵を拝借願えませんでしょうか。
親記事 / 関連記事表示
削除チェック/

No.1047/追加
■投稿者/ がうきち -(2003/05/08(Thu) 11:49:50)

    追加説明です。
    置換先のボックスにaウムラウトを入力するために試してみたことは、

    1.キーボードレイアウトを入れ替えて直接入力
    2.Ctrl+KでPDIC側の機能を使っての入力
    3.テキストエディタで打っておいた文字をコピペ

    の三つです。
記事No.1046 のレス / 関連記事表示
削除チェック/

No.1049/Re[2]: 追加
■投稿者/ 関根 -(2003/05/09(Fri) 10:15:47)
□ U R L/ http://tsekine.hp.infoseek.co.jp/

    試してみましたが、たしかに入力できないようです。一括編集処理でも^K
    の特殊文字入力(と欧文文字?)を使えるのが自然でしょうね(と、それとな
    くリクエスト)。 > TaN

    で、毎度のPerl技ですが、いったんテキスト形式に落としたものを文字列
    変換し、再度PDICに読み込めばできます。aウムラウト(a¨)はSHIFT-JIS
    第1Byteらしいので、日本語対応エディタやJPerlだとちょっと難しいかも。
    お勧めはPerlです。
記事No.1046 のレス / 関連記事表示
削除チェック/

No.1051/Re[3]: 追加
■投稿者/ がうきち -(2003/05/09(Fri) 13:44:58)

    レス、ありがとうございます。感謝いたします。

    >いったんテキスト形式に落としたものを文字列
    >変換し、再度PDICに読み込めばできます。

    とは、.dicファイルをテキストに戻して置換をかけた上で、
    それを再び.dicに変換すると良い、という意味だと考えて、
    いろいろ試してみました。
    PCには素人でPerlも触ったことがないので、とりあえず、
    欧文文字がほぼフルに扱えるGreenPadというエディタで。

    やってみたのは、
    1.問題の.dicファイルをPDICの「辞書の変換」でテキストに戻す
    (一応、「PDICテキスト形式」と「一行テキスト形式」の二つを作りました)
    2.できた(二つの)テキストファイルをエディタで開いて置換を実行
    3.置換済のファイルを、以下の各種の文字コードで保存
     UTF-7, UTF-8, UTF-8N, UTF-16(LEかBEか、BOM有りか無しかで都合4つ)
     UTF-32(同じく4パターン), 日本語(EUC), 日本語(S-JIS), 日本語(ISO-2022-JP)
    4.2*14で結局28個のテキストファイルができたので、それをPDICで.dicに戻す

    ですが、文字化けなどでどれもうまくいきませんでした。
    見出し語はウムラウト含め正しく表示されているが、訳語の欄(MS明朝を指定)で
    文字化けが生じている場合がほとんどです。

    ひょっとして、私は何か根本的な勘違いをしているのでしょうか・・・・。
記事No.1046 のレス / 関連記事表示
削除チェック/

No.1054/Re[4]: 追加
■投稿者/ 関根 -(2003/05/09(Fri) 17:44:20)
□ U R L/ http://tsekine.hp.infoseek.co.jp/

    28個のテキストファイルとは、お疲れさまでした。

    がうきちさんの方法で合っています(1個作れば十分ですけど)。で、見出
    し語はOKとして、訳語で文字化けした所は独語の例文でしょうか。だとし
    たら、ある意味やむを得ない所で、たとえばaウムラウトを"@"で表すとし
    て、"ha^t"を"h@t"(こんな単語あるのか?)に変換したとき、見出しは欧文
    フォントなので正しく表示されるが、訳語のMS明朝では"@"がShift-JIS第
    1Byteにあたるため次の"t"といっしょになって"h舩"と表示されてしまう。
    そうかと言って欧文フォントにするのは日本語が読めなくなるのでできな
    いと。また、日本語部分でもそのように誤変換されることも無いとは言い
    切れません。

    もし、上のように訳語にも独語が多いのなら、妥協案として"a¨",a゛"な
    どに変換すれば、すべて同じフォントで、(それなりに)読めますけれど。

    "a¨"とかで妥協せず、見出し語と訳語で別のフォントを使うなら、見出し
    語と訳語で変換ルールを変えるかする必要がありますが、(J)Perlなら
    それが可能であると、とりあえず書いておきます。興味があれば、変換の
    具体例を示していただけばスクリプトを作ってみますけど。

    前回の訂正ですが、ちょっと勘違いしていました。その辞書がASCIIコー
    ド内で記述されている、つまり日本語エディタで文字化けせずに読めるの
    なら、日本語エディタやJPerlでも問題ありません。むしろ日本語部分で
    も化けるならこのほうが良いかも。

    要するにPDICではフォントに制約のあるのが問題なんですが、PDIC Unico
    rd版ならその制約が無くなるので究極の解決策になるかもしれません。と、
    自分は動かしていないのでとりあえず書いておきます。

    (内容てんこ盛りだけど外した感じするの、なんでだろ~)
記事No.1046 のレス / 関連記事表示
削除チェック/

No.1058/Re[5]: 追加
■投稿者/ がうきち -(2003/05/10(Sat) 10:56:11)

    重ね重ねのご回答、恐縮しております。
    テキストファイルに戻して置換をかけた後、
    ShiftJISで保存したのではウムラウトが落ちてしまうし、
    といって、常用しているUTF-8で保存すると
    その置換後のテキストファイルをPDICで.dicに変換する際にエラーが出るしで、
    他の文字コードならばどうなのかといろいろ試してみたのです。
    文字化けする訳語部分は、日本語の文字が並んでいます。
    訳語部分のフォントを、ArialUnicodeMSやPalatinoLinotypeのような
    守備範囲の広いものに変えても同じでした。

    示唆していただいたUnicode版のPDIC、使ってみました。
    こちらは、辞書の一括変換でウムラウト文字への置換ができるようです。
    (ただし私の環境では、置換途中に強制終了されてしまうことが多かったです)

    Unicode版PDICの開発が進むまでは、
    とりあえずScho^nheitって感じの表記で我慢することにします。
    ご親切な助言、ありがとうございます。

    追伸。WEBサイト、拝見しました。
    Perlというのを使えばいろんなことができるんですねえ。
    スクリプトって何じゃろ、というレベルの私にはよく分からないところも
    多かったのですが、DTONIC版の辞書も何冊かありますから、
    もう少しPCのことを勉強したあとで、
    ご提供いただいた資料を元にPDICで使ってやろう、などと思いました。
    その折にはまたよろしくお願いいたします。
記事No.1046 のレス / 関連記事表示
削除チェック/

No.1060/Re[6]: 追加
■投稿者/ 関根 -(2003/05/10(Sat) 20:06:51)
□ U R L/ http://tsekine.hp.infoseek.co.jp/

    あまりお役に立てなくて申し訳ありません。

    ひとつ、よくわからないのは、なぜUTF-8などで保存するのだろう、とい
    うことです。PDIC-Win32で扱えるのはASCII+SHIFT-JISですから、文字コ
    ードはそのままで、"a^"や"o^"を0xe4(ウムラウトの文字コード)などに置
    換したものを再度PDICに読み込ませればいいのではないでしょうか。その
    場合、日本語で"a^","o^"というのはSHIFT-JISではあり得ないので、日本
    語が化けることもないと思うのですが。(エディタで上の置換が可能かど
    うかは置いといて。)

    ということで。
記事No.1046 のレス / 関連記事表示
削除チェック/



全ページ数 / [0]

パスワード/

HOME HELP 新規作成 新着記事 ツリー表示 スレッド表示 トピック表示 発言ランク 検索 過去ログ

- Child Tree -