翻訳なんでも相談室 
メール配信サービスを開始 停止 e-mailアドレス

[記事表示に戻る] [ツリートップの表示に戻る]

◇┳お礼+ユーザー辞書関連質問-投稿者:みけ(10/22-22:57)No.1558
 ┗┳Re:お礼+ユーザー辞書関連質問-投稿者:佐藤信彦(10/23-10:31)No.1559
  ┗┳Re:お礼+ユーザー辞書関連質問-投稿者:kobay(10/23-22:13)No.1563
   ┗┳Re:お礼+ユーザー辞書関連質問-投稿者:みけ(10/23-22:50)No.1564
    ┣━訂正-投稿者:みけ(10/23-22:53)No.1565
    ┗┳Re:お礼+ユーザー辞書関連質問-投稿者:佐藤信彦(10/23-23:02)No.1566
     ┗┳Re:お礼+ユーザー辞書関連質問-投稿者:みけ(10/24-22:28)No.1583
      ┗┳Re:お礼+ユーザー辞書関連質問-投稿者:佐藤信彦(10/24-22:49)No.1585
       ┗━Re:お礼+ユーザー辞書関連質問-投稿者:kobay(10/24-22:59)No.1586


トップに戻る
お礼+ユーザー辞書関連質問みけ 155810/22-22:57

先日ユーザ辞書についての質問を投稿(この投稿の二つ下)しましたみけで
す。 皆さんのアドバイスをもとにして使いやすい方法を選択してみようと
思います。
そこで関連の質問ですが、オリジナルの辞書が紙である場合に、テキスト形
式への入力の手間を省くためにOMC(?)でしたか、スキャンしたファイル
をテキストに変換してくれるソフトを使おうと思っていますが、PDICを使っ
て辞書をつくるとしたら、変換されたテキストをそのまま使用できるでしょ
うか? また、OMCは時間の節約に役立つでしょうか(スキャンしたり編集
する手間を含めて・・)? 毎回質問ばかりですが、みなさんのアドバイス
をお待ちしております。 

トップに戻る
Re:お礼+ユーザー辞書関連質問佐藤信彦 E-mail URL155910/23-10:31
 記事番号1558へのコメント

佐藤信彦です。

みけさんは No.1558「お礼+ユーザー辞書関連質問」で書きました。
>そこで関連の質問ですが、オリジナルの辞書が紙である場合に、テキスト形
>式への入力の手間を省くためにOMC(?)でしたか、スキャンしたファイル
>をテキストに変換してくれるソフトを使おうと思っていますが

Optical Character Reader、OCRです。

>、PDICを使っ
>て辞書をつくるとしたら、変換されたテキストをそのまま使用できるでしょ
>うか?

PDICのヘルプを見ると、PDICが辞書として取り扱うことのできる
ファイル形式が詳しく説明されています。決して難しい形式では
ありませんので、まずはそれをお読みになってトライしてみましょう。
その上で疑問点を具体的に質問した方が、アドバイスもしやすく
なります。

運がよければOCR後のデータをそのままPDICで利用できることも
あるでしょう。一旦ファイルを加工しないと使えないこともあ
ります。

> また、OMCは時間の節約に役立つでしょうか(スキャンしたり編集
>する手間を含めて・・)?

そういったことも、

・紙データの量
・紙データ上の文書の書式
・お使いの方のスキル、環境

といったことによって答えは千差万別です。トライして、具体的な
問題へ落とし込まないと、なんとも言えません。


トップに戻る
Re:お礼+ユーザー辞書関連質問kobay E-mail 156310/23-22:13
 記事番号1559へのコメント

kobayです。

佐藤信彦さんは No.1559「Re:お礼+ユーザー辞書関連質問」で書きました。
>
> ・紙データの量
> ・紙データ上の文書の書式
> ・お使いの方のスキル、環境
>
OCRに限って[説明します。紙の英文テキストが1ページあるとします。
私がよく出会うマニュアルで、テキストデータがなくて、印刷物から英文テキスト
を入力するとき、A4で1ページ40行程度の英文を手で入力すると何分かかりますか


私はOCRではスキャナーから画像データを読みこむのに2分程度、OCRで\英文に変
換するのに約2分程度です。(セルロン400MHzのマシン Windows 98を使用)
若干誤りがあるので、Wordなどでスペルチェックを行います。あと目で確認します


テキストのデータができればあろはいろいろ必要なファイルフォーマットに変換し
て使います。OCRで紙の英文をテクストに取りこむには便利です。ではまた。


トップに戻る
Re:お礼+ユーザー辞書関連質問みけ 156410/23-22:50
 記事番号1563へのコメント

佐藤さん、KOBEYさんありがとうございました。 私のシステムで紙をテキスト化するには
やはり時間がかかりすぎるようです。(一枚をスキャンするだけで一分半:テキスト化し
たいファイルは300ページ以上あります。) 一気に電子辞書をつくることをあきらめ
て、KOBEYさんが前回の質問でおっしゃったように、PDICに追加していくという形ですすめ
て行こうと思います。


トップに戻る
訂正みけ 156510/23-22:53
 記事番号1564へのコメント

前回PDCIを言及されたのはMOさんでした。 失礼しました。

みけさんは No.1564「Re:お礼+ユーザー辞書関連質問」で書きました。
>佐藤さん、KOBEYさんありがとうございました。 私のシステムで紙をテキスト化するには
>やはり時間がかかりすぎるようです。(一枚をスキャンするだけで一分半:テキスト化し
>たいファイルは300ページ以上あります。) 一気に電子辞書をつくることをあきらめ
>て、KOBEYさんが前回の質問でおっしゃったように、PDICに追加していくという形ですすめ
>て行こうと思います。


トップに戻る
Re:お礼+ユーザー辞書関連質問佐藤信彦 E-mail URL156610/23-23:02
 記事番号1564へのコメント

佐藤信彦です。

もう結論を出してしまったようですが、気になるもので……

みけさんは No.1564「Re:お礼+ユーザー辞書関連質問」で書きました。
>佐藤さん、KOBEYさんありがとうございました。 私のシステムで紙をテキスト化するに

>やはり時間がかかりすぎるようです。(一枚をスキャンするだけで一分半:テキスト化し
>たいファイルは300ページ以上あります。)

1枚のスキャンに1分30秒、それをOCRにかけて、内容を確認して、というところまで
作業して5分程度でしょうか。1枚の内容を手で入力するのにはそれよりも相当短い
時間で入力できるのならば手入力することも良いでしょう。

ただし手入力の場合は、
・300枚もやると気が遠くなる:-)
・間違いが絶対にある
・最初から最後まで人間が介在する(OCRの場合、人間が介在する実時間は少ない)
という大きな欠点があります。こういった欠点を考えてもて入力する方が有利なの
でしょうか。

今後OCRしないと請け負えない翻訳業務をするかもしれません。その時のために、
今のうちにOCR作業を行なっていつでもできるようにしておく、ということは
駄目でしょうか。


トップに戻る
Re:お礼+ユーザー辞書関連質問みけ 158310/24-22:28
 記事番号1566へのコメント

佐藤さん、ご配慮感謝いたします。 前回PDICに入力してゆく方法に決めたことをご報告しましたが、
具体的には、一気に手書き辞書を電子化するのをあきらめて、手書きの辞書をひくごとに語句を逐一入
力してゆくことにしました。 全部制覇するには2,3年かかりそうですが、この方法だと語句の使わ
れる機械の種類などを注釈として入れられるので(機械関係の翻訳を専門にしています)、誤訳もふせ
げますし、自分の勉強にもなるので。 ちなみに私のスキャナーはオートフィードタイプではないの
で、1スキャンごとに紙の表裏をひっくりかえしたりする手間がかかります。 手入力だと必ず間違い
がでるいうご指摘もごもっともですが、今回の場合、オリジナルが手書きで間違いも含まれているの
で、その点を考えると載っている語句に一通り目をとおしたい気持ちもあります。しかし今後の仕事の
ためにOCRにもなれておくと良い、というご指摘もごもっともですから、次回仕事のあいたときにいく
つかスキャンしてみて、処理を試みてみようと思います。 先輩方のご意見は勉強になります。ありが
とうございました。

佐藤信彦さんは No.1566「Re:お礼+ユーザー辞書関連質問」で書きました。
>佐藤信彦です。
>
>もう結論を出してしまったようですが、気になるもので……
>
>みけさんは No.1564「Re:お礼+ユーザー辞書関連質問」で書きました。
>>佐藤さん、KOBEYさんありがとうございました。 私のシステムで紙をテキスト化するに
>は
>>やはり時間がかかりすぎるようです。(一枚をスキャンするだけで一分半:テキスト化し
>>たいファイルは300ページ以上あります。)
>
>1枚のスキャンに1分30秒、それをOCRにかけて、内容を確認して、というところまで
>作業して5分程度でしょうか。1枚の内容を手で入力するのにはそれよりも相当短い
>時間で入力できるのならば手入力することも良いでしょう。
>
>ただし手入力の場合は、
>・300枚もやると気が遠くなる:-)
>・間違いが絶対にある
>・最初から最後まで人間が介在する(OCRの場合、人間が介在する実時間は少ない)
>という大きな欠点があります。こういった欠点を考えてもて入力する方が有利なの
>でしょうか。
>
>今後OCRしないと請け負えない翻訳業務をするかもしれません。その時のために、
>今のうちにOCR作業を行なっていつでもできるようにしておく、ということは
>駄目でしょうか。
>
>


トップに戻る
Re:お礼+ユーザー辞書関連質問佐藤信彦 E-mail URL158510/24-22:49
 記事番号1583へのコメント

佐藤信彦です。

みけさんが手入力を選んだ理由を説明してくださり、よく理解できました。
なにか蒸し返すようなことをしてしまい、申し訳ありません。
膨大な量ですが、決して無駄にはならないはずですのでがんばってください。


トップに戻る
Re:お礼+ユーザー辞書関連質問kobay E-mail 158610/24-22:59
 記事番号1585へのコメント

佐藤信彦さんは No.1585「Re:お礼+ユーザー辞書関連質問」で書きました。
>佐藤信彦です。
>
>みけさんが手入力を選んだ理由を説明してくださり、よく理解できました。
>なにか蒸し返すようなことをしてしまい、申し訳ありません。
>膨大な量ですが、決して無駄にはならないはずですのでがんばってください。

PDICを使用して、これから辞書を引いた単語、調べた単語などをPDICに追加して
いくといいでしょう(英次郎の中にも入っている)、300ページの紙の辞書は機
会をみながら、考えたらいいでしょう。300ページのものをOCRを使用したことが
ない今の時点で考えたら、ちょっとできない時間を取られてしまいます。
いろいろなソフトやツールを使用して、素早く翻訳に役立つ環境の整備も仕事を
する時間の節約につながるのですから。