翻訳なんでも相談室 
メール配信サービスを開始 停止 e-mailアドレス

[記事表示に戻る] [ツリートップの表示に戻る]

◇┳OCRは実用可能ですか?-投稿者:MO(4/28-20:54)No.2272
 ┣┳Re:OCRは実用可能ですか?-投稿者:藤岡 裕(4/29-07:32)No.2274
 ┃┗━Re:OCRは実用可能ですか?-投稿者:フリー翻訳者(4/29-09:45)No.2275
 ┣━Re:OCRは実用可能ですか?-投稿者:Kent(4/29-23:09)No.2277
 ┣┳Re:OCRは実用可能ですか?-投稿者:ふりふり(4/30-00:39)No.2278
 ┃┗━Re:OCRは実用可能ですか?-投稿者:kobay(4/30-10:02)No.2279
 ┣━勝手に結論-投稿者:藤岡 裕(4/30-14:17)No.2280
 ┣┳スキャナーを買って来ました-投稿者:MO(4/30-17:34)No.2281
 ┃┗┳OCRソフトは?-投稿者:藤岡 裕(4/30-21:26)No.2285
 ┃ ┗┳Re:OCRソフトは?-投稿者:MO(4/30-21:41)No.2287
 ┃  ┗━Re:OCRソフトは?-投稿者:フリー翻訳者(5/1-09:15)No.2289
 ┣┳Re:OCRは実用可能ですか?-投稿者:やん(5/1-15:08)No.2291
 ┃┗┳Re:OCRは実用可能ですか?-投稿者:藤岡 裕(5/3-08:29)No.2302
 ┃ ┗━Re:OCRは実用可能ですか?-投稿者:やん(5/8-07:52)No.2317
 ┣┳お勧めOCR-投稿者:MO(5/8-21:54)No.2324
 ┃┣┳Re:お勧めOCR-投稿者:ワタナベ(5/8-22:06)No.2325
 ┃┃┗┳お勧めOCRのアドレス-投稿者:MO(5/8-23:13)No.2327
 ┃┃ ┣━もうひとつお試しOCRのアドレス-投稿者:MO(5/8-23:18)No.2328
 ┃┃ ┗┳Re:お勧めOCRのアドレス-投稿者:ワタナベ(5/11-16:46)No.2358
 ┃┃  ┗┳Re:お勧めOCRのアドレス-投稿者:ワタナベ(5/11-16:52)No.2359
 ┃┃   ┗┳Re:お勧めOCRのアドレス-投稿者:佐藤信彦(5/12-14:00)No.2363
 ┃┃    ┣┳Re:お勧めOCRのアドレス-投稿者:藤岡 裕(5/12-20:14)No.2364
 ┃┃    ┃┗┳Re:お勧めOCRのアドレス-投稿者:佐藤信彦(5/12-20:30)No.2365
 ┃┃    ┃ ┣━Re:お勧めOCRのアドレス-投稿者:ワタナベ(5/12-21:26)No.2366
 ┃┃    ┃ ┗┳Re:お勧めOCRのアドレス-投稿者:藤岡 裕(5/13-08:29)No.2367
 ┃┃    ┃  ┗━Re:お勧めOCRのアドレス-投稿者:佐藤信彦(5/13-11:53)No.2368
 ┃┃    ┗━Re:お勧めOCRのアドレス-投稿者:佐藤信彦(5/13-12:15)No.2369
 ┃┗━Re:お勧めOCR-投稿者:藤岡 裕(5/11-08:35)No.2354
 ┣━Re:OCRは実用可能ですか?-投稿者:通りすがり(5/9-20:55)No.2338
 ┗┳Re:OCRは実用可能ですか?-投稿者:びゃん(5/14-11:41)No.2372
  ┗┳Re:OCRは実用可能ですか?-投稿者:ワタナベ(5/14-16:48)No.2375
   ┗━Re:OCRは実用可能ですか?-投稿者:びゃん(5/14-21:04)No.2376


トップに戻る
OCRは実用可能ですか?MO 22724/28-20:54

こんにちは、

文書をOCRによって入力したいと思い家電量販店に行ったのですが、誤読が
多くて使い物にならないと言われました。そこで実際、利用されている方の
ご意見を聞かせて頂いてから判断しようと思っています。この掲示板の過去
ログによると、英語は良いが日本語の認識率が悪いということでした。あれ
から半年経っているので最近の情報を知りたいと思います。ちなみに富士通
のOCRのHPに行ってみると認識率が99.8%と書いてありました。
 それから、スキャナーの解像度は主に600dpi、1200dpiのものがあります
が、低解像度600dpiでも使用に耐えるでしょうか?

トップに戻る
Re:OCRは実用可能ですか?藤岡 裕 URL22744/29-07:32
 記事番号2272へのコメント

MOさんは No.2272「OCRは実用可能ですか?」で書きました。

>文書をOCRによって入力したいと思い家電量販店に行ったのですが、誤読が
>多くて使い物にならないと言われました。そこで実際、利用されている方の
>ご意見を聞かせて頂いてから判断しようと思っています。この掲示板の過去
>ログによると、英語は良いが日本語の認識率が悪いということでした。あれ
>から半年経っているので最近の情報を知りたいと思います。

半年で大幅に性能がアップするとは思えませんが...(^▽^;)。

実際のところはどうなんでしょうか。


トップに戻る
Re:OCRは実用可能ですか?フリー翻訳者 22754/29-09:45
 記事番号2274へのコメント

皆さん、こんにちは。
OCRソフトの性能について、下記の記事があります。
「英語の認識率は、充分に実用に耐えるレベルに達している。、、、一方、日本語の
 認識率は、お世辞にもいいとは言えません。現状では、日本語をOCR処理するのは
 現実的ではありません。それに、その後の処理、、、メリットはあまり
 ありません。」(実務翻訳を仕事にするー宝島社新書ー’01年4月)
 また、他のサイトでも、最近、同じコメントがありました。
私も、スキャナを死蔵していますが、OCRソフトは、模様眺めです。 


トップに戻る
Re:OCRは実用可能ですか?Kent 22774/29-23:09
 記事番号2272へのコメント

仕事(翻訳ではなく、本業の方で)でOCRを使う機会がありました。
1800dpiでOCRソフトもアップグレード版を使ったのですが、結果はあまり満足の行
くものではありませんでした。
私の得た結論は、「OCRの認識率を左右するのは、スキャナでもOCRソフトでもなく
、元原稿の状態である」ということです。コピーのコピーあたりから、かなり苦し
くなります。FAX原稿は問題外でしょう。
私が使う場合は、仕事は加味ベースでやっておいて、後の参考のためにテキスト化
したい場合のみ、時間があるときにゆっくりと(根気よく)OCRで読ませてます。

Kentでした。

MOさんは No.2272「OCRは実用可能ですか?」で書きました。
>こんにちは、
>
>文書をOCRによって入力したいと思い家電量販店に行ったのですが、誤読が
>多くて使い物にならないと言われました。そこで実際、利用されている方の
>ご意見を聞かせて頂いてから判断しようと思っています。この掲示板の過去
>ログによると、英語は良いが日本語の認識率が悪いということでした。あれ
>から半年経っているので最近の情報を知りたいと思います。ちなみに富士通
>のOCRのHPに行ってみると認識率が99.8%と書いてありました。
> それから、スキャナーの解像度は主に600dpi、1200dpiのものがあります
>が、低解像度600dpiでも使用に耐えるでしょうか?


トップに戻る
Re:OCRは実用可能ですか?ふりふり 22784/30-00:39
 記事番号2272へのコメント

OCRは非実用的というコメントが多いですね。

私の場合、OCRは手放せません。
確かに誤読は目立ちますが、原稿がテキストデータになっていると誤訳がダン
トツに減るので、多少手間はかかってもスキャン+OCRのデータを修正してから
翻訳に入ります。(翻訳能率も上がるので、時間的には結局紙から訳した時と
ほぼ変わらないか、それ以下です。)

ソフトはMac用 e-typistのVer. 6.0を使用しています。
スキャナーは600dpi対応のものですが、OCRソフトが300dpi以上のデータは受
付けないので、結局300dpiの環境です。

ご参考になれば・・・。


トップに戻る
Re:OCRは実用可能ですか?kobay 22794/30-10:02
 記事番号2278へのコメント

ふりふりさんは No.2278「Re:OCRは実用可能ですか?」で書きました。
>OCRは非実用的というコメントが多いですね。
>
>私の場合、OCRは手放せません。

私は結構使用しています。英文の紙ベースのものを翻訳するとき、
また、参考資料として、後の検索のためにテキスト化する必要のあるもの
また、紙ベースで購入した、業界に特化した英和資料を入力する際に
使用しています。

また日本語ベースのものは誤読がありますが、ゼロから自分でキーから入力
するよりも遙かに早いので多用しています。

みなさんの意見とは逆なので参考程度にしてください。


トップに戻る
勝手に結論藤岡 裕 URL22804/30-14:17
 記事番号2272へのコメント

MOさんは No.2272「OCRは実用可能ですか?」で書きました。

>文書をOCRによって入力したいと思い家電量販店に行ったのですが、誤読が
>多くて使い物にならないと言われました。そこで実際、利用されている方の
>ご意見を聞かせて頂いてから判断しようと思っています。

どうしても必要であれば使わざるを得ませんが、時間的に余裕があることと原
稿がかなり鮮明であることが条件となると言えそうですね。

なお、一見鮮明に見える原稿でも文字の輪郭ににじみがあると認識が困難にな
るケースがあります。ソフトウエアにもよりけりかと思いますが。


トップに戻る
スキャナーを買って来ましたMO 22814/30-17:34
 記事番号2272へのコメント

みなさんこんにちは。いろんな人の意見を聞くことができて大変参考になりまし
た。結局自分で試してみようとC社のスキャナーを買って来ました。そして早速、本
やパンフレットなど試しにOCRにかけてみましたが、かなりの精度で認識できるよう
です。正確に文字数を数えていませんが95%以上は正確に認識してくれます。
以下は写真入のパンフレットをOCRで認識させた例です。ここで誤認識したのは「一
一、山」で「三山」の誤りでした。縦書き原稿だったので「三」を「一一、」と認
識してしまったようです。他にも「誘拐」を「言秀キ男」などと認識し、笑わせて
くれました。他にも「1とi」など紛らわしい文字は誤り易い傾向にあるようです。
まだ買って来て数時間しか経っておらず、結論を出すには早すぎますが、OCRは結構
使えると実感しています。条件の厳しい原稿だと認識率はもっと落ちるでしょう
が、一から手で入力するよりはずっと効率が良いと思います。


@OCRサンプル(日光の観光パンフレットよりスキャン)
日光山輪王寺
天台宗一一、山のひとつであり、輪王寺の名は一山の総号である。創建は遠く奈良
時代に遡る。四月に行われる「強飯式」は日光修験の名残りを伝える古い儀式であ
る。

日光東照宮
徳川家康公の霊が祀られている。現在の絢燗豪華な東照宮に造り替えたのは、三代
将軍家光公で、当時の一流の建築家・工芸家が全国から集められ、技術の粋を尽く
した建造物が完成した。春と秋に行われる千人行列は、家康公の神枢が久能山から
日光へ遷座された時の行列を再現したものである。


トップに戻る
OCRソフトは?藤岡 裕 URL22854/30-21:26
 記事番号2281へのコメント

MOさんは No.2281「スキャナーを買って来ました」で書きました。

>結局自分で試してみようとC社のスキャナーを買って来ました。そして早速、本
>やパンフレットなど試しにOCRにかけてみましたが、かなりの精度で認識できるよう
>です。正確に文字数を数えていませんが95%以上は正確に認識してくれます。
>以下は写真入のパンフレットをOCRで認識させた例です。ここで誤認識したのは「一
>一、山」で「三山」の誤りでした。縦書き原稿だったので「三」を「一一、」と認
>識してしまったようです。他にも「誘拐」を「言秀キ男」などと認識し、笑わせて
>くれました。他にも「1とi」など紛らわしい文字は誤り易い傾向にあるようです。
>まだ買って来て数時間しか経っておらず、結論を出すには早すぎますが、OCRは結構
>使えると実感しています。条件の厳しい原稿だと認識率はもっと落ちるでしょう
>が、一から手で入力するよりはずっと効率が良いと思います。

OCRソフトの名称も書いて頂かないと話にならないとおもいますが(^▽^;)...





トップに戻る
Re:OCRソフトは?MO 22874/30-21:41
 記事番号2285へのコメント

OCRソフトは、スキャナーにバンドルされていたもので「e.Typistエントリー」です。


トップに戻る
Re:OCRソフトは?フリー翻訳者 22895/1-09:15
 記事番号2287へのコメント

MOさん、こんにちは。
日英の場合の使い勝手について、今後とも、序での時に、体験談をお知らせください。
大いに、参考になります。


トップに戻る
Re:OCRは実用可能ですか?やん 22915/1-15:08
 記事番号2272へのコメント

英文OCRはTextBridgeを使用していますが、このソフトはとても優秀です。
ファックスなどのけっこう劣化した原稿でも驚くほどちゃんと読みます。
不明瞭な字を前後から推測したりスペルチェックのようなことをしたりしてい
るようで、他のOCRソフトもそのようなことをしているのでしょうけれど、こ
のソフトはもともと英文専用のせいか、特に優れている感じがします。

このソフトは、もともとXEROX社のものですが、日本では、e.Typistと同じメ
ディアドライブ社が販売・サポートしています。e.Typistがこれと同じ認識エ
ンジンを使用しているかどうかは分かりませんが、e.Typistの上位にある
WinReaderの旧バージョンよりは優れているように思いました。


トップに戻る
Re:OCRは実用可能ですか?藤岡 裕 URL23025/3-08:29
 記事番号2291へのコメント

やんさんは No.2291「Re:OCRは実用可能ですか?」で書きました。

>英文OCRはTextBridgeを使用していますが、このソフトはとても優秀です。
>ファックスなどのけっこう劣化した原稿でも驚くほどちゃんと読みます。
>不明瞭な字を前後から推測したりスペルチェックのようなことをしたりしてい
>るようで、他のOCRソフトもそのようなことをしているのでしょうけれど、こ
>のソフトはもともと英文専用のせいか、特に優れている感じがします。

TextBridgeは評判が良いようですね。

ところで二年ほど前にもこのサイトで同じ質問をしたのですが、辞書データなど
英字と和字の混在した文書でかなりの精度で和英とも同時認識できるかどうかと
いう点はいかがでしょうか?

和英同時認識は無理だろうとおっしゃる方もいて、イマイチ実際のところがよく
わからないので模様眺めをやっているのですが...。


トップに戻る
Re:OCRは実用可能ですか?やん 23175/8-07:52
 記事番号2302へのコメント

藤岡さん、こんにちは。

和英字混在文書の認識は、しばらく前にいくつかのOCRを試しただけですが、ほとん
ど実用に耐える結果が得られず、その後使用していません。
TextBridgeでは、認識の段階で、文書画像をテキストブロックごとにフォントの識別
を行い、その絞り込んだフォントの文字スタイルから文字を判別しているようです。
なので、文書中に英字と和字が混在すると、フォントの選択肢が増えそれにより文字
候補が大幅に増えるわけで、文字の判別がかなり難しくなるのだろうと想像していま
す。このハードルはなかなか高そうです。

和英同時認識は、いまのところ差し迫った必要性がないのであまりつっこんで試して
ないのですが、認識精度がもっと高くなれば、データ化されていない辞典や資料のデ
ータベース作りや用語変換など、やりたいことはあるのですが。


トップに戻る
お勧めOCRMO 23245/8-21:54
 記事番号2272へのコメント

みなさんこんにちは。私のOCRについての質問に色々ご意見有り難うございました。
その後、「eTypist ver6」で和英混在文を読み取ることはできないことを知り、が
っかりしていました。和文には英単語や英文が混在することが良くあるし、辞書の
様な和英対訳文をどんどん取り込んで自前の電子辞書を作りたいと目論んでいたの
ですが、期待はずれでした。
 ところがPanasonicの「読み取り革命2001」をネット上で知り、試したとこ
ろ和英混在も問題なく読み取ることが判りました。このソフトはカスレやニジミに
も結構強く、認識率は高いです。体験版が1ヶ月の期限付きでダウンロードできるの
で、スキャナーをお持ちの方は是非お試し下さい。


トップに戻る
Re:お勧めOCRワタナベ E-mail URL23255/8-22:06
 記事番号2324へのコメント

MOさん、有益な情報ありがとうございます。

> 体験版が1ヶ月の期限付きでダウンロードできるの
> で、スキャナーをお持ちの方は是非お試し下さい。

さっそく体験版を利用してみたいと思ったのですが、パナソニックのページで探しても見
つけることができませんでした。

もしアドレスをご存知でしたら、教えていただけると助かるのですが…。
よろしくお願いいたします。


トップに戻る
お勧めOCRのアドレスMO 23275/8-23:13
 記事番号2325へのコメント

ワタナベさん、今晩は。

読み取り革命2001のお試し版のダウンロードアドレスです。試用されたらぜひとも感想を聞か
せてください。皆さんにも参考になると思います。

http://www2.panasonic-it.com/pcsoft/yomikaku/yomikaku.htm



トップに戻る
もうひとつお試しOCRのアドレスMO 23285/8-23:18
 記事番号2327へのコメント

もうひとつeTypist ver6のお試し版が下記のサイトからダウンロードできます。
こちらも試されると色々比較できて面白いと思います。

http://www.mediadrive.co.jp/katuji/download/w_index.html


トップに戻る
Re:お勧めOCRのアドレスワタナベ E-mail URL23585/11-16:46
 記事番号2327へのコメント

MOさんは No.2327「お勧めOCRのアドレス」で書きました。

>読み取り革命2001のお試し版のダウンロードアドレスです。試用されたらぜひとも感想を聞か
>せてください。皆さんにも参考になると思います。
>
>http://www2.panasonic-it.com/pcsoft/yomikaku/yomikaku.htm

MOさん、ありがとうございました。早速、ダウンロードして使用してみた所、その 革命的な 読み取り精度
に驚かされました。

これまで、eTypist 5.0 を使用してきたのですが、実用レベルでは 読取革命 のほうが認識率がはるかに
高い印象を受けました。

おそらく良質な原稿(例えばソフト付属のサンプル画像のようなもの)の認識については、両ソフトで優れ
た結果が得られる思うのですが、ちょっと質の悪い原稿になると、eTypist は そこそこ のレベルに落ちる
のに対し、読取革命 はかなりの品質を保ってくれます。

私が普段 OCR にかける原稿は、たいがい FAX 原稿か、そんなに質の良くないことも多々あるコピー原稿で
すので、この 読取革命 のタフさはとても頼りになると思います。

というわけで、ネットで即注文しちゃいました。
MOさん、ありがとうございました。

PS.
eTypist 6.0 体験版 はウチのマシンにうまくインストールできなかったので、試せませんでした。


トップに戻る
Re:お勧めOCRのアドレスワタナベ E-mail URL23595/11-16:52
 記事番号2358へのコメント

先ほどのコメントの補足ですが、今回、私が試してみたのは、
英文原稿についてのみです。日本語原稿、日英混在などについ
ては試しませんでした。


トップに戻る
Re:お勧めOCRのアドレス佐藤信彦 E-mail URL23635/12-14:00
 記事番号2359へのコメント

佐藤信彦です。

ワタナベさんは No.2359「Re:お勧めOCRのアドレス」で書きました。
>英文原稿についてのみです。日本語原稿、日英混在などについ

英語専用のOCRに関してはTextBridgeで完璧に満足できているので、
読み取り革命の体験版で日英混合文のOCR性能をテストしてみました。

僕のOCRの目的は、品質の悪い原稿の電子化ではなく雑誌上の情報の
電子化です。そのため、現在ほとんど手作業で自分の辞書に入力して
いる『通訳・翻訳ジャーナル』の「軍事用語のABC」をサンプルに
利用しました。

フォントサイズは6ポイントほどと、読み取り革命の認識可能な
最小フォント。英文は斜体になっているので、認識はちょっと辛い、
という条件でテストしました。そうそう、読み取り解像度は600dpi
にしました。以下のような結果です。数値化していない点はご了承
ください。

読み取り革命(日本語モード)
日本語部分の認識はほとんど問題なし。
英語部分の認識はお話にならない。

読み取り革命(英語モード)
日本語部分がほとんど認識できないのは当然と
しても、英語部分もほとんど駄目。

やっぱり日英混合文の認識は実用になりません。日本語だけの認識に
使うのならば、読み取り革命でもよいかもしれません。

比較のため同じ原稿の英語部分をTextBridgeで読み取ったところ、
ほぼ完璧に認識しました。英語OCRに関しては、TextBridge強し。

読み取り革命に少しだけ期待してたので、ちょっと残念。

ただし、このテストは雑誌の紙面をそのまま読み取ったものですので、
FAXやコピー原稿などノイズの多いもので試すとまた違った結果が
でるかもしれません。


トップに戻る
Re:お勧めOCRのアドレス藤岡 裕 URL23645/12-20:14
 記事番号2363へのコメント

佐藤信彦さんは No.2363「Re:お勧めOCRのアドレス」で書きました。

>フォントサイズは6ポイントほどと、読み取り革命の認識可能な
>最小フォント。英文は斜体になっているので、認識はちょっと辛い、
>という条件でテストしました。

英字の認識精度が悪かったのは、読み取り革命が斜体文字に対応していな
いからだと思います。

原稿が鮮明で英字が斜体でなければ、満足できる認識レベルに達している
という感想を得ました。


トップに戻る
Re:お勧めOCRのアドレス佐藤信彦 E-mail URL23655/12-20:30
 記事番号2364へのコメント

佐藤信彦です。

藤岡 裕さんは No.2364「Re:お勧めOCRのアドレス」で書きました。
>英字の認識精度が悪かったのは、読み取り革命が斜体文字に対応していな
>いからだと思います。

Webの製品紹介を見た限りでは、斜体非対応とは書いていないようですが
そういうものなのでしょうか。日本語の斜体を認識できないのはしょうが
ないとしても、英文の斜体が認識できないとしたらちょっとさみしいですね。

600dpiでスキャンしたのが悪影響を与えたってことはないと思うし……



トップに戻る
Re:お勧めOCRのアドレスワタナベ E-mail URL23665/12-21:26
 記事番号2365へのコメント

佐藤信彦さんは No.2365「Re:お勧めOCRのアドレス」で書きました。
>
>600dpiでスキャンしたのが悪影響を与えたってことはないと思うし……

読取革命ではどうなのかわかりませんが、eTypist5.0 では 600dpi よりも 300dpi
のほうが認識率が良いということが多々ありました(もちろん、原稿の質にもよるの
でしょうが…)。なので、うちでは OCR にかけるときはいつも 300 で読み込んでい
ます。そのほうがスキャン速度も速いですし。

一応、ご参考までに。


トップに戻る
Re:お勧めOCRのアドレス藤岡 裕 URL23675/13-08:29
 記事番号2365へのコメント

佐藤信彦さんは No.2365「Re:お勧めOCRのアドレス」で書きました。

>Webの製品紹介を見た限りでは、斜体非対応とは書いていないようですが
>そういうものなのでしょうか。日本語の斜体を認識できないのはしょうが
>ないとしても、英文の斜体が認識できないとしたらちょっとさみしいですね。

過去に全部で5種類ほどのOCRソフトを使ってみましたが、斜体文字の認識は技術
的にかなり難しいようで、低価格のソフトでは斜体文字に対応しているものはな
いようでした。

ただし読み取り革命にも字体認識学習機能的なものがありますので、これを使え
ば場合によっては可能かなとは思います。


トップに戻る
Re:お勧めOCRのアドレス佐藤信彦 E-mail URL23685/13-11:53
 記事番号2367へのコメント

佐藤信彦です。

藤岡 裕さんは No.2367「Re:お勧めOCRのアドレス」で書きました。

>過去に全部で5種類ほどのOCRソフトを使ってみましたが、斜体文字の認識は技術
>的にかなり難しいようで、低価格のソフトでは斜体文字に対応しているものはな
>いようでした。

ちなみに斜体を認識できたTextBridgeは12,000円ほどで購入しましたが、今と
なっては低価格帯のOCRには入らなくなったかな。

OCRソフトが英文対応を謳っていたとしたら、英文の斜体を認識できないなんて
酷いなあ。英文の場合、斜体は当たり前に使うフォントですもんね。OCRソフトを
買うときに斜体のことはきにしなかったけど、藤岡さんのおっしゃる状況から
すると、注意が必要ですね。


トップに戻る
Re:お勧めOCRのアドレス佐藤信彦 E-mail URL23695/13-12:15
 記事番号2363へのコメント

佐藤信彦です。

佐藤信彦さんは No.2363「Re:お勧めOCRのアドレス」で書きました。
> 読み取り革命(英語モード)
> 日本語部分がほとんど認識できないのは当然と
> しても、英語部分もほとんど駄目。

英語モードで英語部分の認識ができなかった原因がわかりました。

ウィザードで処理したのに認識まで実行してくれないので手動で
認識処理を指示したところ、ウィザードでは英語モードとなって
いるのになぜか日本語モードで動作していました。そこで手動で
英語モードを指示して処理したら、だいぶ認識できるようになり
ました。

とはいうものの、ぱっと見で誤認識がごろごろあり、僕の尺度から
すると使い物になりません。やっぱり斜体というのが辛いのかな。

ちなみに600dpiと、推奨解像度と思われる400dpiの両方で試しまし
たが、同じような認識精度でした。


トップに戻る
Re:お勧めOCR藤岡 裕 URL23545/11-08:35
 記事番号2324へのコメント

MOさんは No.2324「お勧めOCR」で書きました。

> ところがPanasonicの「読み取り革命2001」をネット上で知り、試したとこ
>ろ和英混在も問題なく読み取ることが判りました。このソフトはカスレやニジミに
>も結構強く、認識率は高いです。体験版が1ヶ月の期限付きでダウンロードできるの
>で、スキャナーをお持ちの方は是非お試し下さい。

気が付かないうちに随分追加レスがついていた訳ですね。

MOさんお勧めの「読み取り革命2001」はわたくしにとっても待ちに待っていた製
品という感じです。値段も安いですしね。


トップに戻る
Re:OCRは実用可能ですか?通りすがり 23385/9-20:55
 記事番号2272へのコメント

MOさんは No.2272「OCRは実用可能ですか?」で書きました。
>こんにちは、
>
>文書をOCRによって入力したいと思い家電量販店に行ったのですが、誤読が
>多くて使い物にならないと言われました。そこで実際、利用されている方の
>ご意見を聞かせて頂いてから判断しようと思っています。この掲示板の過去
>ログによると、英語は良いが日本語の認識率が悪いということでした。あれ
>から半年経っているので最近の情報を知りたいと思います。ちなみに富士通
>のOCRのHPに行ってみると認識率が99.8%と書いてありました。
> それから、スキャナーの解像度は主に600dpi、1200dpiのものがあります
>が、低解像度600dpiでも使用に耐えるでしょうか?
以下のホームページも参考にされては?

http://www.din.or.jp/~suztomo/comp/ocr/index.html


トップに戻る
Re:OCRは実用可能ですか?びゃん 23725/14-11:41
 記事番号2272へのコメント

こんにちは。私もTextBridgeを買いました。
みなさんおっしゃるとおり、認識率いいですね。

原文テキストに日本語を上書きしていけば、訳抜けが防げて、こりゃいいわ。
と思ったのですが、TextBridgeから出力されるTxtファイルは、文字セットが
違うのか、日本語を上書きしたくて日本語のフォントを使ってワードや秀丸で
開くと、92hex、93hexというような文字が後ろの文字とくっついて漢字になっ
てしまいます('s が痴になるとか)。みなさんは、これをどうやって克服され
ているのでしょうか?
テキストファイルの状態で、たとえば92hexを27hex、93hexを22hexに換えてく
れるようなツールがあったりするのでしょうか?


トップに戻る
Re:OCRは実用可能ですか?ワタナベ E-mail URL23755/14-16:48
 記事番号2372へのコメント

こんにちは。

びゃんさんは No.2372「Re:OCRは実用可能ですか?」で書きました。

>原文テキストに日本語を上書きしていけば、訳抜けが防げて、こりゃいいわ。
>と思ったのですが、TextBridgeから出力されるTxtファイルは、文字セットが
>違うのか、日本語を上書きしたくて日本語のフォントを使ってワードや秀丸で
>開くと、92hex、93hexというような文字が後ろの文字とくっついて漢字になっ
>てしまいます('s が痴になるとか)。みなさんは、これをどうやって克服され
>ているのでしょうか?
>テキストファイルの状態で、たとえば92hexを27hex、93hexを22hexに換えてく
>れるようなツールがあったりするのでしょうか?

Word2000 をお持ちでしたら、ファイルを開く際に『ファイルの種類』を『エンコー
ドされたファイル』に指定すると、上手く開けるかもしれません。

あるいは、テキストファイルの状態で変換したいという場合は、自作のツールを公開
しておりますので、以下のアドレスからダウンロードして、お試しください。

 http://mapage.noos.fr/Hamachi/OhMyCode.lzh

もし、不具合等ありましたら、ご連絡ください。でわ。


トップに戻る
Re:OCRは実用可能ですか?びゃん 23765/14-21:04
 記事番号2375へのコメント

ワタナベさん、こんにちは。

ワタナベさんは No.2375「Re:OCRは実用可能ですか?」で書きました。
>
>あるいは、テキストファイルの状態で変換したいという場合は、自作のツールを公開
>しておりますので、以下のアドレスからダウンロードして、お試しください。
>
> http://mapage.noos.fr/Hamachi/OhMyCode.lzh
>

これです、これです、感激です。ありがとうございました。