翻訳なんでも相談室 
メール配信サービスを開始 停止 e-mailアドレス

[記事表示に戻る] [ツリートップの表示に戻る]

◇┳専門用語一覧を原文からスキャンして作るソフト教えて-投稿者:天晴(8/13-19:31)No.1103
 ┗┳質問を変えます-投稿者:天晴(8/16-02:12)No.1104
  ┣┳シンプルな方法がよいのでは?-投稿者:ペトロシアン(8/16-13:50)No.1106
  ┃┗━Re:シンプルな方法がよいのでは?-投稿者:天晴(8/16-22:10)No.1110
  ┗┳Re:質問を変えます-投稿者:えりこ(8/17-09:48)No.1112
   ┗┳なるほど。。。。-投稿者:天晴(8/17-11:58)No.1114
    ┗━Re:なるほど。。。。-投稿者:えりこ(8/17-13:39)No.1115


トップに戻る
専門用語一覧を原文からスキャンして作るソフト教えて天晴 11038/13-19:31

翻訳で一番頭が痛い事は専門用語をどうしたら早く正確に調べられるか
と言う事ではないでしょうか?

こんな時、客先に専門用語を翻訳作業受注前に確認できればどんなに
助かるだろうかと何か上手い解決法は無いかと探しております。

私が考えたのは、原文をOCRスキャンしてテキストファイルを作り、
そのテキストファイルに含まれる単語をエクセルのセルに一語一語格納
できれば原文に含まれる単語の一覧表が完成します。

しかし、or ,a ,an ,thatなど専門用語とは言えない単語とかは
一覧表から除きたいので、OCRのテキストファイルからデータベースの
シートに展開する時にフィルタを掛けて一覧表に入り込まないように
したいのです。

もしも上記の作業を可能にするソフトが有れば、客先から受け取った
紙原稿かテキストファイルを「専門用語一覧表原稿」としてその場で
印字出力して同じくその場で客先に質問するようにすれば、かなりの
納期短縮と品質向上に寄与すると確信しております。

このテキストファイルをフィルタリングした後データベースに展開可能な
翻訳支援ソフト、またはエクセルのマクロ機能を駆使して似たようなデータ
ベース作成作業を実行されている方が居られましたら是非教示願いたい
のですが。。。。

トップに戻る
質問を変えます天晴 11048/16-02:12
 記事番号1103へのコメント

どうも設問自体に問題が有った様で、言い方を変えれば
皆さんどうやって専門用語集を作成してアップデート
されていますか御教示願えればと思います。


トップに戻る
シンプルな方法がよいのでは?ペトロシアン 11068/16-13:50
 記事番号1104へのコメント

天晴さんは No.1104「質問を変えます」で書きました。
>どうも設問自体に問題が有った様で、言い方を変えれば
>皆さんどうやって専門用語集を作成してアップデート
>されていますか御教示願えればと思います。

[Petrosian]
はじめまして(^^)、天晴さん。
外資系企業で翻訳を担当しているペトロシアンです。

勤務先ではクライアント別・製品別の用語集が整備されているので検索は非
常に楽ですが、自分で一から用語集を作成する場合は確かに一工夫欲しいと
ころですね。

1つのアイデアとしては、未確定の単語に印を付けておく方法があります。
うちの会社では、★原語★という表記が一般的ですね。そうすれば、訳語が
決まった後に一括置換するのもテキストファイルに保存するのも簡単です。

スキャンしたテキストデータをExcelに取り込むのも一案とは思いますが、
用語の要否の基準(これが以外と厄介)がないと、不要な単語をスクリプト
などを使って効率的に削除するのは難しいと思います。

それでもExcelでやってみたい、という場合は

1)スキャンしたデータに含まれているスペースを改行に置換する。
2)Excelで読み込む。
3)アルファベット順にソートする。
4)重複している行を削除する。
5)冠詞、be動詞、接続詞など、明らかに不要な単語を削除する。
6)未確定の単語の隣(とは限りませんが)の列に印を付ける。
7)印を付けた単語のみが表示されるようにフィルタを実行する。

というような手順になると思います。

ただし、元データが膨大な場合、この作業の手間もかかるので、最初に提示
した案の方が実際的ではないでしょうか?

他の方のコメントもあるといいですね(^^)。


トップに戻る
Re:シンプルな方法がよいのでは?天晴 11108/16-22:10
 記事番号1106へのコメント

ペトロシアンさんレスありがとうございます。
私は輸出入機器会社の元社員で現場指導要領作成やメーカー折衝
やってました。今年退職して、今後は翻訳か通訳関係で食ってけ無いか
考えてる所です。

御教示の方法がなるほど確実で、シンプルな方法だと思います。
一網打尽的に根こそぎ単語を拾い出すと言うのは不要な単語を
後から編集するのに却って手が掛かるかもしれないので
手動で目星をつけた単語だけを一覧表にするのが結局最短時間で済む
かも知れませんね。

専門用語一覧表作成を試行錯誤しつつ、同時並行で優れたアプリケーションが
発売されないかアンテナを伸ばしてみたいと思います。



トップに戻る
Re:質問を変えますえりこ 11128/17-09:48
 記事番号1104へのコメント

天晴さんこんにちは。医薬系の主に英日翻訳をしています。
ちょっと的外れな回答かもしれませんがご容赦下さい。

私の場合、専門語辞書としては主に、ネット上で入手した
フリーの訳語集(テキストでダウンロード)と、実務で出会った
未知語を自分で訳語集として構築したものの2種類を利用しています。
前者は医大や大学の医学部のサイトでよく見付かります。
ほとんどの場合、個人的な利用には全く制限が付けられていないので、
サイト運営者の寛大な心に感謝しながら利用させて頂いています。

そして、これらを「原語 タブ 訳語」という体裁に変換し、
表計算ソフトで読み込んで利用しています。表計算ソフトで
読み込んだファイルは、表計算ソフトのファイル(例えばxls形式)
とは別に、汎用性の高いcsvファイルとしても保存しています。

・・・とここまでは「専門語辞書」の作り方でしたが、私は
「原語 タブ 訳語」形式のテキストファイルを使って、原語を訳語に
一括置換するMSWordマクロを作って訳語付与に利用しています。
今はフリーなので使っていませんが、以前所属していた翻訳会社では
♪この〜木何の木気になる木〜 の系列会社から出ている訳語付与
ソフトを使用していました。これは、ExcelとWordのマクロや
アドインソフトで構成されており、Excelで作った辞書を独自の
辞書データベースに変換した後、Word上で訳語付与を行う仕様に
なっています。普通のWordのマクロは検索置換項目が多いと
処理にものすごく時間が掛かりますが、このソフトは数万語登録
していても、わずか数分で処理できます。但し、個人で買うには
ちょっとお高い(十数万円)のと、字数制限があるのが難点ですが。


トップに戻る
なるほど。。。。天晴 11148/17-11:58
 記事番号1112へのコメント

うーん、ヤッパリ行きつくところ辞書機能のリンクと
言う事になりますか。これにはちょっとマクロの知識が要るので
どうしようかなーって思ってたところです。

でも実際にアプリケーションが販売されていると言う事なので
購入できなくても需要が高まればAdobeのPhotoshopのように
Limited Editionが販売されたり,競争が激しくなるとPagemaker
の様に劇的に安くなったりしますので動向を注視したいと思います。

それにしてもこの木何の木、気になる木♪の企業とはこころを和ませて
くれますねぇ。もちろん一発で判りましたが。


トップに戻る
Re:なるほど。。。。えりこ 11158/17-13:39
 記事番号1114へのコメント

こんにちは。

天晴さんは No.1114「なるほど。。。。」で書きました。
>うーん、ヤッパリ行きつくところ辞書機能のリンクと
>言う事になりますか。これにはちょっとマクロの知識が要るので
>どうしようかなーって思ってたところです。

MSWordには「マクロの記録」なる初心者には便利な機能がありますので、
一度それを使ってマクロを書いてみられては如何でしょう? 
「こういう操作をするとこういう記述になる」というのが分かりますし、
どのみち訳語付与程度なら「検索置換」が主ですから、それほど難しい
記述はないと思います。私の場合、マクロの勉強に要した時間よりも、
後で得る恩恵の方が遙かに大きかったです。

>でも実際にアプリケーションが販売されていると言う事なので
>購入できなくても需要が高まればAdobeのPhotoshopのように
>Limited Editionが販売されたり,競争が激しくなるとPagemaker
>の様に劇的に安くなったりしますので動向を注視したいと思います。

ご紹介したソフトについては・・・う〜ん、どうかなぁ。普通の翻訳
ソフトと違って、使いたいと思う人はほとんど翻訳者とか編集者などに
限られるでしょうしねぇ。翻訳ソフトを作るより訳語付与ソフトを
作る方が楽で安上がりなはずなのに、訳語付与ソフトがほとんど
上市されていないという事実からも、ニーズの少なさがうかがえるのでは
ないでしょうか。比較的低価格な訳語付与ソフトとしては、「訳師如○」
というのがあったように記憶しています。