第3章 ウィンドウとダイアログ

1. プロジェクト設定
1.1. 言語設定
1.2. 設定
1.3. ファイル場所設定
2. 翻訳対象ファイル一覧
3. プロジェクトの検索
3.1. ワイルドカードの使用
3.2. 検索方法と設定
3.3. 検索結果の表示
3.4. 編集ウィンドウの分節に検索フィルターをかける
4. テキストの置換
4.1. 検索オプション
5. 整合ツール
5.1. 手順1:整合パラメータを調整する
5.2. 手順2: 手動で修正
6. スクリプト
6.1. 使い方
6.2. スクリプト言語
7. 一般設定
7.1. 一般
7.2. 機械翻訳
7.3. 用語集
7.4. 辞書
7.5. 外観
7.6. ファイルフィルター
7.7. 分節化規則の設定
7.8. 入力補完
7.9. スペルチェッカー
7.10. LanguageTool プラグイン
7.11. 外部検索
7.12. 編集
7.13. タグ処理
7.14. チーム
7.15. 参考訳文
7.16. 表示
7.17. 保存と訳文ファイル生成
7.18. プロキシ認証
7.19. 機密データ
7.20. プラグイン
7.21. 更新

違いはわずかです。「ウィンドウ」とは、エディタの横に開いたままにして操作できるウィンドウで、「ダイアログ」とは、エディタを閉じて翻訳作業を続行する前にパラメータを選択する必要があるウィンドウです。

1. プロジェクト設定

このダイアログボックスにアクセスするには、[プロジェクト][プロジェクト設定...]を選択します。

1.1. 言語設定

原文言語と訳文言語は、リストから選択するか、または直接入力で指定します。もし翻訳途中で言語設定を変更すると、変更前後の言語間で一致が取れなくなり、翻訳メモリが使い物にならなくなることがあるので注意してください。

トークナイザーは、選択した言語に対応するものが表示されます。

1.2. 設定

文単位の分節化を有効にする

分節化の設定は、OmegaTによる原文ファイルの取り扱い方法にのみ関係します。原文の分節化は、文単位で行うのが一般的です。したがって通常は、このチェックボックスにチェックを入れておくのがよいでしょう。

めったにないことですが、段落単位での分節化のような、別の方法が必要とされることもあります。このフラグを変更しても、翻訳メモリにすでに記録された分節は変更されません。たとえば、翻訳の途中で分節化を文単位から段落単位に変更しても、そのプロジェクトの内部翻訳メモリは何も変わりません。OmegaT は段落単位でしか分節化できなかった旧形式の翻訳メモリをアップグレードできますが、その逆はできないのです。ただし OmegaT は、文単位の既存の翻訳を結合して、段落単位の参考訳文を作ることはできます。

分節化設定を変更した場合、翻訳済みの分節が分割されたり、結合されることがあります。これにより、たとえ分割や結合前の翻訳がまだ翻訳メモリに残っていたとしても、実質的に「未翻訳」の状態に戻ることになります。

翻訳自動反映

同じ内容の分節が何箇所か原文に存在する場合、[翻訳自動反映]チェックボックスにチェックを入れると、最初にその内容を一箇所翻訳した時点で、それが基本訳文に設定され、他の訳文分節にも同じ内容が設定されます。原文が同じでも、文脈によっては他と同じ内容が適さない分節があるかもしれません。その場合はもちろん、後で[例外訳文を登録]コマンドを使って手修正することができます。[翻訳自動反映]チェックボックスにチェックを入れないと、原文が同じ他の分節は未翻訳のまま残されます。通常の分節と同じように、その分節に移動して都度、翻訳することになります。

タグを削除

この設定にチェックを入れると、原文分節からすべての整形用のタグを削除します。これはインラインの整形を実際には使わないテキスト(たとえば OCR ソフトが出力した PDF ファイルや、変換精度の低い .odt ファイルや .docx ファイルなど)を扱う場合に役に立ちます。削除されるのはインラインのタグのみです。したがって通常は、訳文ファイルを開くのに特に支障は無いでしょう。非視覚的な整形(OmegaT の編集画面上には表示されません)は、訳文ファイルに引き継がれます。

後処理用外部コマンド

この欄には、訳文ファイルの生成後に実行したい外部コマンド(たとえば、ファイル名を変更するスクリプトなど)を記述できます。外部コマンドには「パイプ機能」を含めることができません。そのため、スクリプトファイルの単純な呼び出しが推奨されます。

分節化規則...

分節化規則は、ほとんどの場合、すべてのプロジェクトに共通で適用されます。しかし特定のプロジェクトに特化した分節化規則が必要になることもあるでしょう。その場合は、このボタンを押してダイアログを開き、[分節化規則をプロジェクト専用にする]チェックボックスにチェックを入れてから、分節化規則を必要な状態に変更してください。新しい規則集は、プロジェクトと共に保存されます。またプログラム共通の分節化規則集には干渉しません。プロジェクト専用の分節化規則を削除したい場合は、チェックボックスのチェックを外してください。分節化規則の詳細については「分節化設定」を参照してください。

ヒント:プロジェクト専用の分節化規則集は project/omegat/segmentation.conf に保存されます。

ファイルフィルター...

前の項と同じように、プロジェクト専用のファイルフィルター設定を作成できます。この設定はプロジェクトと共に保存され、現在のプロジェクトにのみ適用されます。プロジェクト専用のファイルフィルター設定を作成するには、[ファイルフィルター...] ボタンをクリックし、開いたウィンドウの[ファイルフィルター設定をプロジェクト専用にする]チェックボックスにチェックを入れてください。これにより、変更されたフィルター設定のコピーがプロジェクトと共に保存されるようにます。プロジェクト専用のファイルフィルター設定を削除するには、チェックボックスのチェックを外してください。[設定]→[ファイルフィルター...]メニューからユーザーレベルのファイルフィルター設定を変更しても、プロジェクト専用のファイルフィルター設定は変更されないことに注意してください。詳しくは、「 ファイルフィルターの設定 」を参照してください。

ヒント:プロジェクト専用のファイルフィルター設定は project/omegat/filters.xml に保存されます。

リポジトリマッピング...

チームプロジェクトで作業する場合、このウィンドウでリモートフォルダとローカルフォルダ間のマッピングを定義できます(具体例はここを参照)。

外部検索...

プロジェクト固有の外部検索リソースを定義します。

1.3. ファイル場所設定

ここで、プロジェクトフォルダーの場所を変更することができます。たとえば、原文ファイルフォルダーや、訳文ファイルフォルダーなどです。フォルダー名を直接入力して、そのフォルダーがまだ存在しなければ、OmegaT がそのフォルダーを作成します。プロジェクトフォルダーの場所を変更しても、既存のファイルが古いフォルダーから新しいフォルダーに移動されたりはしませんので、注意してください。

[除外...]をクリックして、OmegaT に無視させたいファイルやフォルダーを登録できます。除外登録したファイルやフォルダーは、次のように扱われます。

  • 編集ウィンドウに表示されません

  • 翻訳状況の集計対象になりません

  • 訳文ファイル生成時に、訳文ファイルフォルダーにコピーされません。

除外構成例集ダイアログで、構成例の追加と削除ができます。また既存の構成例を選んで F2 キーを押すと編集もできます。構成例には Ant 構文にのっとったワイルドカード文字も使えます。

2. 翻訳対象ファイル一覧

プロジェクト翻訳対象ファイル一覧...を選択したときと同様に、OmegaT がプロジェクトを読み込むと自動的に表示されます。

注意:翻訳対象ファイル一覧ウィンドウが表示されないようにすることができます。それには、ファイル([設定]→[設定フォルダー]メニューからアクセスできる omegat.prefs 中の project_files_show_on_loadfalse に設定します。

[Ctrl+L]で開き、Esc]で閉じます。翻訳対象ファイル一覧ウィンドウは、次の情報を表示します:

  • プロジェクト中の翻訳可能なファイル数。対象は、原文ファイルフォルダーに存在し、OmegaT が扱える形式のファイルです。この数は、「翻訳対象ファイル一覧」のタイトルに続く括弧内に表示されます。

  • プロジェクト中の翻訳可能なファイルの全リスト。クリックすると、翻訳作業のために開くことができます。

    任意のテキストを入力するとフィルター欄が開き、そこにファイル名の一部を入力することができます。およびキーを用いてファイルを選択し、Enterを押して翻訳作業のために開くことができます。

    注意:ヘッダーをクリックすると、たとえばファイル名(左端の列)のアルファベット順で並べ替えたりできます。また[...へ移動]ボタンでファイルの順番を任意に変更することもできます。

    ファイル名を右クリックするとポップアップが開き、原文ファイルと訳文ファイル(存在する場合)を開くことができます。

  • 各ファイル項目には、ファイル名、ファイルフィルターの形式、エンコーディング、分節数が表示されます。

  • 表の最下部には、「すべての分節数」と「繰り返しを除いた分節数」、「繰り返しを除いた翻訳済み分節数」が表示されます。

繰り返しを除いた分節数とは、すべての分節から重複するものを除いて数えた合計です。ここでいう「重複」は、大文字と小文字を区別します。「Run」と「run」は別物として数えます。

「すべての分節数」と「繰り返しを除いた分節数」の差から、すべての文中に繰り返しの表現がどれくらいあるかを大まかに見積もることができます。ただし、その数から、繰り返しの内容にどのていど強い相関があるかを推し量ることはできません。とても長い文章が何度も繰り返し登場する場合もありますし(おめでとうございます)、短いキーワードが並んだ表が含まれているだけの場合もあります(気を落とさずに)。omegat フォルダーにある project_stats.txt には、各ファイルに含まれる分節についての詳細な情報が記載されています。

分節化規則を修正すると、「すべての分節数」と「繰り返しを除いた分節数」が変わる可能性があります。しかし、いったんプロジェクトの翻訳を開始したら、規則の変更はなるべく行わないようにしてください。詳しくは「分節化規則」の章を参照してください。

プロジェクトへのファイル追加:[原文ファイル追加...]ボタンをクリックして、原文ファイルを追加できます。選択したファイルは source フォルダーへ追加され、プロジェクトが再読み込みされます。[MediaWiki から原文ファイルを追加...]ボタンを押して URL を指定すると、MediaWiki 形式で記述されたウェブページを原文ファイルとして追加することができます。

3. プロジェクトの検索

Ctrl+F で文字列検索ウィンドウを開き、[検索文字列]欄に検索したい単語または語句を入力します。

あるいは、編集ウィンドウ、参考訳文ウィンドウまたは用語集ウィンドウで単語や語句を選択してから Ctrl+F を押すこともできます。この場合、[検索文字列]欄に単語または語句が自動的に入力されます。検索ウィンドウはいくつも同時に開いておくことができます。しかし、デスクトップを散らかさないように、検索が終わったら閉じることを忘れないでください。

[検索文字列]欄のドロップダウンボタンをクリックすると、直近の検索履歴が 10 個まで表示されます。

「プロジェクトの検索」ウィンドウには独自のメニューがあります。

  • [ファイル]>[選択範囲を検索]([Ctrl]+[F]):検索フィールドに再びフォーカスを置き、その内容をすべて選択します。

  • [ファイル]>[閉じる]([Ctrl]+[W]):検索ウィンドウを閉じます([Esc]でも同様に閉じます)。

  • [編集]>[原文を挿入]([Ctrl]+[Shift]+[I]):現在の原文の分節を挿入します。

  • [編集]>[原文で置換]([Ctrl]+[Shift]+[R]):現在の原文の分節で置換します。

  • [編集]>[用語の追加]([Ctrl]+[Shift]+[G]):新しい用語集の用語を追加します。

3.1. ワイルドカードの使用

完全一致検索とキーワード検索では、ワイルドカードとして「*」と「?」を使用できます。Word ユーザーにはおなじみでしょうが、意味は次の通りです:

  • 「*」は、0個以上の任意の文字と一致します。たとえば、検索文字列が「run*」である場合は、「run」「runs」「running」に一致します。

  • 「?」は任意の1文字と一致します。たとえば、検索文字列が「run?」である場合は、「runs」や、「running」の中の「runn」の部分に一致します。

一致した文字列は、青い太字で表示されます。「*」と「?」は正規表現において特別な意味を持つことに注意してください。ここで説明したワイルドカード文字は、あくまで完全一致検索とキーワード検索にだけ当てはまるものです(下記を参照してください)。

3.2. 検索方法と設定

ラジオボタンで検索方法を選択してください。以下の検索方法を利用できます:

完全一致検索

指定した文字列をそのまま含む分節を検索します。完全一致検索は、指定された文字列を「語句」として検索します。つまり、複数の単語を指定した場合、それらの単語の並びまで同じ語句を含む検索結果のみが表示されます。文字列「open file」を検索した場合、「open file」とは一致しますが、「file opened」や「open input file」とは一致しません。

キーワード検索

指定したすべてのキーワードを含む分節を検索します。指定した順序は問いません。複数の単語の登場順を問わないような検索を行いたい場合は、それらの単語を空白で区切って入力し、[キーワード検索]を選択してください。OmegaT は、指定した単語をすべて含む、すべての分節の一覧を表示します。キーワード検索は、Google などのインターネット検索エンジンにおける「すべてを含む」検索(AND 検索)に似ています。キーワード「open file」を検索した場合、「open file」と一致するのはもちろんですが、file opened」や「open input file」「file may not be safe to openなどとも同じように一致します。

正規表現

検索文字列が正規表現として扱われます。たとえば上の図で指定されている「[a-zA-Z]+[öäüqwß]」という検索文字列は、ドイツ語配列のキーボードでは不自然な文字が使われている箇所を訳文から検索しています。正規表現は、文字列を検索するにあたって、とても効果的な方法です。

上記いずれの方法についても、以下のオプションを指定できます:

  • 大文字と小文字を区別:指定した文字列そのものを検索します。大文字と小文字の違いも含めて、一致を判断します。

  • スペース文字で nbsp も検索:検索文字列に入力されたスペース文字を、通常のスペース文字だけでなく、ノーブレークスペース(\u00A)にも一致させます。

  • 原文を検索:原文分節から検索します。

  • 訳文を検索:訳文分節から検索します。

  • メモを検索:メモから検索します。

  • コメントを検索:コメントから検索します。

  • 全分節:翻訳済み分節と未翻訳分節の両方から検索します。

  • 翻訳済み分節:翻訳済み分節だけから検索します。

  • 未翻訳分節:未翻訳分節だけから検索します。

  • 表示:繰り返し分節:内容が同じ分節が複数見つかった場合でも、検索結果にすべての分節を繰り返し表示します。

  • 表示:ファイル名:分節ごとに、その分節が属するファイル名を先頭に表示します。

  • プロジェクトを検索内部メモリにチェックを入れると、プロジェクト専用の翻訳メモリ(project_save.tmx ファイル)から検索します。翻訳メモリにチェックを入れると、tm フォルダー内の翻訳メモリファイルが検索対象になります。用語集にチェックを入れると、glossary フォルダー内の用語集ファイルが検索対象になります。

  • ファイルから検索:単独のファイル、またはフォルダーに含まれるファイル群を検索します。(翻訳メモリではない)複数のファイルを検索する場合、対象となるファイルは、OmegaT が対応している原文ファイル形式に限定されます。そのため、OmegaT は TMX ファイルの検索にも対応していますが、ファイル検索機能からは対象外になります。

[詳細設定]ボタンをクリックすると、追加の条件欄(翻訳者や改訂者の名前、翻訳が最後に更新された日時、現在の原文に存在しない分節の除外など)が表示されます。全角/半角文字を区別しないオプションがチェックされている場合、全角文字(CJK文字:かな漢字やアルファベットABC)を検索すると半角文字に一致し、逆に半角文字を検索すると 全角文字に一致します。

3.3. 検索結果の表示

[検索文字列]欄に文字列を入力し[検索]ボタンをクリックすると、プロジェクトから、その文字列を含むすべての分節が表示されます。OmegaT は、同一の分節を1つの実体として扱うので、見つかった最初の分節のみを表示します。検索された分節は、プロジェクト中で現れる順に表示されます。翻訳済みの分節は、その原文とともに表示されます。上段が原文、下段が訳文です。未翻訳の分節は、原文のみが表示されます。

分節をダブルクリックすると、その分節を編集ウィンドウ内で編集することができます([編集ウィンドウと同期する]のチェックが入っている場合は、1クリックのみで済みます)。必要であれば、用語の修正を行うため、検索ウィンドウに戻って、検索された次の分節を確認することもできます。

検索ウィンドウで、標準のショートカット(Ctrl+NCtrl+P)を使用して分節間を移動することができます。

同時に複数の検索ウィンドウを開くことができます。検索ウィンドウのウィンドウタイトルには検索文字列が設定されるため、検索ウィンドウが複数開いていても、容易に識別できます。

3.4. 編集ウィンドウの分節に検索フィルターをかける

検索結果の分節間を移動しやすいように、編集ウィンドウに対して検索フィルターをかけることができます。最下部にある[フィルター]ボタンをクリックすると、編集ウィンドウには現在の検索条件に一致する分節のみが表示されます。分節間の移動には、通常の移動コマンド([次の分節]や[次の未翻訳分節]など)を使用できます。

注意事項:

  • 検索結果には上限(既定で 1,000 件)があるため、一般的な語句を検索した場合、編集ウィンドウには検索条件に合致するすべての分節が表示されるのではなく、その中の 1,000 件だけが表示されることになります。

  • 検索条件に合致する分節を含むファイルが見つからない場合は、空白の画面が表示されます。

  • [繰り返し結果も表示]の設定がオフになっている場合、繰り返しに該当する分節は編集ウィンドウ上でも表示されません。

フィルターを解除するには、[フィルターを解除]ボタンをクリックするか、またはプロジェクトを再読み込みしてください。

4. テキストの置換

Ctrl+K で検索と置換ウィンドウを開き、[検索文字列]欄に検索したい語句または正規表現を入力します。

[検索]ボタンをクリックすると、検索条件に一致したすべての分節が表示されます。

[置換後の文字列]欄に新しい語句を入力し(正規表現は使えません)、以下のいずれかをクリックします:

  • すべて置換:すべての検索文字列を置換後の文字列で置き換えます(事前に置換件数を示した確認ダイアログが表示されます)。

  • 置換フィルター:編集ウィンドウに置換用のフィルターをかけ、編集ウィンドウのヘッダーに現れるボタンを使って、1 件ずつ置換します。[置換して次へ][次を検索]をクリックしていき、最後に[フィルターを解除]でフィルターを解除します。

  • 閉じる:変更なしにウィンドウを閉じます。

4.1. 検索オプション

検索オプションは、検索ウィンドウに表示される検索オプションとほぼ同じです。

例外的に、未翻訳分節にチェックを入れると、翻訳前の分節の原文も検索対象になります。

検索条件に一致した未翻訳分節に対しては、原文を訳文にコピーした上で置換が実行されます。置換が実行されなかった場合、未翻訳分節はそのままです。つまり、原文は訳文にコピーされません。

5. 整合ツール

整合ツールでは、翻訳済みの単一言語の文書から二か国語の翻訳メモリを作成します。

このウィンドウにアクセスするには、[ツール][整合ツール...]を選択します。

5.1. 手順1:整合パラメータを調整する

整合が改善できるように見える場合は、パラメータを変更してみてください。ほとんどの場合、平均スコアが低いほど整合が良好になります。

Heapwiseモードでは、テキストはグローバルに評価されます。Parsewiseモードでは、セグメントごとに評価されます。

Key=Value テキストを整合するには、ID比較モードを使用します。これは、2つのファイルのキーの順序が同じでない場合や、2つのファイルに同じ量の情報が含まれていない場合でも機能します。このオプションは、選択した両方のファイルがKey=Valueファイルとして認識される場合にのみ表示されます。

ViterbiおよびForward-Backwardアルゴリズムは、2つの異なる計算方法です。最良の結果が得られるものを選択します。

[続行]をクリックして、次の手順に進みます。

5.2. 手順2: 手動で修正

自動処理の後、2つのファイルの整合は、通常、手動で修正する必要があります。

翻訳単位は、最後の2列のセルにあります。

2つのセグメントを同じ線上に整合するには:

  1. 最初のセグメントを選択します。

  2. スペースバー([編集][ピンポイント整合を開始]のショートカット)を押します。

  3. 最初のセグメントに対応する直線移動のもう一方の列をクリックします。

これらの操作をいくつか行った後、[編集再整合保留中]を選択して、他のセグメントの整合を更新します。

1つまたは複数のセグメントの位置を個別に変更するには、セグメントを選択し、U(上へ移動)またはD(下へ移動)を押します。

翻訳メモリの作成時には、最初の列で[保持]ボックスがオンになっている行だけが含まれます。

2つの列が十分に整合したら、[TMXを保存...]をクリックして翻訳メモリを作成します。

6. スクリプト

このウィンドウにアクセスするには、[ツールスクリプト...]を選択します。

6.1. 使い方

スクリプト ウィンドウ上では、既存のスクリプトをテキスト欄に読み込んだり、いま開いているプロジェクトに対して実行できます。スクリプトをカスタマイズする手順は、次の通りです:

  • 左側のスクリプト一覧から目的のスクリプト名をクリックして、編集ウィンドウに読み込みます。

  • 下部にある「1」から「12」のどれかのボタンの上で右クリックし、[スクリプトを設定]を選びます。

  • 数値ボタンを左クリックすると、そこに設定されているスクリプトを実行できます。また[ツール]メニューからスクリプトを選んだり、割り当てられたショートカットキー Ctrl+Alt+F#(# は 1 から 12)を使うことで、スクリプトを実行できます。

デフォルトでは、スクリプトファイルは「scripts」フォルダーに格納されています。このフォルダーは、OmegaT のインストール先フォルダー(OmegaT.jar ファイルを含む)の配下にあります。

このフォルダーに新しいスクリプトファイルを追加すると、スクリプト ウィンドウの一覧に表示されます。

追加できるスクリプトがいくつか OmegaT Scripts にあります。

6.2. スクリプト言語

以下のスクリプト言語は、最初から使える状態になっています:

  • Groovy(http://groovy.codehaus.org):Java 仮想マシン向けの動的言語です。構文的に Java との互換性を最大限に保った上で、さらに Python や Ruby、Smalltalk に触発された強力な拡張機能を持ちます。

  • JavaScript(JS と略すこともあり、Java とは無関係):プロトタイプ ベースのスクリプト言語です。動的で、弱い型付け、ファーストクラス関数などの特徴を持ちます。オブジェクト指向、命令型、および関数型プログラミングのスタイルをサポートする、マルチパラダイム言語です。Firefox のような人気のあるプログラムで利用されていることから、とりわけオープンソースの分野で普及し好まれています。

すべての言語から、プロジェクトを先頭のオブジェクトとする OmegaT のオブジェクトモデルにアクセスできます。次に示すコードスニペットは、現在のプロジェクトから全ファイルの全分節を走査する groovy スクリプトです。このスクリプトは、もし訳文が存在していれば、その分節の原文と訳文を出力します:

    files = project.projectFiles;
    for (i in 0 ..< files.size())
    {
        for (j in 0 ..< files[i].entries.size())
        {
            currsegment = files[i].entries[j];
            if (project.getTranslationInfo(currSegment))
            {
                source = currsegment.getSrcText();
                target = project.getTranslationInfo(currsegment).translation;
                console.println(source + " >>>> " + target);
            }
        }
    }

7. 一般設定

このダイアログボックスにアクセスするには、[設定][環境設定...]を選択します。

すべての翻訳プロジェクト用の設定ができます。

7.1. 一般

TAB キーで次の分節へ

編集する分節を次へ進めるキーを、デフォルトの[Enter]キーの代わりに[Tab]キーとします。この設定は、中国語、日本語、または朝鮮語のような入力システムの場合に便利です。

終了時に常に確認

OmegaT を終了する前に、常に確認します。

7.2. 機械翻訳

翻訳を自動的に取得する

機密保持のため、すべてのセグメントを自動翻訳エンジンに送信したくない場合があります。このオプションのチェックを外すと、現在のセグメントでCtrl+M(OS XではCmd+M)を押した場合にのみ、自動翻訳がフェッチされます。次に、再度 Ctrl+M を押して、提案された機械翻訳を挿入する必要があります。

未翻訳分節のみを対象とする

未翻訳分節のみを機械翻訳サービスに送信するには、このチェックボックスをオンにします。

リストからサプライヤを選択し、必要に応じて[環境設定]をクリックして、サプライヤから提供された識別情報の詳細を入力します。

Microsoft Translator および Google Translate サービスへのアクセスを設定する手順については、 ここを参照してください。

7.3. 用語集

TBX 用語集の説明文を表示

各用語集エントリに表示されるコンテキストの説明が不要であるか、長すぎる場合は、この選択肢をオフにします。

原文中で単語が離れている用語を表示

この選択肢をオンにすると、用語集に含まれる単語が原文テキストで別々に表示される場合でも、単語のペアまたはグループ(式)が表示されます。

用語集の表示に誤検出が多すぎる場合は、この選択肢をオフにします。

用語集のエントリにステミングを使用する

同じ語根を持つ単語を用語集に表示する場合に選択します。

原文挿入時に用語集から置換

このオプションと、[原文挿入時に用語集から置換]の双方が選択されていると、原文を挿入した時に、抽出された用語集の原文項目が訳文項目に自動的に置換されます。

大文字と小文字が大きく異なる(例:FOO対foo)検出結果を無視

このオプションを選択すると、同じ単語が複数の形式(大文字の有無など)で用語集に存在する場合でも、用語集には1つのエントリのみが表示されます。

7.3.1. TaaS 用語

API キーを取得

このボタンをクリックして、 TaaS プロジェクト・サイトにアクセスし、ユーザー・アカウントを作成します。

あとで、ページ https://term.tilde.com/account/keys/create?system=omegaTで、アクセスキーを作成することができます。

今回だけ記憶する

このオプションを選択すると、OmegaTはセッション間でアクセスキーを記憶しません。

TaaS 用語集をダウンロード...

このボタンを使用すると、プロジェクトの原文言語および訳文言語に存在するコレクションを参照およびダウンロードできます。非公開の用語集は、太字で表示されます。用語集をダウンロードすると、現在の用語集フォルダー内に TBX 形式で保存されます。

TaaS 用語分野を選択...

必要に応じて、特定のドメインを選択して、送受信されるデータ量を制限できます。

7.4. 辞書

辞書内のセグメント・テキストを自動的に検索

辞書が長すぎる場合など、自動検索を無効にするには、このオプションをオフにします。

辞書項目の照合にトークナイザーを使う

同じ語根を持つ単語を辞書に表示する場合に選択します。

7.5. 外観

ウインドウを初期位置に復元

OmegaT で使用する各ウィンドウを、初期位置に戻します。切り離されたり、移動したり、隠れてしまったウィンドウを元の状態に戻したいときに、使用してください。また、OmegaT をバージョンアップし、いくつかのウィンドウが表示されなくなったような場合にも、使用できます。

7.5.1. 字体設定

表示用の字体を設定するダイアログを表示します。古いコンピュータを使用しており、ウィンドウのサイズ変更が非常に遅いと感じるユーザーは、字体の変更を試してください。詳しくは「その他」の「字体の設定」を参照してください。

7.5.2. 配色

ユーザーインターフェースの各部分について、任意の色に変更できます。

定義済みのテーマを簡単に切り替えられるスクリプトも、付属しています。スイッチカラーテーマ ・スクリプトを使うと、既定の「ダーク」テーマを設定できます。

7.6. ファイルフィルター

使用可能なファイルフィルターを一覧表示します。現在のプロジェクトで使用しているフィルターを太字で示します。OmegaT の中で翻訳したくないファイル形式がある場合は、ファイル形式名の横にあるチェックボックスのチェックを外すと、その形式に対してフィルター機能を使わないようにすることができます。フィルターを無効にしているファイル形式のファイルは、プロジェクトの読み込み時に無視され、訳文生成時には未変更の状態で訳文フォルダーにコピーされます。再びフィルターを使用したくなったら、対象のチェックボックスにチェックを入れてください。[初期値を復元] をクリックすると、それまでのフィルター設定をリセットし初期設定に戻します。フィルター対象とするファイルやエンコーディングを変更する場合は[編集...]をクリックします。

ダイアログ上で、次の設定の有効/無効を切り替えることができます:

  • 先頭と末尾のタグを削除:分節の先頭と末尾のタグを含むすべてのタグを表示したい場合は、この設定のチェックを外してください。警告:Microsoft Open XML 形式のファイル(docx や xlsx など)について、すべてのタグを表示した場合は、決して先頭のタグの前にいかなるテキストも入力しないでください(そのタグは技術的な理由で、常に分節の先頭に置かなければなりません)。

  • 分節化しないプロジェクトから、先頭と末尾の空白文字を削除:OmegaT は既定で、先頭と末尾の空白文字を削除します。分節化しないプロジェクトの場合、この設定のチェックを外すことによって、それらの空白文字を保持することができます。

  • すべてのタグの空白を維持:原文ファイルにとって空白文字がレイアウトに利用されており、それを無視すべきでない場合は、このオプションのチェックを入れてください。

  • 複数訳文の識別時にファイルのフルパス情報を無視する:OmegaT は既定で、原文ファイル名を複数訳文の識別基準のひとつに利用します。このオプションにチェックを入れると、ファイル名は識別に利用されません。複数訳文の識別には、ファイル名以外の文脈情報(前後の分節や、ファイル形式によってはある種の ID)だけが使用されます。

7.6.1. フィルター設定

以下のフィルター(テキストファイル、PO ファイル、XHTML ファイル、HTML ファイル・XHTML ファイル、OpenDocument ファイル、Microsoft Open XML ファイル)では、いくつかの専用オプションを設定できます。設定を変更する場合は、フィルターを選択して[設定...] を押してください。可能な設定は以下の通りです:

テキストファイル

  • 原文を改行で分節化するか、空行で分節化するか、分節化しないか:

    文単位の分節化が有効になっている場合は、ここで選択した設定によってさらに分節化されます。

PO ファイル

  • 訳文ファイルの空分節を許可

    この設定を有効にすると、未翻訳の PO 分節(たいていは段落全体)を空のままにして訳文ファイルを生成します。もう少し技術的に立ち入った話をすると、PO 訳文ファイルの msgstr 分節が空のままになる、ということです。PO ファイルの場合はこれが一般的な状態ですので、この設定はデフォルトで有効になっています。この設定を無効にすると、原文が訳文分節にコピーされます。

  • PO ヘッダーを無視

    この設定にチェックを入れると、PO ヘッダーを翻訳対象外とみなして、原文のままにします。

  • ヘッダーの「nplurals=整数; plural=式;」を自動で置換

    この設定にチェックを入れると、PO ファイルのヘッダーにある複数形指定を、訳文言語に合わせて自動変更します。

XHTML ファイル

  • 以下の属性を翻訳:選択した属性を編集ウィンドウで分節として表示できます。

  • 以下のタグで分節化: HTML の <br> タグがある場所を段落とみなして分節化することができます。

  • 以下の正規表現に一致する文字列を翻訳しない:指定した正規表現に一致するテキストは、翻訳対象とせずスキップすることができます。スキップした箇所は、タグ検証では赤く表示されます。参考訳文ウィンドウでは、スキップした箇所が原文分節にあると、そのテキストは斜体で表示されます。

  • <meta> タグ内の以下の属性と値は翻訳しない(カンマ区切りで複数指定):ここで指定した <meta> タグは、翻訳されません。

  • 以下の属性と値を持つタグの内容は翻訳しない(カンマ区切りで複数指定):ここでキー=値の形式で指定したタグは、翻訳されません。

    この設定は、属性の値に応じて特定のタグを翻訳しないようにするのに、役に立つことがあります。たとえば、<div class="hide"> <span translate="no"> のようなタグは、キー=値の形式で指定して翻訳対象外に設定できます。この例の場合、設定欄は次のようになります:class=hide, translate=no

Microsoft Office Open XML ファイル

どの要素を翻訳するか、選ぶことができます。選んだ要素は、翻訳時に個別の分節として表示されます。

  • Word:非表示の命令とテキスト、コメント、脚注、文末脚注、ヘッダー、フッター

  • Excel:コメント、シート名

  • Power Point:スライドのコメント、スライド マスター、スライド レイアウト

  • 共通:表、ダイアグラム、図、ワードアート

  • その他の設定:

    • タグを結合:チェックが入っていれば、翻訳対象テキストを含まない連続するタグを1つのタグに結合します。

    • すべてのタグの空白を維持:チェックが入っていれば、空白文字(半角スペースや改行など)を保持します。たとえそれが文書中で意味が無い場合でも残します。

HTML ファイル・XHTML ファイル

  • 以下の場合に HTML・XHTML ファイルにエンコーディング宣言を追加または変更:訳文ファイルのエンコーディング文字セットを、原文ファイルのそれ(明示的に指定されたものであれ、暗黙に適用されたものであれ)とは違うものにしたいということは、よくあります。この設定を使うと、訳文ファイルにエンコーディング宣言を含めるかどうかを指定できます。たとえば、ファイルフィルターで訳文ファイルのエンコーディングが UTF-8 に指定されている場合、この設定によって、訳文ファイルに必ずその情報を含めるようにすることができます。

  • 以下の属性を翻訳:選択した属性を編集ウィンドウで分節として表示できます。

  • 以下のタグで分節化: HTML の <br> タグがある場所を段落とみなして分節化することができます。

  • 以下の正規表現に一致する文字列を翻訳しない:指定した正規表現に一致するテキストは、翻訳対象とせずスキップすることができます。スキップした箇所は、タグ検証では赤く表示されます。参考訳文ウィンドウでは、スキップした箇所が原文分節にあると、そのテキストは斜体で表示されます。

  • <meta> タグ内の以下の属性と値は翻訳しない(カンマ区切りで複数指定):ここで指定した <meta> タグは、翻訳されません。

  • 以下の属性と値を持つタグの内容は翻訳しない(カンマ区切りで複数指定):ここでキー=値の形式で指定したタグは、翻訳されません。

    この設定は、属性の値に応じて特定のタグを翻訳しないようにするのに、役に立つことがあります。たとえば、<div class="hide"> <span translate="no"> のようなタグは、キー=値の形式で指定して翻訳対象外に設定できます。この例の場合、設定欄は次のようになります:class=hide, translate=no

  • 訳文ファイルの空白圧縮:連続する空白文字がある場合、訳文ファイル生成時に空白文字一つだけに変換します。

  • 訳文ファイルの HTML コメントを削除:コメント部(<!-- から --> までのあいだ)を訳文ファイルに出力しません。

OpenDocument Format (ODF) ファイル

  • どの要素を翻訳するか、選ぶことができます:

    Index 項目、ブックマーク、ブックマーク参照、脚注、コメント、プレゼンテーションのノート、リンク(URL)、シート名

7.6.2. フィルターの編集ダイアログ

このダイアログでは、フィルターで処理する原文ファイル名の構成例の指定、訳文ファイル名のカスタマイズ、読み込む原文ファイルと生成する訳文ファイルのエンコーディングを設定できます。ファイルフィルター構成例を編集するには、それぞれの欄をダブルクリックして直接修正するか、編集ボタンをクリックします。新しいファイルフィルター構成例を追加するには追加ボタンをクリックします。構成例の追加と編集には、同じダイアログを使用します。このダイアログでは、出力するファイル名のカスタマイズをするための訳文ファイル名の構成に特化したエディターがついています。

7.6.2.1. 原文ファイル形式、ファイル名構成例

OmegaT は原文フォルダーにファイルを見つけると、まず拡張子から判別してファイルフィルターを選択しようとします。もっと具体的に言うと、各フィルターの原文ファイル名構成例から、ファイル名と一致するものを探索します。たとえば、構成例 *.xhtml は、拡張子が .xhtml のあらゆるファイルに一致します。適切なフィルターが見つかった時点で探索は終了し、そのフィルターが該当するファイルの処理に割り当てられます。たとえばデフォルトでは、XHTML フィルターは拡張子 .xhtml のファイルを処理するのに使用されます。そのフィルターに扱わせたいファイルに応じて、ファイル名構成例を変更したり追加したりできます。原文ファイル名構成例には、検索機能と同様にワイルドカード文字を使用できます。ワイルドカード「*」は0個以上の任意の文字と一致します。ワイルドカード「?」は任意の1文字と一致します。他のすべての文字は、それらの文字自身をあらわします。たとえばテキストフィルターを readme ファイル(readme, read.mereadme.txt)にも対応させたい場合は、ファイル名構成例に read* を指定してください。(日本語訳注:実際にはワイルドカード文字と衝突しない範囲で、正規表現も使用できます。たとえばファイル名の末尾に数字のついた、拡張子 .foo のファイルを扱いたい場合は、*\d.foo のような指定が可能です。正規表現の詳細は、http://docs.oracle.com/javase/jp/6/api/java/util/regex/Pattern.html を参照してください)

7.6.2.2. 原文ファイルと訳文ファイルのエンコーディング

エンコーディングの指定が必須のファイル形式は限られています。エンコーディングを特に指定しなかった場合(<自動> の場合)は、拡張子に応じたエンコーディングが使用されます。たとえばデフォルトでは、.txt ファイルには OS のデフォルト エンコーディングが使用されます。原文ファイルのエンコーディングを、ファイル名構成例ごとに変更することもできます。訳文ファイルを出力する際のエンコーディングも、任意に変更できます。デフォルトでは、訳文ファイルのエンコーディングは、原文ファイルと同じになります。原文ファイルと訳文ファイルのエンコーディングを指定する項目では、対応したすべてのエンコーディングをドロップダウンメニューから選択できます。<自動> は、OmegaT に自動的に判断させます。自動の場合のエンコーディングは、次の仕組みで判定します:

  • 原文ファイルにエンコーディング宣言があれば、それに従います(HTML ファイル、XML ベースのファイルの場合)

  • いくつかのファイル形式(Java properties など)に対しては、その形式に必須のエンコーディングを設定します。

  • テキストファイルには、OS デフォルトのエンコーディング(たとえば日本語版の Windows OS では、シフト JIS 固定)を使用します

7.6.2.3. 訳文ファイル名

翻訳するファイル名を自動的に変更したい時があると思います。たとえば、ファイル名のあとに言語コードを追加したい場合などです。訳文ファイル名構成例は特別な文法で記述されています。これを編集したい場合は、[編集...]をクリックして構成例編集ダイアログを使用してください。編集内容をそのフィルターの初期値に戻したい時は、[初期値を復元]をクリックしてください。またファイルフィルターダイアログの中で、訳文ファイル名構成例を直接編集することもできます。構成例編集ダイアログでは、以下のような変数を使用できます:

  • デフォルトは ${filename} です。-- 拡張子を伴った完全な原文ファイル名で、これを指定すると、訳文ファイル名は原文ファイル名と同じになります。

  • ${nameOnly} -- 拡張子なしの原文ファイル名です。

  • ${extension} -- 原文ファイルの拡張子のみです。

  • ${targetLocale} -- 訳文のロケールコード(「xx_YY」形式)です。

  • ${targetLanguage} -- 訳文の言語コードと国コードを合わせたもの(「XX-YY」形式)です。

  • ${targetLanguageCode} -- 訳文の言語コードのみ(「XX」)です。

  • ${targetCountryCode} -- 訳文の国コードのみ(「YY」)です。

  • ${timestamp-????} -- 各種の書式による訳文ファイル生成時のシステム日時です。

    『SimpleDateFormat』の書式については、Oracle 技術文書を参照してください。

  • ${system-os-name} -- コンピューターの OS 名です。

  • ${system-user-name} -- システムのユーザー名です。

  • ${system-host-name} -- システムのホスト名です。

  • ${file-source-encoding} -- 原文ファイルのエンコーディング名です。

  • ${file-target-encoding} -- 訳文ファイルのエンコーディング名です。

  • ${targetLocaleLCID} -- 訳文ファイルの Microsoft ロケール(「xx-yy」形式)です。

${nameOnly} と ${extension} に関しては、追加の変数を使用できます。ファイル名があいまいな場合、使用する構成要素を ${nameOnly-拡張子の個数} と ${extension-名前の個数} の形式で指定することができます。たとえば原文ファイル名が「Document.xx.docx」だったとしましょう。その場合、各種の変数とその結果は次のようになります:

  • ${nameOnly-0} Document

  • ${nameOnly-1} Document.xx

  • ${nameOnly-2} Document.xx.docx

  • ${extension-0} docx

  • ${extension-1} xx.docx

  • ${extension-2} Document.xx.docx

7.7. 分節化規則の設定

翻訳メモリツールは、分節と呼ばれるテキスト単位で処理を行います。OmegaT がテキストを分節化する方法は2つあります。段落単位の分節化と、文単位の分節化(「ルールベースの分節化」とも呼ばれます)です。分節化の方法を選択するには、メインメニューから[プロジェクト][プロジェクト設定...]を開き、表示されるチェックボックスを使用してください。段落単位の分節化は、高度に文学的または芸術的な翻訳のような、一部のケースでは有用です。これらの翻訳では、文脈に応じて翻訳者が文の順番を入れ替えることがあるためです。しかし大半のプロジェクトでは、文単位の分節化が望ましいでしょう。その方が、過去の翻訳と一致しやすい(再利用しやすい)ためです。文単位の分節化を選択した場合、分節化規則は、メインメニューの[設定][分節化...]で設定できます。

信頼できる分節化規則が多くの言語で設定済みのため、新たな独自規則を作成する必要は、あまりないでしょう。一方で、特定の状況では、翻訳する原文に合わせて分節化規則を調整することで、大きく生産性があがります。

警告:ファイルフィルターの設定を変更すると、分節が変化することがあります。場合によっては、翻訳を一からやり直すことになるかもしれません。このとき、以前は有効だった翻訳済みの分節は、翻訳メモリ内で、現在の原文に存在しない分節になります。またプロジェクトを開いているときに分節化の設定を変更すると、変更を適用するためにプロジェクトの再読み込みが必要になります。

OmegaT は下記の通りに一連の処理を実施します:

構造単位の分節化

OmegaT は、まず構造単位の分節化を行うため、文書の構文を解析します。この処理のあいだ、分節作成のために参照される内容は、原文ファイルの構造のみです。

たとえば、テキストファイルの場合は、改行で分節化するか、空行で分節化するか、または、まったく分節化しないかのいずれかです。整形情報を持ったファイル(ODF 文書、HTML 文書など)は、ブロックレベル(段落)のタグを基準に分節化されます。XHTML や HTML ファイルでは、オブジェクトの属性も翻訳の対象になることがあります。このような場合は、属性値だけを分節として取り出します。

文単位の分節化

原文ファイルを論理的な区切りで分節化した後、OmegaT はさらにそれらを文単位で分節化します。

7.7.1. 分節化規則

分節化の流れは以下のように示すことができます:テキスト中を 1 文字ずつ動くカーソルをイメージしてください。それぞれのカーソル位置について、規則を適用できるかどうか、決められた順序で確認します。すなわち、カーソル位置の左側にあるテキスト全体が、前方の正規表現に合致するかどうか。合致した場合はさらに、カーソル位置の右側にあるテキストが、後方の正規表現に合致するかどうか。適用できる規則が見つかれば、そのカーソル位置についてはそれ以上規則を確認しません。見つかった規則が例外(分割しない)の場合は、何もせずにカーソルを次へ進めます。分節(分割する)の場合は、カーソル位置で改節してから、カーソルを次へ進めます。

規則には、次に示す2種類があります:

分節規則

原文テキストを2つの分節に分割します。たとえば「Did it make sense? I was not sure.」というテキストは、意味的に2つの分節に分けられるべきです。そのためには「?」に関する分節規則(後ろにスペースと大文字で始まる単語が続く場合、という条件付きで)があるほうがよいでしょう。改節するための規則を定義する場合は、[分割する/しない]チェックボックスにチェックを入れます。

例外規則

分割すべき「でない」テキストを指定します。「Mrs. Dalloway」というテキストはピリオドを含みますが、2つに分節化されるべきではありません。したがって、ピリオドの前に「Mrs」(他に Mr、Dr、prof など)がある場合についての例外規則が必要になります。改節を禁止するための規則を定義する場合は、[分割する/しない]チェックボックスにチェックを入れずにおきます。

ほとんどのヨーロッパ言語と日本語については、定義済みの分節規則で十分なはずです。翻訳しようとする言語に対して、より意味のあるわかりやすい分節化を行うために、さらに柔軟に例外規則を追加してもよいでしょう。

7.7.2. 規則の優先順位

言語の構成例について一致する分節化規則は、すべて与えられた優先順で適用されます。したがって、特定の言語のために設定した規則は、デフォルトのものより高い優先順位を与えるほうがよいでしょう。たとえば、カナダフランス語(FR-CA)用の規則は、フランス語(FR.*)用の規則よりも優先順位を高くし、なおかつデフォルト(.*)の規則よりも高くしておきます。こうしておけば、カナダフランス語を原文とするプロジェクトでは、まずカナダフランス語用の規則、次にフランス語用の規則、最後にデフォルトの規則、という順序で適用されます。

7.7.3. 規則の新規作成

分節化規則を大きく変更することは、特に最初の下訳が終わった後では、避けるべきです。しかし略称を認識させるために規則を追加するような、限定的な変更であれば、それは改善に値します。

規則集を編集するには、[分節化規則の設定]ウィンドウ上部にある表から、目的の項目をクリックします。するとウィンドウ下部に、選択した規則集の内容が表示されます。

新しい言語コードの規則集を追加するには、上部の表の横にある[追加]をクリックしてください。表の最下部に新しい行が作成されます(確認のために下までスクロールさせる必要があるでしょう)。規則集の名前と言語パターンを、関連する言語とそのコードに変更します。定義する言語コードの文法は正規表現の文法に従います。作成する規則群が、言語-国ペアに対するものである場合、[上へ]ボタンを使って、先頭に移動させておくことをおすすめします。

前方の正規表現後方の正規表現を追加する追加する構成例が文法的に正しいか、また意図する対象にちゃんと適用されるか確認するためには、正規表現をその場でテストできるような支援ツールの使用をお勧めします。詳しくは「正規表現」を参照してください。手始めに、既存の規則を参考に真似してみるのも良いでしょう。

7.7.4. 簡単な設定例

目的 前方の正規表現 後方の正規表現 備考
ピリオド(「.」)の後ろと、それに続くスペースやタブの前で分節を作る \. \s 正規表現「\.」は、文字「.」を表します。正規表現「\s」は任意の空白文字(スペース、タブ、改行など)を表します。
「Mr.」の後では分節化しない Mr\. \s これは例外規則です。[分割する/しない]チェックボックスには、チェックを入れずにおきます。
「。」(日本語の句点)の後ろで分節化する   [後方の正規表現]は空欄としておいてください。
「M.」、「Mr.」、「Mrs.」、「Ms.」の後ろでは分節化しない Mr??s??\. \s 例外規則です。? 文字の使用方法については「正規表現」の章を参照してください。

7.8. 入力補完

[用語集...]をクリックすると、入力補完の用語集ビューの設定を変更できます。

[定型文...]をクリックすると、定型文の設定変更や、定型文の追加と削除ができます。

[文字一覧...]をクリックすると、文字一覧の設定を変更できます。

入力補完は訳文分節欄でショートカット Ctrl+Space を押すと呼び出せます。

[関連性の強い補完候補を自動的に表示する]にチェックが入っていると、用語集の訳語項目の最初の文字を入力することにより、またはタグの場合は「<」を入力することにより、入力補完が自動的に起動します。

7.9. スペルチェッカー

OmegaT は組み込みの綴り確認機能を備えています。これは Apache OpenOffice や LibreOffice、Firefox、Thunderbird で使われているものと同じ機能です。そのため、これらのプログラム向けに広く提供されているフリーの綴り確認用辞書を、OmegaT でも利用することができます。

7.10. LanguageTool プラグイン

使用する LanguageTool

言語チェッカーの場所を選択

ローカル・マシン上で、 OmegaT で提供されている言語チェッカーとは異なる言語チェッカーを使用すると、検証ルールを個別設定できるようになります。

規則

翻訳しているテキストのタイプに関連しているかどうかに応じて、ルールのマークを設定します。

7.11. 外部検索

プロジェクト専用コマンドを有効にする

デフォルトでは、 OmegaT は、プロジェクト固有の設定 ( omegat フォルダー内の finder.xml ファイル ) で指定されたコマンドを実行しません。これは、マシンのセキュリティーに重大な影響を与える可能性があるからです。

このオプションは、自分が何をしているかを知っている場合にのみ有効にし、信頼できるソースからのプロジェクトのみを対象にしてください。

コンテキストメニューの優先度:

右クリックメニュー(右クリックメニュー)内のコマンドの順序を変更できます。100前後の値を指定すると、コマンドが最上部に表示され、900前後の値を指定すると、コマンドが最下部に表示されます。

この変更を有効にするには、 OmegaT を再起動する必要があります。

7.12. 編集

原文を挿入

翻訳入力行に、対応する原文を入力した状態にします。商標や固有名詞など、あえて翻訳しない部分を多く含んでいるような文書の場合に非常に便利です。

原文を挿入しない

OmegaT は翻訳入力行を空欄にします。翻訳入力の前に、原文を削除するキー入力の手間が省けます(つまり Ctrl+ADel)。この状態で、空訳文として残すこともできます。このような訳文は、未翻訳分節と区別するために、編集ウィンドウ上では <空訳文> と表示されます。空訳文に設定するには、分節を右クリックして「訳文を<空訳文>にする」を選びます。同じポップアップメニューに表示される「訳文を削除」という項目を選ぶと、現在の分節に入力済みの訳文を削除することもできます。訳文分節の選択を解除し、[Enter]を押しても同じ結果が得られます。

最も一致率の高い参考訳文を自動で挿入

OmegaT はその原文に最も近い参考訳文を自動挿入します。挿入するかどうかの一致率のしきい値(最小一致率)は、このダイアログで変更できます。先頭に付加する文字列(デフォルトでは何も付加しません)は、訳文が参考訳文の自動挿入によるものであることを示す目印に利用することができます。何らかの文字列(たとえば [参考] のような)を先頭に付加しておくと、参考訳文が適切かどうか後で確認する際に、自動挿入以外の訳文と区別しやすくなります。

ダイアログの下半分に並んでいるチェックボックスは、次の目的で用いられます:

参考訳文挿入の場合は数値を変更する

この設定にチェックを入れると、参考訳文を挿入する際に(それが手動でも自動でも)、OmegaT は参考訳文に含まれる数値を、挿入先の原文に照らして変更しようとします。ただし、いくつかの制約があります:

  • 編集中の原文分節と参考訳文は、同じ個数の数値を含んでいること

  • 参考訳文とその原文に含まれる数値は、完全に一致していること

  • 整数と単純な小数(小数点の記号としてピリオドを使うこと。たとえば 5.4 は小数とみなすが、5,4 や 54E-01 は小数とみなさない)だけを対象とする

原文と同じ訳文を許可

文書によっては、商標、名称、その他の固有名詞など、原文と同じ状態で残す必要のある箇所を含んでいる場合があります。変更すべきでないテキストを残しておくには 2 通りの方法があります。

まず、そのような箇所をまったく翻訳せずに残しておくことができます。OmegaT としては未翻訳の分節として残すことになります。こちらが初期設定です。もう1つの方法として、原文とまったく同じ訳文を入力することができます。OmegaT にはそこを翻訳したものとして記憶させることができます。これを可能にするには、このオプションを選択します。

分節をテキストファイルへ出力

テキスト出力機能は、現在作業中の OmegaT プロジェクトのデータをプレーンテキストファイルに出力するものです。データは、分節に移動したタイミングで出力されます。ファイルは OmegaT の個人設定フォルダー配下の script フォルダーに作成されます。内容は、次の通りです:

  • 編集中の分節の原文テキスト(source.txt

  • 編集中の分節の訳文テキスト(target.txt

  • Ctrl+Shift+C キーを押すか、またはメニュー[編集]→[選択領域を出力]を選んだ時点で選択されているテキスト(selection.txt

ファイルの内容は、新しい分節に移動するタイミング(source.txt と target.txt)または新しい選択領域を出力するタイミング(selection.txt)で上書きされます。ファイル形式は、整形されないプレーンテキストファイルです。このプロセス全体を、Tck/Tcl ベースのスクリプトを介して操作・制御することができます。詳しくは『OmegaT のテキスト出力機能を使う』(英語)を参照してください。

基本訳文と違う例外訳文がある場合[次の未翻訳分節]でその訳文へ移動する

たとえば同一の原文に対して、いくつかの異なる訳文が対応する場合があります。このような分節が存在していて、翻訳を慎重に進めたい場合は、このチェックボックスにチェックを入れてください。[次の未翻訳分節]で分節を移動するときに、翻訳済みか未翻訳かに関わらず、このような複数訳文に該当する分節で止まります。

タグの編集を許可する

編集作業中にタグの破損(たとえば部分的な削除)を防ぐには、この選択肢のチェックを外しておいてください。タグ全体を削除したい場合は、このオプシに選択肢を入れなくても、Ctrl+Backspace/Delete か、または全体を選択(Ctrl+Shift+Left/Right)して削除(Delete か Ctrl+X)で削除できます。

分節を離れる時にタグを検証する

このオプションにチェックを入れると、原文と訳文のあいだでタグが同じか、分節を離れる時に検証して、もし違いがあれば警告します。

auto フォルダー由来の翻訳かどうかを記録する

このオプションにチェックを入れると、auto フォルダー内の翻訳メモリから自動挿入された分節であることを示す情報が project_save.tmx ファイルに記録されます。その場合は、[表示]→[auto フォルダー由来の分節を色付け]にチェックを入れることで、該当する分節の背景色を変えることができます。

最初に読み込む分節数

デフォルトでは、エディタには2000個の初期セグメントが表示され、上下にスクロールするにつれ、徐々にロードされるゆになります。強力なマシンを使用している場合や、プログレッシブ読み込み時のスクロールバーの動作が気に入らない場合は、この数を増やすことができます。

7.13. タグ処理

プログラム関連のファイルを翻訳する場合、タグ検証の設定により、プログラミング用の変数(%...)やプレースホルダー({0})の書式も検証することができます。POフィルタはすでに%..を処理しておりJava™ Resource Bundle フィルターは、 already handles {#} tags, so you only need this for other file types.

また、タグ検証に関するさまざまなオプションを定義したり、カスタムタグを定義することもできます。

たとえば、[独自タグの正規表現]フィールドに\d+と入力すると、すべての番号がタグとみなされ、変換中に番号が誤って変更されていないことを確認できます。

同様に、<.*?>と入力して、ソーステキストに入力された(例えば)HTMLタグが変換時に変更されずに保存されるようにします。

注:これらの2つの命令は、(<.*?>)(\d+)と記述することで組み合わせることができます。

7.14. チーム

翻訳した分節の更新情報に記録する更新者名を入力します。

7.14.1. リポジトリ認証情報

ログイン詳細がOmegaTに保管されているプロジェクトのリスト。プロジェクトにアクセスするたびにOmegaTからログインとパスワードの入力を求められるようにするには、このリストからプロジェクトを削除します。

7.15. 参考訳文

参考訳文の並べ替え基準:

デフォルトでは、[あいまい一致]ペインに表示される最も近い一致は、ステミングを使用して決定されます。

100%に近いより多くのリテラル一致を取得するには、[タグと数字を含むフルテキスト]オプションを選択します。

非OmegaT TMXでのタグの表示

外部の(OmegaT が生成したものではない)TMX ファイルのタグをどのように扱うかを決めます。

参考訳文表示テンプレート

あらかじめ設定された変数を使用して、ファジーマッチの表示方法を変更します。

表3.1 参考訳文ウィンドウの設定

${id} 1 から 5 までの、参考訳文の番号
${sourceText} 参考訳文の原文
${targetText} 参考訳文の訳文
${diff} 原文と参考訳文との差異を表示します。ヒント:更新された文書の翻訳時に使うとよいでしょう。
${diffReversed} $ {diff}と同じですが、 ( 挿入および削除される ) 相違点が反転しています。
${score} 「ステミング、タグなし、数値なし」 オプションで計算されたパーセンテージ。
${noStemScore} 「タグなし」および「数値なし」 オプションで計算されたパーセンテージ。
${adjustedScore} [タグと番号を含むフルテキスト]オプションを使用して計算されたパーセンテージ。
${fuzzyFlag} 参考訳文がファジーであることを示す(今のところ #fuzzy マークのついた PO ファイルの翻訳でのみ有効)

7.16. 表示

テキストおよび更新情報の表示に関するオプションを設定できます。

繰り返しのある分節を色づけする場合、最初の分節を含む

このオプションをチェックすると、一意でないすべてのセグメント(繰り返し)がグレーで表示されます。このオプションをオフにすると、最初のセグメントを除き、一意でないすべてのセグメントがグレーで表示されます。

7.17. 保存と訳文ファイル生成

プロジェクトを自動的に保存する間隔を、分と秒で指定します。

プロジェクトの特性に応じて、デフォルトの間隔 (3 分) を変更します。

  • 内部サーバーで同期されたプロジェクトの短い間隔 (最小: 10 秒 ) 。

  • 外部サーバーでホストされるチーム・プロジェクトの長い間隔。

後処理用外部コマンド

このコマンドは、訳文ファイルを生成コマンドの後に実行されます。

この機能の使用例としては、翻訳されたドキュメントをクライアントのFTPサーバに自動的に送信することが挙げられます。

プロジェクト専用の外部コマンドを許可する

デフォルトでは、 OmegaT は、プロジェクト固有の設定 ( omegat.project ファイル ) で指定されたコマンドを実行しません。これは、マシンのセキュリティーに重大な影響を与える可能性があるからです。

このオプションは、自分が何をしているかを知っている場合にのみ有効にし、信頼できるソースからのプロジェクトのみを対象にしてください。

7.18. プロキシ認証

OmegaT が認証付きプロキシー・サーバーを使用してインターネットにアクセスする必要がある場合は、ここにプロキシー管理者が提供する詳細情報を入力します。

7.19. 機密データ

ここでは、マシン翻訳サービスのログイン詳細およびアクセス・キーを保護するために使用されるマスター・パスワードを再定義できます。新規パスワードを作成する前に、これらすべての詳細を記録するように注意してください。これらはすべて削除されるため、再入力する必要があるからです。

7.20. プラグイン

使用可能なプラグインのリストにアクセスできます。プラグインは、 OmegaT インストール・フォルダーまたはプラットフォーム固有の OmegaT ユーザー設定フォルダーの下にある /plugins フォルダーにインストールされます。

7.21. 更新

OmegaT の更新の自動通知を有効にします。