機械翻訳が急速に力をつけてきたと共にゼロから翻訳を起こすのではなく、「機械での翻訳結果を人力で修正する」という手法が台頭し始めてきています。この手法のことを「ポストエディット(通称PE)」と呼びます。本記事ではこのポストエディットにおける、その特徴や有効な使用方法について解説します。
ポストエディット(PE)はメジャーな翻訳手法?
翻訳作業の大半は機械がやってくれて、人間がやることは「機械が翻訳した結果の修正」のみなので、PEを取り入れることによって翻訳にかかる工数や金額が大幅に削減できると考えられていました。しかし、やはり「リーダビリティ」を重視する翻訳では特に、PEを利用しての翻訳は厳しいところがあるというのが現状です。
同じ語源同士の言葉(例えばイタリア語-スペイン語、ドイツ語-英語、など)であれば機械翻訳もかなり精度高く訳出できますが、言語体系がかなり違う言語ペア(英語-日本語など)では、機械翻訳でリーダビリティを追求するのは難しいというのが現状です。
リーダビリティが低い文章を、人力で読みやすく改造する作業というのは、時に自分でゼロから翻訳することより手間がかかります。プロ意識が高ければ高いほど、「この読みづらい文章をなんとか活かしながらわかりやすく書き直そう」とするので、結果的にかなり工数がかかってしまうのです。
例えば日本語のドキュメントを英語に翻訳するとしましょう。日本語は「主語を省く」ケースが多くあります。しかし、英語では主語が抜けている文章というのは存在しません(SNSなどに投稿されるくだけた文を除く)。日本語原稿で主語が抜けている場合、原稿に記載されているイラストや写真、クライアントから支給された参考資料などをもとに翻訳者が「主語は何なのか」をあぶりだしたうえで英訳作業を行います。
しかし、機械翻訳はこうしたことはしてくれません。行間は読んでくれないし、ましてや参考資料など確認もしてくれません。ただ字面だけを多言語に置き換えるだけです。そのため、時にはまったく意図しない翻訳結果になってしまう場合もあります。
ゼロから翻訳しないでPEを行うことの怖さは、ここにあります。一見「それらしい」訳文だが、実は原文とは違う意図の文章になっていた、という場合に、見逃されてしまう可能性があるのです。
こういった理由から、PEが大きくもてはやされた時期があるにも関わらず、人力翻訳のニーズは減少していません。個人的な経験則ですが、2~3年前は「ポストエディットでの作業は可能か?」と主に海外のお客様から尋ねられることも多かったのですが、最近は人力翻訳を前提とした案件の相談が多いです。「言葉は人間が紡ぐものである」というのをPEはひっくり返せていないというのが現状でしょう。
ポストエディット(PE)が有用なケースとは
ただし、「かなりシンプルな構造の文を翻訳したい」、あるいは「そこまでクオリティは求めないが、大量のボリュームを短納期で翻訳してもらいたい」という場合にPEは便利です。
PEを使いつつ、ある程度のクオリティも保持したい、という場合は、「プリエディット」という前処理を行うことをおすすめします。プリエディットとは、「原文を翻訳しやすいように改造する」という工程のことを指します。
たとえば先ほど述べた「主語」をすべて省略せずに明記する、一文が長い場合は文章をいくつかに分ける、二重否定を避ける、などです。要するに「わかりづらい原文をシンプルにわかりやすく変更する」というのが「プリエディット」です。これにより、機械による誤訳の可能性を大きく減少させることができます。
機械翻訳は人力翻訳の仕事を奪うか?
機械が翻訳者の仕事を奪う…などと言われて久しいですが、「やはり人力での翻訳は根強く必要とされている」というのが体感としてあります。
ポストエディット(PE)では、原文を一文一文ほかの言語に置き換えていくだけですが、人力翻訳では、例えば「この言語では、文の前後を入れ替えたほうがネイティブに伝わりやすい」などと翻訳者が判断し、読みやすく訳出することも可能です。
翻訳の意図というのは、「違う言葉の話者に情報を伝えたい」ということなので、リーダビリティを軽視することはできません。そうなると、やはり最初から人力翻訳でやるのが有効なケースが多いです。ただ、契約書やマニュアルなどの「正確さがモノを言う」翻訳はこの限りではないでしょう。
PEは、「とにかく大量に翻訳したい」「明確でシンプルな構造の文を翻訳したい」という場合には有用な手法でしょう。もしくは、プリエディットで原文のわかりづらさをなくしてからPEにかけると、より望ましい翻訳結果が得られます。
文書の用途によって翻訳手法も使い分けていきましょう。(川嶋)
関連記事