翻訳をつくるメディア

翻訳のプロがAI翻訳(DeepL)を医学論文で検証してみた(その1)|WIPジャパン

作成者: WIP japan|Sep. 03, 2020

 

    【関連記事】
  1. 翻訳のプロがAI翻訳(DeepL)を検証してみた(その2)

 

AI翻訳(機械翻訳)とポストエディット

 

翻訳エンジンのDeepLについては、すでに様々な媒体で高い評価レビューがなされています。「one day」を「いつの日か」という具合に、自然な日本語に翻訳できるという評価です。

 

そこで翻訳会社で医学分野の翻訳に日々従事しているプロが、医学論文を題材にDeepLの実力を検証してみました。

医学論文をDeepLで機械翻訳する

原文となる題材はCOVID-19関連の記事から、The New England Journal of Medicine7/23付け)の論文「Multisystem Inflammatory Syndrome in U.S. Children and Adolescents」のディスカッション部分としました。

 

医学論文のディスカッションは、文節の係りや代名詞がわかりづらいことが多いのですが、検証のため、あえてこの部分を選んでみました。ちなみにこの論文では、COVID-19と川崎病との関連性について議論されています。

 

https://www.nejm.org/doi/full/10.1056/NEJMoa2021680

https://www3.nhk.or.jp/news/special/coronavirus/detail/#mokuji5全身の血管の炎症 コロナ若い世代調査「川崎病と異なる」米CDC6/30))

 

6つの一連のセンテンスをDeepLに入力すると、数秒後に翻訳結果が表示されました。今回は、最初の数センテンスのみの結果を検証してみます。

原文
Patients with Kawasaki’s disease–like features were more likely to be younger than 5 years old, similar to what is seen among patients with Kawasaki’s disease reported in the literature. Some of the Kawasaki’s disease–like features, including fever, erythroderma, and delayed desquamation, are also seen in toxic shock syndrome, which can have manifestations of multiorgan involvement and has been associated with other viruses.

これをDeepLにて翻訳してみますと、

川崎病に類似した特徴を有する患者は、文献で報告されている川崎病患者に見られるものと同様に、5歳未満の若年者である可能性が高かった。発熱、紅皮症、遅発性落屑などの川崎病様の特徴のいくつかは、多臓器関与の症状を示すことがあり、他のウイルスとの関連がある中毒性ショック症候群にも見られます。

となりました。

 

医学論文のDeepL翻訳は合格点か?

対象となる冒頭のセンテンスの要点は、患者の年齢です。DeepLの翻訳では意味は通じており、かつ致命的な間違いはないので、文意をつかむのが目的ならば一般的には合格といえるでしょう。しかしながら、翻訳会社が提供する品質としては、DeepLの翻訳だけでは合格とはいえません。

 

まず一番重要な点をみてみると、「younger than 5 years old」が「5歳未満の若年者」となっています。単に「5歳未満」とせず「若年者」と訳出するところに、噂どおりのDeepLの実力が垣間みられます。

 

しかし、日本語で「5歳児」を「若年者」とするのはおかしいので、プロの翻訳者なら「幼児」と訳すところです。

 

また「Kawasakis diseaselike features」が、冒頭の文章では「川崎病に類似した特徴」と訳出され、続くセンテンスでは「川崎病様(よう)の特徴」と訳出されており、AI翻訳に典型的な「表記ゆれ」エラーがみられます。「○○様」の表現は一般的に使われるものなので、いずれも「川崎病様」とするのがベストと思われます。

 

feature」については、確かに「特徴」という意味で一般的に使われますが、センテンスでは「features」として「fever, erythroderma・・・」の「症状」が挙げられているので、「症状」としたほうが自然になります。

 

続く「more likely」は、辞書には可能性を示す単語として主に紹介されているので、「可能性が高い」としても問題はありません。ただ「傾向にある」と訳したほうが、試験の結果(results)を踏まえたディスカッション中の文章らしくなります。

 

そして最後に「similar to」以下の文章について、川崎病好発年齢の「5歳未満」と川崎病様症状のある患者の年齢が「同じ」であることが、明確にわかるように日本語を組み立てたいところです。

DeepL翻訳にポストエディットは必須か?

そこで翻訳会社としては、機械翻訳の結果をそのまま使うのではなく、前述のような検討を踏まえて修正を施していきます。このような機械翻訳後の修正作業は、ポストエディット(PE)とも呼ばれます。

 

DeepL翻訳:
川崎病に類似した特徴を有する患者は、文献で報告されている川崎病患者に見られるものと同様に、5歳未満の若年者である可能性が高かった。

ポストエディットを行った例:
川崎病様の症状は5歳未満の幼児に認められる傾向にあった。この年齢は文献で報告されている川崎病患者の年齢と同じである。

最初のセンテンスは結局DeepLの翻訳結果を全体的に書き換える形となりました。

 

5歳未満」は「幼児」でよいのか、また川崎病の好発年齢は「5歳以下」ではなく「5歳未満」でよいのかなど、地味ではあるがクリティカルな事実確認にも時間を要しました。

 

ただこれだけではまだDeepLの実力は評価できません。2番目のセンテンスの精度はどうでしょうか。(次回につづく)(伊藤)