翻訳のプロがAI翻訳（DeepL）を医学論文で検証してみた（その1）

翻訳のプロがAI翻訳（DeepL）を検証してみた（その2）

AI翻訳（機械翻訳）とポストエディット

翻訳エンジンのDeepLについては、すでに様々な媒体で高い評価レビューがなされています。「one day」を「いつの日か」という具合に、自然な日本語に翻訳できるという評価です。

そこで翻訳会社で医学分野の翻訳に日々従事しているプロが、医学論文を題材にDeepLの実力を検証してみました。

医学論文をDeepLで機械翻訳する

原文となる題材はCOVID-19関連の記事から、The New England Journal of Medicine（7/23付け）の論文「Multisystem Inflammatory Syndrome in U.S. Children and Adolescents」のディスカッション部分としました。

医学論文のディスカッションは、文節の係りや代名詞がわかりづらいことが多いのですが、検証のため、あえてこの部分を選んでみました。ちなみにこの論文では、COVID-19と川崎病との関連性について議論されています。

https://www.nejm.org/doi/full/10.1056/NEJMoa2021680

https://www3.nhk.or.jp/news/special/coronavirus/detail/#mokuji5（全身の血管の炎症コロナ若い世代調査「川崎病と異なる」米CDC（6/30））

6つの一連のセンテンスをDeepLに入力すると、数秒後に翻訳結果が表示されました。今回は、最初の数センテンスのみの結果を検証してみます。

原文
Patients with Kawasaki’s disease–like features were more likely to be younger than 5 years old, similar to what is seen among patients with Kawasaki’s disease reported in the literature. Some of the Kawasaki’s disease–like features, including fever, erythroderma, and delayed desquamation, are also seen in toxic shock syndrome, which can have manifestations of multiorgan involvement and has been associated with other viruses.

これをDeepLにて翻訳してみますと、

川崎病に類似した特徴を有する患者は、文献で報告されている川崎病患者に見られるものと同様に、5歳未満の若年者である可能性が高かった。発熱、紅皮症、遅発性落屑などの川崎病様の特徴のいくつかは、多臓器関与の症状を示すことがあり、他のウイルスとの関連がある中毒性ショック症候群にも見られます。

となりました。

医学論文のDeepL翻訳は合格点か？

対象となる冒頭のセンテンスの要点は、患者の年齢です。DeepLの翻訳では意味は通じており、かつ致命的な間違いはないので、文意をつかむのが目的ならば一般的には合格といえるでしょう。しかしながら、翻訳会社が提供する品質としては、DeepLの翻訳だけでは合格とはいえません。

まず一番重要な点をみてみると、「younger than 5 years old」が「5歳未満の若年者」となっています。単に「5歳未満」とせず「若年者」と訳出するところに、噂どおりのDeepLの実力が垣間みられます。

しかし、日本語で「5歳児」を「若年者」とするのはおかしいので、プロの翻訳者なら「幼児」と訳すところです。

また「Kawasaki’s disease–like features」が、冒頭の文章では「川崎病に類似した特徴」と訳出され、続くセンテンスでは「川崎病様（よう）の特徴」と訳出されており、AI翻訳に典型的な「表記ゆれ」エラーがみられます。「○○様」の表現は一般的に使われるものなので、いずれも「川崎病様」とするのがベストと思われます。

「feature」については、確かに「特徴」という意味で一般的に使われますが、センテンスでは「features」として「fever, erythroderma･･･」の「症状」が挙げられているので、「症状」としたほうが自然になります。

続く「more likely」は、辞書には可能性を示す単語として主に紹介されているので、「可能性が高い」としても問題はありません。ただ「傾向にある」と訳したほうが、試験の結果（results）を踏まえたディスカッション中の文章らしくなります。

そして最後に「similar to」以下の文章について、川崎病好発年齢の「5歳未満」と川崎病様症状のある患者の年齢が「同じ」であることが、明確にわかるように日本語を組み立てたいところです。

DeepL翻訳にポストエディットは必須か？

そこで翻訳会社としては、機械翻訳の結果をそのまま使うのではなく、前述のような検討を踏まえて修正を施していきます。このような機械翻訳後の修正作業は、ポストエディット（PE）とも呼ばれます。

DeepL翻訳：
川崎病に類似した特徴を有する患者は、文献で報告されている川崎病患者に見られるものと同様に、5歳未満の若年者である可能性が高かった。

ポストエディットを行った例：
川崎病様の症状は5歳未満の幼児に認められる傾向にあった。この年齢は文献で報告されている川崎病患者の年齢と同じである。

最初のセンテンスは結局DeepLの翻訳結果を全体的に書き換える形となりました。

「5歳未満」は「幼児」でよいのか、また川崎病の好発年齢は「5歳以下」ではなく「5歳未満」でよいのかなど、地味ではあるがクリティカルな事実確認にも時間を要しました。

ただこれだけではまだDeepLの実力は評価できません。2番目のセンテンスの精度はどうでしょうか。（次回につづく）（伊藤）

翻訳のプロがAI翻訳（DeepL）を検証してみた（その1）

医学論文をDeepLで機械翻訳する

医学論文のDeepL翻訳は合格点か？

DeepL翻訳にポストエディットは必須か？

翻訳会社・翻訳サービスに関するブログ記事

翻訳会社の探し方：

翻訳サービス：

翻訳会社の料金：

翻訳会社の見積：

翻訳会社に依頼：

翻訳会社への正式発注：

翻訳会社の料金をコストカット：

翻訳会社の納期：

翻訳会社の品質：

翻訳会社のチェック：

用語集・メモリ：

翻訳支援ツール：

ポストエディット：

AI翻訳：

AI翻訳検証：

ISOに関する記事：

翻訳業界に関する記事：

翻訳分野・翻訳ドキュメントに関するブログ記事

契約書翻訳：

法律・法務翻訳：

金融・財務・IR翻訳：

マニュアル・取扱説明書の翻訳：

産業・工業分野の翻訳：

環境・エネルギー分野の翻訳：

一次産業分野の翻訳：

食品分野の翻訳：

ビジネス分野の翻訳：

エンターテインメント分野の翻訳：

インバウント分野の翻訳：

医療・医薬・化粧品翻訳：

教育分野の翻訳：

補助金申請と翻訳：

官公庁・自治体等と翻訳：

証明書等の翻訳：

IT翻訳：

アプリ翻訳：

WEBサイト多言語化：

画像翻訳：

音声翻訳：

動画字幕翻訳：

SNS翻訳：

DTP翻訳：

業界別・翻訳会社の探し方：

予算を最大限に活用する翻訳術：

業界別・最適な翻訳コスト配分比重ガイド：

言語に関するブログ記事

言語別・翻訳会社の探し方：

WIPジャパン株式会社：翻訳会社、通訳、海外調査・リサーチ、多言語人材派遣