翻訳が必要な文書を、ChatGPT・Gemini・Claude・DeepLなどのサービスに入力して処理することが容易になりました。これらのツールは手軽で高精度であり、日常的な業務翻訳に広く普及しています。
一方で、「入力した文書の内容はどこへ行くのか」「機密情報を生成AIに入力しても問題ないのか」と気になりながらも、利用規約やデータ処理条件を十分に確認しないまま使用すると、社内の情報管理方針や契約条件と合わない可能性があります。
本記事では、現在の主要な生成AIツールにデータを入力した際の仕組みと、企業として確認すべきポイントを整理します。ツールの種類・契約形態によってデータの取り扱いが大きく異なるという点が重要です。すべての生成AIが一律にリスクというわけではありませんが、確認なしに機密文書を入力することは情報管理上の課題につながる可能性があります。
※本記事は一般的な実務上の参考情報を提供するものです。各サービスのデータポリシーは随時変更される場合があります。最新情報は各サービスの公式ページでご確認ください。
1. 生成AIツールの翻訳利用が主流になった背景
ひと昔前の「AI翻訳」といえば、DeepLやGoogle翻訳のような専用の翻訳エンジン(NMTベース)が中心でした。しかし2023年以降、ChatGPT・Gemini・Claudeなどの生成AI(LLM:大規模言語モデル)が急速に普及し、翻訳用途にも日常的に使われるようになりました。
現在の翻訳支援サービスには、DeepLやGoogle翻訳のような翻訳専用サービスと、ChatGPT・Claude・Geminiのような汎用生成AIサービスがあります。ただし、情報管理上より重要なのは、使用モデルの種類ではなく、個人向けサービス、法人向けサービス、APIなど、どの契約区分で利用するかです。同じブランドのサービスでも、学習利用、保存期間、人間によるレビュー、管理者機能などの条件が異なります。
注目すべきは、DeepLも2024年に次世代LLMモデルを実装し、翻訳エンジンのアーキテクチャが変化していることです。今やほとんどの主要翻訳ツールが生成AIの基盤技術を採用しており、「どの生成AIに何を入力してよいか」が企業にとっての実務的な問いになっています。
2. 主要ツール別データポリシーの比較
生成AIツールのデータ取り扱いは、個人向け無料版/有料版/法人向けサービス/APIによって大きく異なります。主要4ツールの状況を整理します。
ChatGPT(OpenAI)
| サービス・区分 | モデル学習への利用 | 保存・確認上の主な注意 |
|---|---|---|
| 個人向けFree/Plus/Pro | 設定によりモデル改善に利用される場合がある | データコントロールから学習利用を停止できる。個人向け有料プランであっても、法人向けデータ保護が自動的に適用されるわけではない |
| Temporary Chat | モデル学習には使用されない | 履歴には残らず、原則として30日以内に削除される。不正利用監視のために確認される場合がある |
| ChatGPT Business/Enterprise/Edu | デフォルトではモデル学習に使用されない |
組織の管理者設定、保存期間、利用機能、フィードバック機能等を確認する |
| OpenAI API | デフォルトではモデル学習に使用されない | 通常は不正利用監視用のデータが最大30日間保存される。対象となる組織では、Modified Abuse MonitoringやZero Data Retentionを利用できる場合がある |
事例:サムスン電子(2023年)
ChatGPT社内利用を許可したところ、エンジニアが半導体関連の機密ソースコードを入力し、社内機密情報が流出する事案が20日間で3件発生しました。同社はその後、ChatGPTの社内利用を原則禁止とする緊急措置を実施しています。
Google Gemini
| サービス・区分 | モデル学習への利用 | 保存・確認上の主な注意 |
|---|---|---|
| 個人向けGeminiアプリ | 一部のチャットがサービス改善や人間によるレビューの対象になる場合がある | 人間がレビューしたチャットと関連データは、ユーザーが削除した後も最大3年間保存される場合がある |
| Google AI Pro/Ultraの個人向け利用 | 個人向けGeminiアプリのデータ条件が適用される場合がある | 有料契約だけで、法人向けGoogle Workspaceと同等の保護が適用されるとは限らない |
| 対象のGoogle Workspace法人・組織向け環境 | チャットやアップロードファイルは、人間によるレビューや生成AIモデル改善には使用されない | 対象となる契約プラン、アカウント種別、管理者設定、保存期間を確認する |
Googleの「Gemini アプリのプライバシーハブ」によると、無料版では入力したプロンプト・回答・アップロードファイルがサービス改善目的で保存され、人間のレビュアーが内容を閲覧する可能性があります。レビュー対象となったチャットは、削除後も最大3年間保存される場合があります。
Claude(Anthropic)
| サービス・区分 | モデル学習への利用 | 保存・確認上の主な注意 |
|---|---|---|
| 個人向けFree/Pro/Max | ユーザーがモデル改善への利用を許可した場合などに使用される | モデル改善への利用設定、フィードバック機能、チャットの保存・削除条件を確認する |
| Claude for Work/Team/Enterprise | デフォルトではモデル学習に使用されない | 組織の保存期間や管理者設定を確認する。Enterpriseでは保存期間を設定できる場合がある |
| Anthropic API | デフォルトではモデル学習に使用されない | 入出力データは原則として30日以内に削除されるが、不正利用対策、法的義務、使用機能等による例外がある |
| Zero Data Retention | モデル学習には使用されない | 対象となるAnthropic API等に個別契約で適用される。Claude EnterpriseのWeb版全体に標準適用される機能ではない |
DeepL
| サービス・区分 | モデル学習への利用 | 保存・確認上の主な注意 |
|---|---|---|
| DeepL無料版 | 法人向け機密データ処理を前提とした契約ではない | 機密情報、個人情報、未公開情報を入力する前に、利用規約とプライバシー条件を確認する |
| DeepL Pro(有料) | 顧客の入力内容を一般モデルの学習に使用するサービスではない | サービス提供に技術的に必要な範囲で一時的に処理・保存される。特定のエラー発生時には、デバッグ目的で暗号化して最大72時間保存される場合がある |
| DeepL API Pro | DeepL Proの法人向けデータ保護条件が適用される | APIのプラン、保存機能、利用する連携サービス、データ処理契約を確認する |
| DeepL API Free/Developer | プランの利用条件を個別に確認する必要がある | 個人データの処理が規約上制限されている場合があるため、個人情報や機密情報を含む文書への利用には注意が必要 |
3. 機密文書を入力する前に確認すべきポイント
以下のチェックリストをもとに、使用しているツールの条件を確認することをおすすめします。
☐使用しているのは個人向け無料版か、法人向け有料プラン・APIか
☐入力データが学習に利用されないことが利用規約上で明記されているか
☐データの保存期間・削除条件が規約に記載されているか
☐人間のレビュアーが入力内容にアクセスできる条件になっていないか
☐日本の個人情報保護法・社内の情報セキュリティポリシーに抵触しないか
☐取引先・委託元との契約(NDA等)で生成AIサービスへの入力が制限されていないか
取引先から受領した機密情報については、NDAや業務委託契約で第三者への開示、外部クラウドサービスの利用、再委託等が制限されていないか確認する必要があります。生成AIへの入力が契約違反となるかは、契約条項とサービスの利用条件によって異なります。
文書内容・用途別の主な確認事項
| 文書の種類 | リスク | 判断の目安 |
|---|---|---|
| 社内報告書・一般業務文書 | 比較的低い | 法人向けプランかつ設定確認の上での利用を検討できる |
| 契約書・NDA・法務文書 | 高い | 契約上の制限・誤訳リスクを踏まえ、専門翻訳者への依頼を検討することが望ましい |
| 患者情報・医療記録 | 高い | 要配慮個人情報を含む可能性が高いため、利用目的、本人同意、委託・第三者提供の整理、サービス側の学習利用や保存条件を確認し、社内の個人情報保護・情報セキュリティ担当者の判断を得る。 |
| 未公開情報・IR資料 | 高い | インサイダー情報の管理として、社内規程・コンプライアンス部門への確認が必要 |
| 官公庁・自治体の公文書 | 中〜高い | 機関のセキュリティポリシーおよびAI利用ガイドラインに従う |
4. 対応策の3つの方向性
| 方向性 | 内容・向いているケース | 注意点 |
|---|---|---|
| 法人向けプランへの切り替え | 機密性は中程度で翻訳量が多い場合。ChatGPT Business/Enterprise、Gemini for Workspace、Claude for Work/Enterprise、DeepL Proなど法人プランを選択し、利用規約・DPAを確認する | 法人プランでも、フィードバック機能・人間レビューの有無など条件の細部に違いがある。規約の確認は個別に必要 |
| 外部生成AIへ原文を入力しない翻訳工程 | 契約書・医療・金融・官公庁文書など機密性・正確性・説明責任が特に重要な文書。翻訳会社のNDA対応・ISO 27001・ISO 17100等の認証を確認した上で依頼する | コスト・納期は生成AI翻訳より高くなる場合がある。翻訳会社へ依頼する場合は、ISO 27001等の情報セキュリティ体制の有無だけでなく、当該案件で生成AI・機械翻訳・クラウドサービスを使用するか、データをどこに保存するかを個別に確認する |
| 文書の種類で使い分ける | 翻訳業務量が多く文書の機密度がさまざまな場合。社内で「生成AIに入力してよい文書/入力しない方がよい文書」の判断基準を策定し、運用ルールを設ける | 判断基準の社内周知と、ツールのデータポリシー変更に応じた定期的な見直しが必要 |
5. 社内展開時に避けるべき表現と推奨表現
生成AIのリスクを社内に周知する際は、過度に不安を煽る表現は避けることをおすすめします。正確な情報に基づいた表現が、適切な運用につながります。
| 避けるべき表現 | 推奨表現 |
|---|---|
| 「生成AIは情報漏洩の危険があるから全面禁止」 | 「文書の種類と使用するサービスの区分・設定によって、生成AIの利用可否を判断する」 |
| 「AIに入力したら必ず漏洩する」 | 「個人向け無料版では、データの学習利用や人間レビューの条件を事前に確認する必要がある」 |
| 「法人プランなら何でも安全」 | 「法人向けプランでも、利用規約・データ処理条件・フィードバック機能の扱いを確認することが重要」 |
社内向け案内文サンプル(コピーしてご利用いただけます)
社内案内文サンプル
【翻訳業務における生成AI利用に関するご連絡】
翻訳業務でChatGPT・Gemini・Claude等の外部AIサービスを利用する際は、以下をご確認ください。
- 会社が承認していない個人向けアカウントには、機密情報、個人情報、未公開情報を入力しないでください
- 会社が契約する法人向けサービスであっても、学習利用、保存期間、人間によるレビュー、利用地域、フィードバック機能等の条件を確認してください
- NDA、業務委託契約、顧客指定のセキュリティ条件がある文書は、外部サービスへ入力する前に担当部門へ相談してください
- 文書を匿名化して使用する場合も、個人や取引先を再識別できる情報が残っていないか確認してください
判断に迷う場合は、情報システム部門、法務部門または情報セキュリティ担当者へお問い合わせください。
まとめ
- 現在の翻訳ツール市場は専用翻訳エンジンから生成AI(ChatGPT・Gemini・Claude・DeepL等)へと移行しており、データポリシーの確認が実務的な課題になっている
- 生成AIツールのデータ取り扱いは、個人向け無料版・有料版・法人向けサービス・APIで大きく異なる
- Gemini無料版では、人間のレビュー対象となったチャットと関連データが、最大3年間保存される場合がある
- ChatGPT Business/Enterprise・Claude for Work/Enterprise・Gemini for Workspaceは、デフォルトで学習に使用しないことを規約で明記している
- DeepL API Developerでは、個人データの処理が規約上制限されているため、対象文書と契約条件の確認が必要
- NDAを締結した取引先の文書を生成AIに入力することは、契約違反になる可能性がある(AI事業者ガイドライン参照)
- 契約書・医療・金融・官公庁文書など機密性の高い文書は、生成AIへの入力を避ける判断が情報管理上の合理的な選択となる場合がある
使用しているツールのデータポリシーが分からない、または機密文書の翻訳方法について判断に迷う場合は、専門翻訳会社へのご相談をご検討ください。生成AIサービスへの入力を行わない人間翻訳のオプションも含め、文書の種類と機密性に合わせた翻訳方法をご提案します。
参考資料
・OpenAI「How your data is used to improve model performance」 https://help.openai.com/en/articles/5722486-how-your-data-is-used-to-improve-model-performance
・OpenAI「Data Controls FAQ」 https://help.openai.com/en/articles/7730893-data-controls-faq
・OpenAI「Enterprise privacy at OpenAI」 https://openai.com/enterprise-privacy/
・OpenAI「Data controls in the OpenAI platform」 https://developers.openai.com/api/docs/guides/your-data
・Google「Gemini アプリのプライバシーハブ」 https://support.google.com/gemini/answer/13594961?hl=ja
・Google「Generative AI in Google Workspace Privacy Hub」 https://knowledge.workspace.google.com/admin/gemini/generative-ai-in-google-workspace-privacy-hub
・Anthropic「Is my data used for model training?(Commercial Customers)」 https://privacy.claude.com/en/articles/7996868-is-my-data-used-for-model-training
・Anthropic「Is my data used for model training?(Consumer Products)」 https://privacy.claude.com/en/articles/10023580-is-my-data-used-for-model-training
・Anthropic「How long do you store my organization's data?」 https://privacy.claude.com/en/articles/7996866-how-long-do-you-store-my-organization-s-data
・Anthropic「I have a zero data retention agreement with Anthropic. What products does it apply to?」 https://privacy.claude.com/en/articles/8956058-i-have-a-zero-data-retention-agreement-with-anthropic-what-products-does-it-apply-to
・DeepL「DeepL Pro Terms and Conditions」 https://www.deepl.com/en/pro-license
・個人情報保護委員会「生成AIサービスの利用に関する注意喚起等について」 https://www.ppc.go.jp/news/careful_information/230602_AI_utilize_alert/
・総務省・経済産業省「AI事業者ガイドライン」 https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/
・Reuters「ChatGPT fever spreads to US workplace, sounding alarm for some」 https://www.reuters.com/technology/chatgpt-fever-spreads-us-workplace-sounding-alarm-some-2023-08-11/
・ISO「ISO 17100:2015 Translation services — Requirements for translation services」 https://www.iso.org/standard/59149.html
・ISO「ISO 17100:2015/Amd 1:2017 Translation services — Requirements for translation services — Amendment 1」 https://www.iso.org/standard/71047.html
※各サービスの名称、利用条件、データの保存期間および学習利用方針は変更される場合があります。実際に利用する際は、各サービスの契約区分・設定を含め、公式ウェブサイトで最新情報をご確認ください。
AI翻訳・生成AIと翻訳セキュリティに関連する記事:
・契約書翻訳を依頼する際の8つのポイント
・ChatGPT翻訳 × プロ翻訳チェックサービス