AI開発における知的財産権について

こんにちは!Insight Edgeでコンサルタントとして働いている山田です。

この記事では、AI開発プロジェクトにおいてよく議論になる「知的財産権の帰属」について、 クライアントとの契約時に注意すべきポイントをまとめました。

本記事は経済産業省が策定している「AI・データの利用に関する契約ガイドライン」を参考に、 特にAIモデルの知的財産権に焦点を当てて解説しています。 もしご興味があれば、ガイドラインも併せてご覧頂けると、より理解が深まるかと思います。(全362ページの大作!)

「AI・データの利用に関する契約ガイドライン 1.1版」を策定しました (METI/経済産業省)

1.知的財産権とは?

知的財産権の種類

知的財産権とは、様々な知的創造活動によって生み出されたものを、創作者の財産として保護するために存在する権利です。 知的財産権と一口にいっても、創作意欲の促進を目的とした「知的創造物についての権利」と、使用者の信用維持を目的とした「営業上の標識についての権利」の2つに大別されます。

特許庁「知的財産権について」より抜粋、一部改変

2. AI開発において発生する知的財産権

知的財産権には上記の通りいくつも種類がありますが、AI開発において重要となるのは以下3種類です。

  • 特許権

技術的に新規性のある発明に対する権利。AI開発ではアルゴリズムや機械学習モデル、アーキテクチャ等に適用されます。

  • 著作権

著作物や創作物に対する権利で、AI開発ではソースコードやアルゴリズム、データセット、データベース等が該当します。

  • 営業秘密

企業独自の情報を企業秘密として保持する権利です。研究開発成果やノウハウ等が当てはまります。

何に対して知的財産権が発生するのか

そもそも、どのようなデータや成果物が知的財産権の対象となるのでしょうか。 AI開発のフローに沿って考えると、検討する必要のある構成要素として以下の6つが考えられます。

①生データ

加工や編集がされていない、元々の状態のデータ

②学習用データセット

前処理やクレンジングを行った、AIモデルが学習できる形式に整理されたデータの集合

③学習用プログラム

AIモデルが学習するために使用されるソフトウェアやアルゴリズム

④学習済みモデル

学習用データセットを用いて訓練されたAIモデルで、最適化されたパラメータが組み込まれた推論プログラム

⑤学習済みパラメータ

AIモデルが学習用データセットを用いて訓練される過程で最適化された重みなどの値

⑥ノウハウ

AI開発プロセス全体における独自の技術や知識

知的財産権の発生の観点では、これらを「データ」「プログラム」「ノウハウ」の3つに大別することができます。

経産省「AI・データの利用に関する契約ガイドライン」より作成

知的財産権の発生と帰属のデフォルトルール

上記6つのどの要素に知的財産権が発生するか、発生する場合誰に帰属するかは、あらかじめ法的に定められています。

「営業秘密」は特定の要件(※1)を満たす場合はいずれも共通して発生するため、以下では各要素が「特許権」「著作権」に該当するかどうかを、それぞれ見ていきたいと思います。 (※1)秘密管理性、有用性、非公知性の三要件

最初に結論を以下の表にまとめました。 それぞれの根拠は後述しますが、少し細かくなるのでざっくり以下のようなイメージです。

  • データ

特許権も著作権も発生しないことが多い。利用権については契約で定める必要あり。

  • プログラム

基本的に特許権および著作権は発生し、作成者であるベンダーが保有することが一般的。利用権については契約で定めることでユーザーも柔軟な利活用が可能。

  • ノウハウ

特許権も著作権も発生しないことが多い。利用権については契約で定める必要あり。

経産省「AI・データの利用に関する契約ガイドライン」より作成

(参考)知的財産の発生有無と権利帰属のデフォルトルール

①生データ

ユーザー側が提供する生データは、単なる事実や情報の集積(ログデータや気象データなど)であるケースが多く、その場合は知的財産には該当しません。ただし、生データに著作物性(写真、音声、映像、小説等)が認められる場合は、「著作権」が発生する可能性があります。

帰属については、生データが営業秘密にも該当しない場合は、知的財産が発生しないため、契約によって利用方法を個別に定める必要があります。

②学習用データセット

生データを加工したとしても単なる情報の集積に過ぎないため、知的財産には該当しないケースが多いです。一方で、情報を体系的に整理し、データ抽出を容易にするような創作性を有する場合は、「データベースの著作物」に該当し、「著作権」が発生する可能性があります。

帰属については、ベンダーのノウハウのみを使用してデータセットを作った場合はベンダーが保有者となり、ユーザーとベンダーが共同で作成した場合は共同所有となることが多いです。

③学習用プログラム

一般的な「プログラム」と同じく、ソースコード部分は著作物として「著作権」が発生し、アルゴリズム部分は特許法上の要件を満たせば「特許権」を有する可能性があります。

帰属については、著作権を持つのは著作者であり、特許権を持つのは発明者であるため、これら権利は基本的にベンダー側に帰属することが一般的です。

④学習済みモデル

学習モデルのうち、「推論プログラム」は③の学習用プログラムと同じ整理になるため、ソースコード部分は著作権が、アルゴリズム部分は要件を満たせば特許権が発生します。「学習済みパラメータ」は⑤でも説明しますが、大量の数値データに過ぎず創作性等が認められないため、知的財産権の対象にはならない可能性が高いです。

帰属については、「推論プログラム」部分は、作成したベンダーに帰属することが基本です。

⑤学習済みパラメータ

学習用プログラムにより自動的に生成される大量の数値データに過ぎないため、創作性が認められず、著作物も特許権も発生しない可能性が高いです。(一方、プログラムに準ずるものや著作性を持つと判断される見解もあり、定まっていないのが実情です)

帰属については、営業秘密にも該当しない場合は、知的財産権が発生しないため、契約によって利用方法を個別に定める必要があります。

⑥ノウハウ

AI開発には様々なノウハウが必要になりますが、ノウハウ自体は無形物であるため著作権の対象にはならないものの、発明の要件を満たす場合は特許権の対象になります。

帰属については、営業秘密にも発明にも該当しない場合は、知的財産が発生しないため、契約によって利用方法を個別に定める必要があります。

3. 知的財産権に関する契約の勘所

AI開発における「データ」、「プログラム」、「ノウハウ」について、知的財産に該当するかどうかは法的に定められており、一般的な解釈については理解できました。

一方で契約で争点になりやすいのが、「知的財産権がユーザーとベンダーのどちらに帰属するか」という点です。

先ほどのデフォルトルールのうち、法的に明確なのは「プログラム」で、基本的に作成者であるベンダーに知的財産権は帰属することになります。一方で、「データ」「ノウハウ」については、営業秘密や発明に該当しない場合は、原則ユーザー/ベンダー双方が自由に利用可能となってしまうため、契約によって利用条件を定める必要があります。

AI開発の知財帰属で、ユーザーとベンダーは対立しがち

AI開発プロジェクトにおける権利帰属の議論の際、以下のようなやりとりがよく見られます。

双方が権利の帰属を主張し続ける限り、平行線のまま交渉に時間と労力だけを費やすことになります。ここで重要となるのが、「権利帰属にこだわるのではなく、利用条件で実をとること」です。

成果物をビジネスで利用する際、知的財産権を所有していなかったとしても、利用に制限がなく自由度が高ければ、実務上不都合が生じることは少ないです。そのため、個人的には権利の有無よりも、いかに自社にとって有利な利用条件とできるかの方が肝と考えます。

知的財産権の利用条件の定め方

利用条件の定め方に正解は無く、実態に応じて都度検討する必要がありますが、ユーザー/ベンダーがそれぞれ何を求めているかを相互によく理解した上で、利用条件を細かに設定することが重要です。 利用条件を定める上で考慮すべきポイントとしては、以下のようなものが考えられます。

  • 利用目的

契約に規定された開発目的に限定するか否か

  • 利用範囲

利用者がAIモデルをどの程度の範囲で使用できるか

  • 利用期間

契約期間や終了条件の明示

  • 第三者への利用許諾・譲渡可否

他社への提供や横展開を認めるか

  • 利益配分

ライセンスフィー、プロフィットシェア

プログラムの部分はベンダー側に帰属させる方が良い

それぞれの知的財産権は、ユーザー、ベンダーいずれにも権利帰属させることは可能ですが、個人的にはAIモデルのプログラムに関する部分はベンダー側で保有する方がメリットが大きいと感じます。

例えば、AIモデルは技術発展のスピードが著しく、開発したモデルの陳腐化が早いことを踏まえると、ベンダー側に権利帰属させることで、アップデートや再学習を柔軟に行うことができます。ユーザー側には、ビジネス展開上不自由のない利用条件を付与することで双方の利益が最大化する可能性が高いです。

また、ユーザー側の懸念として、ベンダーが知的財産権を利用して競合他社へ横展開することを避けたい場合は、開発後一定期間の目的外利用や協業的利用をベンダーに禁止する等の契約とすることも可能です。

このように、権利帰属にこだわるのではなく、双方にとって不都合のない利用条件となるように、契約内容を協議することが重要になると思います。

ちなみにInsight Edgeでは、知的財産権の帰属は可能な限り自社に保有する契約にすることが多いです。 Insight Edgeの場合、ユーザーのほとんどは住友商事グループの事業会社ですが、対象とする業界や課題が多岐にわたるため、個別開発したAIモデルが他業界や事業会社に展開できるケースが少なくありません。

その際に、Insight Edgeにソリューションやノウハウを集積し、スピーディーに展開できるようにすることで、グループ全体の利益創出が期待できるためです。

4. まとめ

AI開発における知的財産権にフォーカスし、契約においてユーザーとベンダーの間で論点となりやすいポイントをまとめました。

AIソリューションをビジネス展開する上で、知財戦略は重要な観点な一方で、AI技術の急速な普及により、AI技術の特性を当事者が理解しきれていないことや、権利関係・責任関係等の法律関係が不明確であるなど、契約に関するベストプラクティスが十分に確立されていないのが実情です。したがって、契約締結においてはビジネスの実態に踏まえた最適な内容となるよう、当事者間でしっかりと認識を合わせることが重要となります。

経産省が発表している「AI・データの利用に関する契約ガイドライン」では、具体事例も交えながら分かりやすくまとめられていますので、こちらも是非参考にして頂ければと思います。

参考記事・資料