これは良い記事、と思ったらやはり日経コンピュータの中田さんでした↓
商用課金モデル(ビジネス故:)に対しOSS版は一般にGPLなりMITライセンスなりで無償提供される場合が多いがChatBotで問題となる(というか教師データに膨大な投資を必要とする機械学習全般に言えるのだろうが)のは自然言語処理のコーパスや所謂学習済モデルの構築に要する膨大な工数とデータを既存の類似モデルから生成する事が問題視(と言ってよいのだろう)されつつあるらしい。視野が狭すぎるかもしれないが端的に言えば教師データの知的財産権なり著作権なりで保護しないとコピー/改竄され放題という毎度の事象がOSSという知財や著作権とはある意味異世界な価値観に解き放たれると何が起こったかを反芻し、反応するのだろう。
パンドラの壺は開いてしまったのに。。。
20230509 10:05 : 学習済モデルの記述誤り修正