Shuji Sado (佐渡 秀治)
@shujisado
Followers
5K
Following
247
Media
249
Statuses
9K
Open Source guy, Chairman of Open Source Group Japan (https://t.co/ABuJgbgsLb), former CEO of OSDN K.K.(to 2020)、オープンソースとガラパゴスの人、インターネット青年団
Tokyo
Joined May 2009
「GPLコードを学習したAIモデルにGPLが伝播する理論の現在地」公開! 数年前にはGPLツールを学習した結果物のAIモデルにはGPLが伝播するのでは?と普通に言われていた。GPLリンク例外の仕組みを知る者なら尚更 生のGPLコードをモデルが取り込めばGPLになると思うわけである。 https://t.co/tZpIWy4D27
shujisado.com
2021年にGitHub Copilotが登場した当時、そのモデルの学習データにGitHub上のあらゆる公開さ…
1
66
101
で、見ているとやはりフォークの流れは弱そうね。相当に強い組織か集団でも出てこないと無理だけど、現状で代替があるので可能性は低い。SeaweedFS、Garage、Cephのいずれかに流れる感じだな。
0
1
10
You remember COVID era censorship, right? They banned us from their apps. They deplatformed alternate views and tried to silence any form of opposition. That's why we built Unplugged. So when the chips are down, we know we have an independent platform that will have our back.
0
239
897
MinIOの件、いずれオープンソースをやめる気配は漂っていたので、タイミングがReact2Shellと重なったので自分の中でどいつもこいつもと思ったぐらいな程度。シングルベンダー系は企業のモチベが消えた時点で、撤退やライセンス変更リスクを考慮しない大規模採用は控えるべきという教訓になるだろう。
1
13
57
強硬な反対派もなんだかんだでGPL伝播論のようなことは無理筋だと理解していたわけだけど、かといって押し切るほどの確定的な話でもなく、先送りしたい話ではあったけども世間がそれを許さなかったのだよね。
0
0
2
この前書いたAIモデルへのGPL伝播理論の話はこの部分が大きな意味がある。OSIが作った「オープンソースAIの定義」は、学習データのオープンソースのライセンス契約を引き継がないことを前提としているのだよね。これが二年も議論が必要だった一つの要因。 https://t.co/tZpIWy4D27
1
1
6
おや? BunがAnthropicに買われたのか。 まあ、Claude Codeの基盤がBunっぽいし、Bunの方はVC資金入れてるのにマネタイズ苦しかっただろうし、相性は良いのだろう。というか、Anthropicってこれが初の買収事案かな。
Bun is joining Anthropic! https://t.co/06NlXDZhNE
0
4
10
ついこの間に最上階の部屋のチラシが届いたのだけど、価格は書いてなかったけどおそらく2億円超えるんだよな。この場所で高級路線はどうなんやろなと、そっちのほうが気になるね。
0
0
1
著作権的には出力は翻訳サービス側ではなく元データの翻案だし、ToS的に問題となるサービスは今時はなさそう。結局はコミュニティが受け入れる質のハードルや責任所在の話になる。うん、やはりAI生成コードと同じような構図だな。
1
2
7
ふーむ、こんなことあったのか。翻訳サービスの出力をオープンソースプロジェクトで使えないという昔の議論だけども、著作権、契約(ToS)、コミュニティルールがごっちゃになってるね。というか、これって今書いてるAI出力の著作物性の話とよく似た話ではある。 https://t.co/XF73Qx91fx
Nani、ずーっと気になってるんだけど、翻訳の権利周りがどうなんだろうと思って放置してる。Ubuntuの翻訳にGoogle翻訳突っ込んでライセンス違反で大問題になったあれが怖くて…… https://t.co/cKxsdGNwiP これ避けたくてDeepL Pro使ってる。でももうそういうのを気にすること自体が時代遅れなのかも…
1
13
61
先週のLLM-jpのシンポジウムで話した内容のスライド。ほぼ有りモノを抜いただけだけど、AIシステムが入力-モデル-出力の三層が連動する権利チェーンになっていることと、著作権以外の権利が大きく絡むことの二点が重要と理解すれば良い。 https://t.co/3s3HOGEx3n
speakerdeck.com
2025年11月25-26日開催のLLM-jpのシンポジウムに急遽呼ばれて話したスライド。AIシステムでのオープンが何故難しいのか?という疑問の解説に近い。
0
18
87
さて、ドイツの訴訟があったので乗っかってGPL伝播理論とか書いたけど、次は前々から予定のAI生成コードの著作物性の話を書く。
0
0
6
AI生成コードに著作物性がないとよく言われるわけだが、このような第三者コードの複製と評価されるコードは元の学習コードの著作権者の権利となる。このあたりは少なくとも日米欧で同じ。
0
3
4
GPL伝播が未確定なのはGPLを学習したモデルであって、出力への伝播については主要法域で一致している。当然であるが、出力コードが著作権法上で元GPLコードの複製物又は二次的著作物と見做せる場合、当該コードを頒布する者は元コードのGPL条件を遵守しする義務が発生し、怠ればGPL違反となる。
「GPLコードを学習したAIモデルにGPLが伝播する理論の現在地」公開! 数年前にはGPLツールを学習した結果物のAIモデルにはGPLが伝播するのでは?と普通に言われていた。GPLリンク例外の仕組みを知る者なら尚更 生のGPLコードをモデルが取り込めばGPLになると思うわけである。 https://t.co/tZpIWy4D27
1
8
14
ほぅ、本職は流石だな。昨日、LLM-jpのシンポジウムの最後の最後に国産LLMのことについて聞かれて、「諦めないことが大事」と言ったんだよね。「どうも生成AI領域に関しては今までのIT領域のようなトップ総取りにはなりにくいようなので」とね。後はQwen使えというのは辛いので頑張ってねとも言った。
Gemini3, Nano Banana Pro登場で, 先月時点で私がTBSの以下番組で「OpenAIは危うい.Googleが勝つ」としてたのが注目(特に投資家層?)されてるようです 実際は公には以下記事で2024年OpenAI絶頂期からずっとGoogle有利とみてます 長い(私のX史上最長)ですが根拠, OpenAI vs Googleの展望を書いてみます
0
19
118
OSIはデジタル公共財関係の団体や国連とも関係を構築しているが、それは我々が完全にデジタル公共財の範疇に含まれることを意味しない。
0
2
6