shujisado Profile Banner
Shuji Sado (佐渡 秀治) Profile
Shuji Sado (佐渡 秀治)

@shujisado

Followers
5K
Following
245
Media
239
Statuses
9K

Open Source guy, Chairman of Open Source Group Japan (https://t.co/ABuJgbh0AJ), former CEO of OSDN K.K.(to 2020), ex-VA Linux、オープンソースとガラパゴスの人、インターネット青年団

Tokyo
Joined May 2009
Don't wanna be here? Send us removal request.
@shujisado
Shuji Sado (佐渡 秀治)
4 months
オープンソースAIの定義のページをOSG-JPに作ったので、今後はここを紹介するようにする。.
Tweet card summary image
opensource.jp
Open Source Initiative (OSI)が世界のオープンソースコミュニティによる共同設計プロセ…
@shujisado
Shuji Sado (佐渡 秀治)
9 months
昨日のオープンソースAIの定義 v1.0解説会のスライド資料です。我々が設定したオープンソースAIと呼べるラインの内側に入ってくるAIが一般的になるかは分かりませんが、少なくともオープンウォッシングや各国のAI法制に関する問題への対処ができたかと思います。.
Tweet media one
Tweet media two
Tweet media three
Tweet media four
0
12
38
@shujisado
Shuji Sado (佐渡 秀治)
8 hours
いや、意味はない、は語弊あるな。要はOpenAIとしては明確に違法行為をするなと明確に条件を課し、利用における法的責任が利用者側にあると帰属させているわけである。で、Apache-2.0とは補完関係にあり、法的文書として併存している。非常に単純ですが、良い手法だと思いますよ。.
0
7
32
@shujisado
Shuji Sado (佐渡 秀治)
8 hours
利用規約付いてるという話があるのだが、これしか分からない。「モデルの使用で適用される全ての法律を遵守することに同意したことになる」ということだけで、OpenAI側には違法行為しないことを全利用者に宣誓させたという意味がある。ただ、利用者側には特に意味はない。.
Tweet card summary image
huggingface.co
1
2
23
@shujisado
Shuji Sado (佐渡 秀治)
11 hours
要するに、彼らはオープンソース(Open Source)と堂々と呼称するために何が足りないのかをよく把握しているのだろう。まあ、今の所はこれで良い。.
1
6
43
@shujisado
Shuji Sado (佐渡 秀治)
11 hours
Apache-2.0にしたか。しかし面白い。Qwenに対して微妙に優位と言える性能を刻んでいて、まあその余裕の分を安全性に振り向けたようなものかな。で、モデル名のossという接中辞もそうだし、HFとGHページではOpen-weightと書き、この投稿ではコミュニティをopen-sourceと表現し、Open Sourceを避けている.
@OpenAI
OpenAI
17 hours
We released two open-weight reasoning models—gpt-oss-120b and gpt-oss-20b—under an Apache 2.0 license. Developed with open-source community feedback, these models deliver meaningful advancements in both reasoning capabilities & safety.
3
62
264
@shujisado
Shuji Sado (佐渡 秀治)
20 hours
あとはGitHub権威主義的な行動はやめたほうがいいとは思う。これはお節介だが。.正直、流れる情報を斜めに読むだけなので彼らがリバタリアニズムなのかアナーキズムなのかも知らんけども、権威主義的なのが多い昨今では精進して頂けばと思う。偉そうに書いてるが自分の立場的にこれぐらい書いてもね。.
1
0
13
@shujisado
Shuji Sado (佐渡 秀治)
20 hours
で、彼らのやろうとしていることはオープンガバメントとかシビックテックのようなものであるのでは?「我々のオープンソース」は確かにそれらの源流の一部かもしれないが、あくまで一部を本質のように語られるのは辛い。まあ、名称の僭称的利用をしないのならばそれで構わないのでよしなに。.
1
0
7
@shujisado
Shuji Sado (佐渡 秀治)
20 hours
初の名指しでチームみらい。自分としては良いと思ったことをどんどんやってくれと思う。頑張ってほしい。.ただ、現時点で評価することはない。彼らが何らかの成果を生み出したなら評価の対象となるが、まだ口先だけの者はそうではない。オープンソースと言いたいならそれぐらいは分かっているだろう。.
1
7
39
@shujisado
Shuji Sado (佐渡 秀治)
1 day
LlamaやGemmaのようなライセンスが本物の汚染だな。もはやLlamaはどれだけのデータとモデルに問題が潜むのか検討もつかない。検証も修復も困難で、いったん隠れるとどこまで汚染されるかわからず、法的にも不明瞭. .
@odashi_t
Odashi
1 day
LLM-jpコーパスのサブセットであるFineMathはLlamaの汚染があり使えないという結論になった。考えれば考えるほどLlamaがゴミだという結論になる.
0
8
11
@shujisado
Shuji Sado (佐渡 秀治)
4 days
ついでに書くと、IPAとSOFTICのGPLガイドをずっと大事にしている人らがいるけど、もう随分と世界が変わってしまったことに気付く必要がある。いつでも米国から刺されるリスクがある時代と考えた方が良い。.
0
1
7
@shujisado
Shuji Sado (佐渡 秀治)
4 days
この20年で随分とオープンソースの法的基盤というものは変わったと思うが、日本はここをアップデートしていないので諸外国から置いていかれた感がある。AI周辺はこの辺りの変化の総動員になるので突然問題が可視化されつつある。Llamaを商用できる!と弁護士が推奨しているのを見るとこりゃダメだと。.
1
4
13
@shujisado
Shuji Sado (佐渡 秀治)
4 days
先スレのように中国は法的な断絶によるバリアがあるし、先行が世界的成功を示したので単に同じことをすれば良いという意識だけかな。ただ、政府レベルではよく分かっている。.というか、オープンソースコンプラの世界にいると、中国の方が有識者と言えるレベルの者が多い。むしろ日本はほぼいない。.
@schroneko
ぬこぬこ | NUKO
5 days
中国のオープンウェイト界隈、何人か話を聞いた感じ、オープンウェイトのことをオープンソースと表現されていらしたので、あんまり区別されていなさそうだった。. 日本は有識者の方々のおかげでライセンス意識が高くて良いなと。それがモデル開発にとってプラスマイどちらかに転ぶかはわからないけど。.
2
6
29
@shujisado
Shuji Sado (佐渡 秀治)
4 days
何というか、気軽に中国と同じようなAIを作れと言うシャッチョサンとかいたりするわけだけど、法的には米国内と大差はなく、それでいて資本に圧倒的差があるという状況ではなかなかしんどい。一部の人らはよく踏ん張っていると思う。.
@shujisado
Shuji Sado (佐渡 秀治)
4 days
DeepSeek R1のLlama蒸留モデルについてはMetaからクレームできないものなのかと検討したが、思ってたより困難だな。まず訴状の送達が異常に長くて差し戻しも多く、証拠収集は中国当局が協力を拒否するだろうし、仮に米国で勝訴しても中国の裁判所が執行を承認しないわけか。これは無理だ。.
0
1
7
@shujisado
Shuji Sado (佐渡 秀治)
4 days
判例的には非著作物データでも同意があれば契約違反の追及が可能ではあるが、AI出力でも同様でいけるか見てみたいのだがね。というか、その前にLlamaライセンス的手法が消滅するかもしれんが。.
0
1
4
@shujisado
Shuji Sado (佐渡 秀治)
4 days
仮にDeepSeekが日本企業であれば、ハーグ送達条約ルートでの訴状送達は割とスムーズで、米国での判決も日本で強制執行可だろうから気軽にクレームがくるリスクがある。なるほど、これは中国がずっと地理的要因を利用できるターンが続くのだな。.
1
2
9
@shujisado
Shuji Sado (佐渡 秀治)
4 days
DeepSeek R1のLlama蒸留モデルについてはMetaからクレームできないものなのかと検討したが、思ってたより困難だな。まず訴状の送達が異常に長くて差し戻しも多く、証拠収集は中国当局が協力を拒否するだろうし、仮に米国で勝訴しても中国の裁判所が執行を承認しないわけか。これは無理だ。.
1
12
29
@shujisado
Shuji Sado (佐渡 秀治)
5 days
プロジェクト単位でAIポリシーが作成されるに任せるというのでも良いのだけど、貢献側のスタンダードが自然に決まっていくほうが良いと思うのよね。プロジェクト単位だとポリシーの差が大きくなりそうだし。.
0
2
2
@shujisado
Shuji Sado (佐渡 秀治)
5 days
AI出力コードの利用で微妙に厄介なのは、引用でのGPL出力のような第三者権利コードの問題ではなく、出力の著作物性の方だろう。今の所は作者が人間なのかAIなのかという点を伝達し合うということぐらいしか解がなく、Gitメッセージでコミット単位、SPDXヘッダーでファイル単位で表明していく方向かねぇ.
@shujisado
Shuji Sado (佐渡 秀治)
5 days
AI出力にGPLコードが混入したら?みたいな話が少し増えてる気がするが、AIを経由しようがGPLコードはGPLでしかなく違反リスクというのは当然あるものの、普通の企業ならAI側と社内システム内でのダブルでフィルタかけてるだろうから、著作物性があると考えられるほどの一致は起きないのではないかな。.
1
7
9
@shujisado
Shuji Sado (佐渡 秀治)
5 days
世界に存在するGPLコードのほぼ全ては学習済みだろうけど、GPLはそんなに多いわけでもない。まあ、エンジニアレベルではあまり深く考えることはないかもね。コンプラ関係者は別だが。.
0
3
5
@shujisado
Shuji Sado (佐渡 秀治)
5 days
小規模組織ではあり得るかもしれないが、条文でも30日で是正だし、それも目安でしかない。普通にGPL違反の一つとして進行するだけだろう。まあ、AI出力に第三者権利が残存する可能性を認識できない人がいると、ややこしいことが世界のどこかで起きることは否定せんけども。.
1
3
5
@shujisado
Shuji Sado (佐渡 秀治)
5 days
AI出力にGPLコードが混入したら?みたいな話が少し増えてる気がするが、AIを経由しようがGPLコードはGPLでしかなく違反リスクというのは当然あるものの、普通の企業ならAI側と社内システム内でのダブルでフィルタかけてるだろうから、著作物性があると考えられるほどの一致は起きないのではないかな。.
1
5
19