touuyou001 Profile Banner
Yuyang DONG Profile
Yuyang DONG

@touuyou001

Followers
687
Following
4K
Media
825
Statuses
5K

Chinese, Ph.D., SB Intuitions (LLM team tech lead), ex-NEC (contributed to cotomi LLM models), 投資と不労取得に興味

東京 中央区
Joined March 2014
Don't wanna be here? Send us removal request.
@touuyou001
Yuyang DONG
17 days
Sarashina LLM 作る仲間募集中! ぜひ気軽にご連絡!カジュアル面談も、会社で話しましょう。 https://t.co/Gvutd05AHR
Tweet card summary image
open.talentio.com
0
10
48
@touuyou001
Yuyang DONG
10 hours
正直日本ではLLM作るには、こういうような組織はまだないね。それに向いて頑張っているところはあるはあるけど(うちも)
@touuyou001
Yuyang DONG
10 hours
scaling law の壁の前には ショートカットがないですね。おとなしくてデータ品質up, GPUインフラ、FT, RL環境整備、論文TR結果そのまましんじてではなく、自分の環境でちゃんと実験やる。 これは全部揃えてからまたアルゴリズムの新規探索か。 日本か、世界ではこれ全部揃えるところはわずかですね。。
0
0
4
@touuyou001
Yuyang DONG
10 hours
scaling law の壁の前には ショートカットがないですね。おとなしくてデータ品質up, GPUインフラ、FT, RL環境整備、論文TR結果そのまましんじてではなく、自分の環境でちゃんと実験やる。 これは全部揃えてからまたアルゴリズムの新規探索か。 日本か、世界ではこれ全部揃えるところはわずかですね。。
@shanegJP
シェイン・グウ
17 hours
研究者の価値は、論文の引用数だけで測れるものではありません。実際、OpenAIやAnthropic、GoogleDeepMind、xAIといったトップ企業で活躍する人材を見ても、必ずしも著名な研究室の出身者やPhD取得者ばかりではありません。むしろ、圧倒的なエンジニアリング能力や実装力を持つ「無冠の実力者」が中核
0
1
9
@touuyou001
Yuyang DONG
14 hours
確かにMSR Beijing 出身の人は、今のdeepseek, Kimi, GLM チームに活躍している
0
0
1
@shanegJP
シェイン・グウ
19 hours
GoogleBrainTokyo(現GoogleDeepMindTokyo)は2017年頃から存在し、実はアジア初のGoogleBrainの拠点でした。しかし、日本でその存在を知る人はどれくらいいるでしょうか?もっとインパクトがあり、目立つ存在になれたはずです。当初は、JeffDeanとも親しく、奥様が日本人で流暢な関西弁を話すドイツ人
3
126
764
@jxmnop
dr. jack morris
2 days
some hypotheses for what “better pretraining” could mean - integration with other training stages: i’m guessing they’re finally at a point where post-training perf (eg SWE-Bench) can be used as signal for pretraining eng decisions - filtering: scaling approaches like influence
@OriolVinyalsML
Oriol Vinyals
3 days
The secret behind Gemini 3? Simple: Improving pre-training & post-training 🤯 Pre-training: Contra the popular belief that scaling is over—which we discussed in our NeurIPS '25 talk with @ilyasut and @quocleix—the team delivered a drastic jump. The delta between 2.5 and 3.0 is
14
21
311
@touuyou001
Yuyang DONG
2 days
100倍労力やっている。。。
@shanegJP
シェイン・グウ
2 days
そして先端モデルを作るのや価値があるプロダクトを作るのはいい論文を書くのより100倍労力が必要です。
0
0
17
@touuyou001
Yuyang DONG
2 days
やりたいことがいっぱいで今のリソースも考えて現実に優先度つけて、いつも最適化問題ですね。。。 リソースと時間が無限ではないため、何をやるか何をやらないか、今のGPUが何をしたら将来でも役に立つ、どの技術セットを追いつく、開拓すべきか。は意思決定が大事。
0
0
1
@touuyou001
Yuyang DONG
2 days
長文モデルの学習は全部長文データではなく、短文も混ぜた方が良い。
0
1
2
@touuyou001
Yuyang DONG
3 days
これで1min出社になるかも
@lr1f_4
もちまま
3 days
ここに橋があればなぁ…と5億回妄想してる
0
0
2
@shanegJP
シェイン・グウ
3 days
この2年間大したモデルも作れていないし、プロダクトもない。論文のほとんどはインターン任せで、創業メンバーの論文も「AICudaEngineer」など炎上。シリコンバレー基準なら、この実績でシリーズB評価をここまで積むこと自体かなり不自然で、日本の盲目的な受託頼みで延命している印象が強い。そして
11
166
1K
@touuyou001
Yuyang DONG
3 days
弊社、生成AIモデルに対して、完璧なアノテータテスト体制で素晴らしい。
0
0
1
@touuyou001
Yuyang DONG
3 days
この仮説はGemini でも適用か
@touuyou001
Yuyang DONG
9 days
バージョンの整数部分は事前学習やり直し、少数部分事後学習やり直しと見えます。
0
0
2
@touuyou001
Yuyang DONG
3 days
https://t.co/GD2ddmPYWj Gemini3 pro, multimodal native sparse Moe, 多分事前学習から作り直した。
0
0
3
@touuyou001
Yuyang DONG
3 days
reviewer2 君。。。。。ちょっと。。。
0
0
0
@touuyou001
Yuyang DONG
4 days
髪カットする暇もない
0
0
0
@touuyou001
Yuyang DONG
4 days
あらら
@nikkei
日本経済新聞 電子版(日経電子版)
4 days
マンション引き渡し前の転売禁止 違反で契約解除も、業界団体が方針 https://t.co/rrzmuOsvff
0
0
0
@Hishinuma_t
電子計算機の沼
4 days
CHIEシリーズTOP500 世界17, 25, 27位 日本3, 4, 5位
0
7
29
@touuyou001
Yuyang DONG
5 days
セントラル月島も敗北
0
0
0
@touuyou001
Yuyang DONG
5 days
某AIと某リングというと後者応援
0
0
0
@touuyou001
Yuyang DONG
6 days
海ほたる
0
0
1