Yuyang DONG @touuyou001 X Profile

Yuyang DONG

@touuyou001

Followers

687

Following

4K

Media

825

Statuses

5K

Chinese, Ph.D., SB Intuitions (LLM team tech lead), ex-NEC (contributed to cotomi LLM models), 投資と不労取得に興味

https://t.co/ImPfGgb4XU

東京中央区

Joined March 2014

Don't wanna be here? Send us removal request.

Yuyang DONG

@touuyou001

17 days

Sarashina LLM 作る仲間募集中！ぜひ気軽にご連絡！カジュアル面談も、会社で話しましょう。 https://t.co/Gvutd05AHR

open.talentio.com

0

10

48

Yuyang DONG

@touuyou001

10 hours

正直日本ではLLM作るには、こういうような組織はまだないね。それに向いて頑張っているところはあるはあるけど(うちも)

Yuyang DONG

@touuyou001

10 hours

scaling law の壁の前にはショートカットがないですね。おとなしくてデータ品質up, GPUインフラ、FT, RL環境整備、論文TR結果そのまましんじてではなく、自分の環境でちゃんと実験やる。これは全部揃えてからまたアルゴリズムの新規探索か。日本か、世界ではこれ全部揃えるところはわずかですね。。

0

4

Yuyang DONG

@touuyou001

10 hours

scaling law の壁の前にはショートカットがないですね。おとなしくてデータ品質up, GPUインフラ、FT, RL環境整備、論文TR結果そのまましんじてではなく、自分の環境でちゃんと実験やる。これは全部揃えてからまたアルゴリズムの新規探索か。日本か、世界ではこれ全部揃えるところはわずかですね。。

シェイン・グウ

@shanegJP

17 hours

研究者の価値は、論文の引用数だけで測れるものではありません。実際、OpenAIやAnthropic、GoogleDeepMind、xAIといったトップ企業で活躍する人材を見ても、必ずしも著名な研究室の出身者やPhD取得者ばかりではありません。むしろ、圧倒的なエンジニアリング能力や実装力を持つ「無冠の実力者」が中核

0

1

9

Yuyang DONG

@touuyou001

14 hours

確かにMSR Beijing 出身の人は、今のdeepseek, Kimi, GLM チームに活躍している

0

1

シェイン・グウ

@shanegJP

19 hours

GoogleBrainTokyo（現GoogleDeepMindTokyo）は2017年頃から存在し、実はアジア初のGoogleBrainの拠点でした。しかし、日本でその存在を知る人はどれくらいいるでしょうか？もっとインパクトがあり、目立つ存在になれたはずです。当初は、JeffDeanとも親しく、奥様が日本人で流暢な関西弁を話すドイツ人

3

126

764

dr. jack morris

@jxmnop

2 days

some hypotheses for what “better pretraining” could mean - integration with other training stages: i’m guessing they’re finally at a point where post-training perf (eg SWE-Bench) can be used as signal for pretraining eng decisions - filtering: scaling approaches like influence

Oriol Vinyals

@OriolVinyalsML

3 days

The secret behind Gemini 3? Simple: Improving pre-training & post-training 🤯 Pre-training: Contra the popular belief that scaling is over—which we discussed in our NeurIPS '25 talk with @ilyasut and @quocleix—the team delivered a drastic jump. The delta between 2.5 and 3.0 is

14

21

311

Yuyang DONG

@touuyou001

2 days

100倍労力やっている。。。

シェイン・グウ

@shanegJP

2 days

そして先端モデルを作るのや価値があるプロダクトを作るのはいい論文を書くのより100倍労力が必要です。

0

17

Yuyang DONG

@touuyou001

2 days

やりたいことがいっぱいで今のリソースも考えて現実に優先度つけて、いつも最適化問題ですね。。。リソースと時間が無限ではないため、何をやるか何をやらないか、今のGPUが何をしたら将来でも役に立つ、どの技術セットを追いつく、開拓すべきか。は意思決定が大事。

0

1

Yuyang DONG

@touuyou001

2 days

長文モデルの学習は全部長文データではなく、短文も混ぜた方が良い。

0

1

2

Yuyang DONG

@touuyou001

3 days

これで1min出社になるかも

もちまま

@lr1f_4

3 days

ここに橋があればなぁ…と5億回妄想してる

0

2

シェイン・グウ

@shanegJP

3 days

この２年間大したモデルも作れていないし、プロダクトもない。論文のほとんどはインターン任せで、創業メンバーの論文も「AICudaEngineer」など炎上。シリコンバレー基準なら、この実績でシリーズB評価をここまで積むこと自体かなり不自然で、日本の盲目的な受託頼みで延命している印象が強い。そして

11

166

1K

Yuyang DONG

@touuyou001

3 days

弊社、生成AIモデルに対して、完璧なアノテータテスト体制で素晴らしい。

0

1

Yuyang DONG

@touuyou001

3 days

この仮説はGemini でも適用か

Yuyang DONG

@touuyou001

9 days

バージョンの整数部分は事前学習やり直し、少数部分事後学習やり直しと見えます。

0

2

Yuyang DONG

@touuyou001

3 days

https://t.co/GD2ddmPYWj Gemini3 pro, multimodal native sparse Moe, 多分事前学習から作り直した。

0

3

Yuyang DONG

@touuyou001

3 days

reviewer2 君。。。。。ちょっと。。。

0

Yuyang DONG

@touuyou001

4 days

髪カットする暇もない

0

Yuyang DONG

@touuyou001

4 days

あらら

日本経済新聞電子版（日経電子版）

@nikkei

4 days

マンション引き渡し前の転売禁止　違反で契約解除も、業界団体が方針 https://t.co/rrzmuOsvff

0

電子計算機の沼

@Hishinuma_t

4 days

CHIEシリーズTOP500 世界17, 25, 27位日本3, 4, 5位

0

7

29

Yuyang DONG

@touuyou001

5 days

セントラル月島も敗北

0

Yuyang DONG

@touuyou001

5 days

某AIと某リングというと後者応援

0

Yuyang DONG

@touuyou001

6 days

海ほたる

0

1