yvbbrjdr Profile Banner
yv | AS8075 | N6YVB Profile
yv | AS8075 | N6YVB

@yvbbrjdr

Followers
6K
Following
3K
Media
463
Statuses
4K

exists as 451; opinions are my own; Creator of @LANDropApp, @AthenaAGI, LMRouter; Member of Technical Staff @MicrosoftAI; Ex-@NVIDIA

AS8075
Joined July 2013
Don't wanna be here? Send us removal request.
@yvbbrjdr
yv | AS8075 | N6YVB
7 days
关注一下我最近写的开源版OpenRouter:LMRouter. 支持llm/image/audio/embedding/video模型,提供OpenAI/Anthropic兼容接口. 云服务版本即将上线,敬请期待↓.
11
11
191
@yvbbrjdr
yv | AS8075 | N6YVB
19 hours
Anthropic真的做到如它名字那样,为全人类做贡献,把全人类聚到一起了吗?打着安全的旗号耀武扬威四处树敌,真的不是在为自己私欲考虑吗?它真的对得起自己PBC(public benefit corporation)的性质吗?.
19
1
70
@yvbbrjdr
yv | AS8075 | N6YVB
2 days
上了三天班,一个最大的感受就是2025年LLM能不能做起来,其实largely是一个工程问题,而不是一个科研问题。某些公司(我就不说哪个了)花大价钱买研究员,只能把那几个研究员带过来,并不能把那整套基础设施带过来。没有基础设施,LLM就是个空中楼阁。同时也没有人力能把适合这些研究员的基础设施搭起
Tweet media one
12
7
155
@yvbbrjdr
yv | AS8075 | N6YVB
2 days
RT @laike9m_: 一个观察:.在踏入职场约 3 ~ 4 年之后,人们很容出现倦怠,尤其是待在同一家公司。. 这时候:.- 你稍微有了一点积蓄,一人吃饱全家不饿.- 工作已经非常熟悉,失去了刚工作时的新鲜感.- 角色还是大头兵,却要承担更多的责任和压力….
0
68
0
@yvbbrjdr
yv | AS8075 | N6YVB
3 days
RT @himself_65: @yvbbrjdr 我用过Xcode你用过吗?.我给Safari做过兼容你做过吗?.我装过macOS beta.1你装过吗?.
0
1
0
@yvbbrjdr
yv | AS8075 | N6YVB
3 days
B200是没有后视镜的.CUDA是不长眼的.还有GPU上的编程语言是不通的.
1
0
31
@yvbbrjdr
yv | AS8075 | N6YVB
8 days
变换器感觉也不错.
1
0
3
@yvbbrjdr
yv | AS8075 | N6YVB
8 days
今天是我在 @nvidia 的最后一天。感谢这段旅程,让我见证了一个大公司如何做到全球第一,也收获了许多成长与朋友。. 下周我将加入 @MicrosoftAI,投入到大模型的研发中。🚀.
124
35
2K
@yvbbrjdr
yv | AS8075 | N6YVB
9 days
要不叫“词素”和“变形器”.
@JXQNHZr1yUAj5Be
Ningcong Chen
9 days
请问token和transformer有中文翻译了吗(惊喜).
7
0
9
@yvbbrjdr
yv | AS8075 | N6YVB
10 days
接着这个说。如果人类是从环境中获取randomness并detect patterns,那其实互联网上的熵比真实世界要小太多了,光用这些数据根本做不到“人类级别的”智能。.
@yvbbrjdr
yv | AS8075 | N6YVB
28 days
Intelligence is filtering and amplifying patterns detected in structured noise.
0
1
9
@yvbbrjdr
yv | AS8075 | N6YVB
10 days
用AI写了个新歌《立即马上开始 Vibe Coding》. 写给你的 @onenewbite.
0
2
6
@yvbbrjdr
yv | AS8075 | N6YVB
12 days
深感网上misinformation之多,任何半吊子都能出来评论一番,真正有价值的内容被震惊式营销内容埋没。人还是要先提高自己的知识水平。.
@techeconomyana
高级分析师
12 days
梁斌这条内容全错,还能扯这么一大通有的没的。点开Huggingface上的Deepseek模型配置文件就会看到,模型权重仍然是E4M3的。UE8M0是用作缩放因子,本身就是英伟达的MXFP8标准的一部分。这事压根颠覆不了英伟达。
Tweet media one
0
4
34
@yvbbrjdr
yv | AS8075 | N6YVB
14 days
RT @readyfor2025: 推特总是给我推荐各种独立开发、出海创业的内容,看了一年多,有很多现象和观点不敢苟同,说一下个人看法。.1….
0
187
0
@yvbbrjdr
yv | AS8075 | N6YVB
16 days
所以我觉得AI generated content在一定程度上是可以用模型检测的,因为它和正常人说话写文的分布就是不太一样.
@Jackywine
Jackywine
16 days
长时间接触 AI 的好处:.感觉大脑被锻炼了,基本上可以以毫秒级判断内容是否为 AI 生成.你有吗?.
2
1
5
@yvbbrjdr
yv | AS8075 | N6YVB
16 days
RT @lmsysorg: Reminder: SGLang x AMD SF Meetup is this Friday (Aug 22) at Shack15 🎉. Hands-on GPU workshop, talks from AMD/xAI/SGLang, food….
0
8
0
@yvbbrjdr
yv | AS8075 | N6YVB
17 days
RT @avstorm: Vibe Coding icon
Tweet media one
0
96
0
@yvbbrjdr
yv | AS8075 | N6YVB
18 days
文章里quote的那篇论文都没提到transformer。。.
0
0
2
@yvbbrjdr
yv | AS8075 | N6YVB
18 days
这篇文章写得挺扯的,以现在的参数量和训练数据量,现在的模型最多也只能underfit;而且我们模型大小还没scale出underfit之前就发现能力不上升了。. 模型里面现在也没发现能prune掉的参数。.
@MathewShen42
Mathew Shen
19 days
我很少称一篇文章insightful,但是这篇文章写的真的太好了!很有意思的一个观点是:"large networks succeed not by learning complex solutions, but by providing more opportunities to find simple ones." (1/2).
3
1
13
@yvbbrjdr
yv | AS8075 | N6YVB
18 days
湾区的小伙伴这周五来转转呀!可以见到 @sgl_project, @AMD@xai 的核心开发人员讲 LLM inference,还有一些很有趣的 GPU workshop。.
@lmsysorg
LMSYS Org
1 month
🔥 SGLang x AMD SF Meetup — Aug 22 🔥.We're teaming up with @AMD for a special AI Infra Meetup at SF. Here's what to expect:.1. An instructor-led GPU workshop to get hands-on with LLM infra on AMD GPUs.2. Talks by AMD, xAI, and the SGLang team on open-source roadmap, MoE
Tweet media one
1
1
11