karminski-牙医 @karminski3 X Profile

karminski-牙医

@karminski3

Followers

29K

Following

2K

Media

2K

Statuses

4K

A coder, road bike rider, server fortune teller, electronic waste collector, co-founder of KCORES, ex-director at IllaSoft, KingsoftOffice, Juejin.

https://t.co/LWSjN208w4

Asia/Beijing

Joined December 2018

Don't wanna be here? Send us removal request.

karminski-牙医

@karminski3

1 day

继PaddleOCR后, 文心要硬起来了? LMArena 刚更新了榜单, 百度的文心大模型 5.0-preview 上榜了! 而且是全球第二! 从测试数据上看创意写作和长上下文测试分数非常高, 这意味着召回性能会很好. 注意看我的截图, 创意写作, 指令遵循, 长Query这三个, 甚至比GPT-5要高!

5

4

29

karminski-牙医

@karminski3

14 hours

我说啥来着，Unsloth 的1bit 动态量化来了未来如果大模型出场就是4bit精度标配的话，量化这个活真的没啥必要了... 当然unsloth 主要业务其实是微调。

4

5

46

karminski-牙医

@karminski3

1 day

其实我最需要多开功能，经常运行一些wasm/webgl 程序chrome就卡死了，结果所有标签重新load。我现在只能再装一个 chrome canary ��....

卡尔的AI沃茨

@aiwarts

1 day

终于支持分屏了吗，comet偶尔会自动退出登陆给我整麻了

2

0

5

karminski-牙医

@karminski3

1 day

月之暗面要在 reddit/r/LocalLllama 搞 AMA, 可以关注一波。我最想问的问题大概有三个： 1. Kimi3 啥时候发？让我有个准备哈哈哈 2. kimi-linear 这个模型尺寸我很喜欢，非常适合本地部署，后续会推出更好的版本吗？ 3. K2 系列工具调用性能进化特别明显，用了什么技术或者有什么经验能分享一下吗？

7

6

87

karminski-牙医

@karminski3

1 day

性能数据

0

1

karminski-牙医

@karminski3

1 day

模型参数

1

0

karminski-牙医

@karminski3

1 day

Kimi-Linear 剪枝版本! cerebras 好像找到流量密码了, 开始疯狂魔改国产大模型. (cerebras 是个基础设施厂商提供硬件加速运行大模型, 他们能把大模型输出打到 2000 token/s) 刚又发布了 Kimi-Linear-REAP-35B-A3B-Instruct, 没错, 就是前几天的 Kimi-Linear-48B-A3B-Instruct 魔改的. 参数从 48B

5

59

karminski-牙医

@karminski3

1 day

LMArena 上的详细评测数据

0

1

karminski-牙医

@karminski3

2 days

看来 GPT-5.1 的确要出了？从特征上来看的确是OpenAI的模型。

Sam Paech

@sam_paech

2 days

New models on EQ-Bench writing evals: Kimi-K2-Thinking and the stealthed openrouter model polaris-alpha. Polaris-alpha likely is gpt-5.1, based on how the outputs cluster nearest gpt-5 and the fact that the model has very high rate limits.

3

1

28

karminski-牙医

@karminski3

2 days

刚看到知乎和魔搭搞了个AI时代开发者生态白皮书？PDF，还挺大的。这里： https://t.co/s8IW3vSEe2

1

5

51

karminski-牙医

@karminski3

2 days

排行榜

0

1

karminski-牙医

@karminski3

2 days

后续回答和对比

1

0

karminski-牙医

@karminski3

2 days

EQBench 问题与 Kimi-K2-Thinking 的回答整理

1

0

karminski-牙医

@karminski3

3 days

Kimi-K2-Thinking 实测! 差距继续缩小! 给大家带来 kimi k2 thinking 的测试结果: 大象牙膏测试没问题, 感觉物理效果又进步了! 这个粘稠的质感已经越来越象大象牙膏了, 不过烧瓶内液面还是差点意思. 鞭炮连锁爆炸也没问题, 老强项了, 可以看跟过去的 kimi k2 0905 的对比, 鞭炮皮优化了.

15

23

189

karminski-牙医

@karminski3

3 days

总结

0

1

5

karminski-牙医

@karminski3

3 days

INT4 ?????

1

0

karminski-牙医

@karminski3

3 days

性能简介

1

0

karminski-牙医

@karminski3

3 days

kimi-k2-thinking 发布啦! 4bit 精度普及了? kimi-k2-thinking 刚刚发布啦! 给大家带来模型参数&性能速记卡! 本次最大的特性我觉得就是使用了原生 INT4 量化, 将便宜大碗贯彻到底 (替 Unsloth 鸣不平, 只能搞1-2bit动态量化了哈哈哈). 其次这次最亮眼的是 Humanity's Last Exam 的分数爆高,

8

3

77

karminski-牙医

@karminski3

3 days

结论

0

6

karminski-牙医

@karminski3

3 days

验证原理

1

0