karminski-牙医
@karminski3
Followers
29K
Following
2K
Media
2K
Statuses
4K
A coder, road bike rider, server fortune teller, electronic waste collector, co-founder of KCORES, ex-director at IllaSoft, KingsoftOffice, Juejin.
Asia/Beijing
Joined December 2018
继PaddleOCR后, 文心要硬起来了? LMArena 刚更新了榜单, 百度的文心大模型 5.0-preview 上榜了! 而且是全球第二! 从测试数据上看创意写作和长上下文测试分数非常高, 这意味着召回性能会很好. 注意看我的截图, 创意写作, 指令遵循, 长Query这三个, 甚至比GPT-5要高!
5
4
29
我说啥来着,Unsloth 的1bit 动态量化来了 未来如果大模型出场就是4bit精度标配的话,量化这个活真的没啥必要了... 当然unsloth 主要业务其实是微调。
4
5
46
月之暗面要在 reddit/r/LocalLllama 搞 AMA, 可以关注一波。我最想问的问题大概有三个: 1. Kimi3 啥时候发?让我有个准备哈哈哈 2. kimi-linear 这个模型尺寸我很喜欢,非常适合本地部署,后续会推出更好的版本吗? 3. K2 系列工具调用性能进化特别明显,用了什么技术或者有什么经验能分享一下吗?
7
6
87
Kimi-Linear 剪枝版本! cerebras 好像找到流量密码了, 开始疯狂魔改国产大模型. (cerebras 是个基础设施厂商提供硬件加速运行大模型, 他们能把大模型输出打到 2000 token/s) 刚又发布了 Kimi-Linear-REAP-35B-A3B-Instruct, 没错, 就是前几天的 Kimi-Linear-48B-A3B-Instruct 魔改的. 参数从 48B
5
5
59
Kimi-K2-Thinking 实测! 差距继续缩小! 给大家带来 kimi k2 thinking 的测试结果: 大象牙膏测试没问题, 感觉物理效果又进步了! 这个粘稠的质感已经越来越象大象牙膏了, 不过烧瓶内液面还是差点意思. 鞭炮连锁爆炸也没问题, 老强项了, 可以看跟过去的 kimi k2 0905 的对比, 鞭炮皮优化了.
15
23
189
kimi-k2-thinking 发布啦! 4bit 精度普及了? kimi-k2-thinking 刚刚发布啦! 给大家带来模型参数&性能速记卡! 本次最大的特性我觉得就是使用了原生 INT4 量化, 将便宜大碗贯彻到底 (替 Unsloth 鸣不平, 只能搞1-2bit动态量化了哈哈哈). 其次这次最亮眼的是 Humanity's Last Exam 的分数爆高,
8
3
77