karminski3 Profile Banner
karminski-牙医 Profile
karminski-牙医

@karminski3

Followers
20K
Following
2K
Media
1K
Statuses
3K

A coder, road bike rider, server fortune teller, electronic waste collector, co-founder of KCORES, ex-director at IllaSoft, KingsoftOffice, Juejin.

Asia/Beijing
Joined December 2018
Don't wanna be here? Send us removal request.
@karminski3
karminski-牙医
2 hours
老黄的 DGX Spark (之前叫 DIGITS 然后改名了). 本月就要发货啦~ . 虽然拥有高达 1 PFLOPs 的算力,128GB LPDDR5x 统一内存,但是内存带宽只有 273 GB/s。对于当前 transformer 架构的模型,内存带宽就意味着模型运行速度,这个内存带宽甚至不如买2070玩. 所以还是再次劝大家先调研再决定是否购买.
Tweet media one
2
1
7
@karminski3
karminski-牙医
2 hours
Moonvalley 刚刚发布了他们的电影级大模型 Marey. 这个大模型+Moonvalley 可以实现控制生成视频的每一帧进而制作更精细的AI电影. 我注册看了下,平台是一点赠送的token都没有,而且���价不便宜,每月14.99刀的订阅只能生成10个视频片段。稍后我看效果给大家带来详细测试
0
2
21
@karminski3
karminski-牙医
3 hours
看到了个 NVIDIA GeForce Now 这种云游戏平台的开源替代!——cloudypad. 这个开源项目可以让你使用云服务器和显卡来进行串流,甚至还有成本控制功能,如果你不玩了,可以帮你自动暂停服务器来节省马内。. 地址:
1
1
8
@karminski3
karminski-牙医
3 hours
Qwen2.5-Coder 潜力无限, 微软又基于 Qwen2.5-Coder 搞出了 NextCoder-32B。这个新模型在 Aider Leaderboard 刷到了 23.6 分,接近了 gpt-4o 的水平. 采用的魔改方法包括 SeleKT 后训练,以及魔改为带有 RoPE、SwiGLU、RMSNorm 和 Attention QKV 偏置的 transformers. 地址:
Tweet media one
Tweet media two
2
9
61
@karminski3
karminski-牙医
8 hours
又是大家喜闻乐见的合集!Unsloth 把他们之前所有微调头部开源模型的文章做了个合集,从如何微调,如何优化,每个模型的最佳运行参数,可能遇到的问题,全都写得特别详细。强烈推荐. 地址:
Tweet media one
Tweet media two
Tweet media three
Tweet media four
0
32
139
@karminski3
karminski-牙医
11 hours
总结时间:. - 目前 Google 在大模型 API 市场上几乎占据了半壁江山, 而且各个领域均有解决方案模型, 甚至还有便宜大碗 Gemini-2.0-Flash (比 DeepSeek 都便宜).- Anthropic 则专注写代码, Claude-3.5, Claude-3.7, Claude-4 算是完成了平稳过渡.- OpenAI 从大模型 API 市场这个数据表现并不好,.
4
0
16
@karminski3
karminski-牙医
11 hours
最后我们来看在 OpenRouter 上大家都用接口来干什么了:. - 前两名是 Cline 和 RooCode, 都是用来写代码的.- 第三名是 liteLLM, 这是个路由库, 用于构建各种应用.- 第四名 KiloCode 也是写代码的.- 第五名 SillyTavern 则是类似 Ollama 的本地LLM界面, 接上接口就能跟大模型对话
Tweet media one
4
0
10
@karminski3
karminski-牙医
11 hours
我们继续关注领域细分模型数据:. - 编程领域, Claude-Sonnet-4 是绝对王者, 占比 44.5%, 其次是 Gemini-2.5-Pro.- 文本翻译领域, Gemini-2.0-Flash 则是第一名, 毕竟量大便宜速度快, 这个榜单恐怖的是, 除了第二名占比 20% 的其他模型, 榜单里 7 个都是 Google 的模型.
Tweet media one
Tweet media two
Tweet media three
Tweet media four
1
0
6
@karminski3
karminski-牙医
11 hours
接下来我们关注市场份额数据, 目前最新的数据是, Google 占比高达 43.1% 位居第一, DeepSeek 和 Anthropic 以 19.6% 和 18.4% 分列二三名. 从数据中能得到的信息有:. - Google 目前强烈挤压了 Anthropic 的市场份额.- DeepSeek 自从 DeepSeek-V3 发布后, 一直占有了一定的份额并不断扩大.- OpenAI
Tweet media one
1
0
6
@karminski3
karminski-牙医
11 hours
2025年已经过去了一半, 文本生成大模型是否已经进入下半场? OpenAI 完全不重视 API市场? Grok3根本没人用? 未来会怎样走向?. 来看我花费4小��精心为大家整理的大模型 API 市场解读(使用 OpenRouter 数据) —— 2025上半年谁是 AI API 服务王者. 首先来看最受欢迎模型变化趋势, 目前最新的数据是,
Tweet media one
6
30
144
@karminski3
karminski-牙医
16 hours
完辣,我的免费 gemini 额度用光了[苦涩]
Tweet media one
11
0
28
@karminski3
karminski-牙医
1 day
大家都知道现在大模型可以放大图片让土拍你变高清。那么有没有开源的,让视频变高清的框架呢?——来看DLoRAL。. 这个框架是香港理工大学和OPPO 研究院联合开发的,使用扩散模型(Diffusion Model)来提升视频质量,主要特点是能够一步生成高质量视频,而不需要多次迭代。. 它的技术架构还是有点东西的:
0
12
70
@karminski3
karminski-牙医
1 day
有人炼了 Qwen3 8B 的 BitNet 版本!. Qwen3-8B-BitNet 这个模型是基于 Qwen3-8B 进行微调,使用的数据集是 Prime Intellect 的 SYNTHETIC-1 约 1B 个 token,并在每个线性层的输入中添加了 RMSNorm。. 所有线形层(包括 LM Head)都已转换为 BitNet。所以这个模型被压缩得非常小,只有2.5B 左右。
Tweet media one
0
10
56
@karminski3
karminski-牙医
1 day
分享一个使用 FLUX.1 Kontext 来制作角色模型表的 LoRA。. 角色模型表可以用来作为动画师和模型师的指南,甚至作为2D游戏的角色动作动画。. 地址:
Tweet media one
Tweet media two
Tweet media three
Tweet media four
0
2
15
@karminski3
karminski-牙医
1 day
分享一个非常棒的颜色生成器,甚至支持导入 Figma. 地址:
Tweet media one
1
47
253
@karminski3
karminski-牙医
1 day
这个 midjourney 风格代码真的是屡试不爽~ 一会给大家分享教程哈,欢迎关注~ . #midjourney
7
24
256
@karminski3
karminski-牙医
1 day
小米 SU7 机械概念图. 使用 midjourney 风格代码 生成,我正在做生成教程,一会分享给大家~ . #midjourney
4
4
49
@karminski3
karminski-牙医
1 day
Nice 👍.
@hellokaton
katon
2 days
用 Go 写了个 just-icon,一个交互式命令行工具,帮你一键生成网站/APP 的图标!. ✓ AI 魔法: 一句话描述,AI 帮你瞬间生成高质量图标.✓ 隐私至上: 完全本地运行,数据永远是你的。安心!.✓ 跨平台: Windows/Mac/Linux 支持.✓ 代码开源: MIT 协议,欢迎共建
0
1
12
@karminski3
karminski-牙医
2 days
绝,嘉立创能打透明PCB了
Tweet media one
Tweet media two
Tweet media three
43
40
642
@karminski3
karminski-牙医
2 days
看到个非常好的 Claude Code 插件,可以不需要消耗 token 就能撤回修改或者重做修改。. 用 Claude Code 修改本地代码库感觉改得不够好,但却已经应用修改了怎么办?ccundo
Tweet media one
7
26
128