Glowin Profile Banner
Glowin Profile
Glowin

@glow1n

Followers
5,462
Following
1,616
Media
583
Statuses
9,441

Organizer of GDG Beijing, Co-founder of , focus on generative AI. DM open.

北京, 中华人民共和国
Joined May 2010
Don't wanna be here? Send us removal request.
Explore trending content on Musk Viewer
Pinned Tweet
@glow1n
Glowin
21 days
上海的开发者请注意,4月27日下周六掘金在徐汇区漕河泾中心有一场扣子& Moonshot 动手实验室的活动,可以组队在2个小时内用 Moonshot 底座大模型做一个扣子的bot,现场也有官方人员答疑,并且能优先开通 API 内测,报名链接:
Tweet media one
Tweet media two
3
9
24
@glow1n
Glowin
3 months
OpenAI Sora 团队成员的 X 账号清单: 研发负责人: @billpeeb @_tim_brooks 系统负责人: @cmikeh2 贡献者: Clarence Wing Yin Ng David Schnurr @_dschnurr Eric Luhman Joe Taylor @JMT3 Li Jing @jingli9111 Natalie Summers Ricky Wang @ryw999 ryan o’rourke Troy Luhman @LuhmanTroy Will
41
458
1K
@glow1n
Glowin
4 months
草榴社区太强了,居然有1.42亿的月活DAU 事情缘由是开发者 @m1ssuo 写了一个 telegraph 图床,使用了 Cloudflare 的 CDN,本来是想给博主写博客放图片的,结果被草榴社区拿过去作为官方图床,好家伙,一个月跑了 1PB 的 CDN 流量,还有 1.42 亿的月活DAU。
Tweet media one
@m1ssuo
Vincent Yang
4 months
大家好奇我部署了什么,每个月会有 PB 级别的流量,每天 50T 的流量。🤡
38
50
402
70
146
802
@glow1n
Glowin
5 months
如果你有过敏性鼻炎,而且早上起来鼻子里有血丝,建议你晚上睡觉前用棉签沾上凡士林涂抹鼻腔内壁,第二天早上起来擤鼻涕就不会有血丝了。 凡士林就买海氏海诺的白凡士林,便宜且纯正。
20
80
447
@glow1n
Glowin
5 months
如果你有一定的代码基础,希望深入了解一下 transformer 的实现,这个教程包含多种基于 Transformer 架构的 PyTorch 实现和扩展,包括从原始论文《Attention Is All You Need》到各种衍生和增强模型的详细说明。
12
124
430
@glow1n
Glowin
3 months
最近独立开发者的议题很火热,推荐这篇文章入门,从购买域名到公司注册再到收款账户都有涉及:
7
102
354
@glow1n
Glowin
1 month
推荐一篇RAG的入门文章,这篇文章概述了检索增强生成(RAG)技术的发展历程,包括初级 RAG、高级 RAG 和模块化 RAG 架构。RAG 技术通过从外部数据库检索知识来增强 LLM
7
90
339
@glow1n
Glowin
8 months
一场线下技术沙龙,如果将每个讲师分享内容快速整理成文章?我是这么做的: 1. 沙龙的会议视频转化成 16-bit wav格式的音频 2. 音频通过 whisper.cpp 转化成速记稿 3. 将prompt 和速记稿放到 claude2 上整理成文字稿 4. 文字稿润色,添加现场照片和 PPT 图片 如果你对上述流程感兴趣,我会详细解释如下
13
82
234
@glow1n
Glowin
6 years
麻将是中国最古老的区块链项目,四个矿工一组,最先挖出13位正确哈希值的获得记账权以及奖励。
5
131
168
@glow1n
Glowin
1 month
知识蒸馏(Knowledge Distillation)技术,指的是将大型语言模型(LLMs)的能力复制到小型本地模型中,以提高小型模型的性能。
5
40
181
@glow1n
Glowin
30 days
ideogram 上线了新功能 Describe:上传一张图片,生成这张图片的描述词,然后再用描述词重新生成一组图片。非常适合绕过有版权的图片。
8
34
166
@glow1n
Glowin
1 month
找到Azure的原文了,目前是对所有的区域开放了,等等我来试试:
@imxiaohu
小互
1 month
微软对Azure AI语音服务升级 发布9种更真实的AI语音 对中文支持已经很完美了 几乎已经无法分辨了 详细:
30
192
771
5
38
165
@glow1n
Glowin
6 months
另外把 v 换成 w,就直接跳转到对应的 页面,让GPT辅助你读论文
@dotey
宝玉
6 months
分享个阅读 上论文的技巧,通常 上的论文都是 PDF 格式的,其实对于阅读很不友好,尤其是对于需要翻译对比阅读的。 一个技巧是你把论文摘要页url中的域名中的“x”换成“5”,就能用 HTML5 的格式阅读,比如说: 换成
Tweet media one
47
458
1K
3
48
137
@glow1n
Glowin
1 month
Gretel 最近发布了世界上最大的开源 Text-to-SQL 数据集,标志着业界对数据质量的重新关注,在当前的 LLM 和 AI 领域内,从 Falcon、Phi-1.5、Phi-2、Aya 到 Gemini 等尖端模型,巨大的性能提升再次证明了以数据为中心的 AI 发展方法的重要性。Gretel
4
31
139
@glow1n
Glowin
5 months
分享一个可视化的了解 LLM 的教程,非常适合 LLM 入门。目前在 hacker news 上有1k多个赞。
4
42
128
@glow1n
Glowin
1 month
曾几何时,淘宝和支付宝的 UED 在前端圈子很有名,毕业生都想去的团队。
@Vincent_Song
Vincent Song
1 month
淘宝首页改版了,变窄变简洁了,可以自动登录了,不需要每次都输入密码。感觉现在越来越多的公司都开始重视 Web 版,比如抖音、小红书。
Tweet media one
124
35
681
16
3
63
@glow1n
Glowin
3 months
瑞典金融科技公司 Klarna 宣布其基于 OpenAI 的 AI 助手能够完成 700 名全职员工的工作量,此举在公司 2022 年裁员 700 人后引发关注,同时,该公司预计 AI 聊天机器人将在 2024 年帮助其提高 4000 万美元的利润。
3
11
62
@glow1n
Glowin
9 years
原来国内的健身内容都是从这个网站上扒下来的啊
2
14
49
@glow1n
Glowin
2 months
这个53页的文档泄露了 OpenAI 关于 Q* 项目的最新进展,给大家总结了一下: 这篇文章详细揭示了 OpenAI 制定的计划,旨在到 2027 年前创建出与人类智能水平相当的人工通用智能(AGI)。文档中提到,OpenAI 从 2022 年 8 月开始训练一个拥有 125 万亿参数的多模态模型,称为 Arrakis 或 Q*。该模型在
4
9
51
@glow1n
Glowin
21 days
做客《科技乱炖》播客,和橘子 @oran_ge 、朱峰 @zhufengme 一起聊聊硅谷见闻。第一次录播客,感觉不错,下次还来!
Tweet media one
2
4
50
@glow1n
Glowin
3 months
最近曝光了特斯拉和苹果关于收购的两个小故事。第一次是2020年10月 Model 3 的研发遇到很大的困难,于是马斯克找上库克希望聊一下苹果收购特斯拉,但是库克拒绝了。第二次是6个月后 Model 3 开始量产,这次是库克找上马斯克希望收购特斯拉,马斯克表示他想当
3
4
46
@glow1n
Glowin
1 month
#GoogleCloudNext 第一天 keynote 印象比较深的一个发布是Gemini Code Assist,这是一款面向企业的 AI 代码补全和辅助工具。它是 Duet AI for Developers 的进化版本,采用了最新的 Gemini 1.5 Pro 模型,为开发者提供了全面的代码库分析、代码生成,对多个仓库中的私有代码库的支持。直接对标 GitHub
Tweet media one
2
9
36
@glow1n
Glowin
5 months
@meterscao 我看过微信在 Mac 上的缓存文件夹,大部分是大群里面的 GIF 动图表情包
1
0
34
@glow1n
Glowin
8 years
Github 上的一个微信小程序(应用号)的 demo,曝光了部分 API
Tweet media one
1
27
31
@glow1n
Glowin
3 months
贾扬清算了一笔账,如果是跑 Llama2 70B,运营3年,算上电费和买卡,Groq 成本是 H100的5倍。因为一张 Groq 显卡只有230MB的显存。
@jiayq
Yangqing Jia
3 months
Probably the first operation cost analysis of owning @GroqInc hardware to run Llama2-70b. First of all, let me say I am a big fan of Groq. Great performance, great potential. The below is just a showcase how challenging things might be when rivaling the industry lead, but given
40
118
688
3
9
32
@glow1n
Glowin
5 days
快来看北欧的极光。这几天收到太阳黑子运动的影响,未来几天内地球将面临连续的地磁风暴,北欧地区可以看到极光。这个网站的摄像头记录了北欧各大山峰的影像,可以往前翻一下时间轴,可以看到明显的极光
Tweet media one
1
10
38
@glow1n
Glowin
6 months
@dotey 另外把 v 换成 w,就直接跳转到对应的 页面,让GPT辅助你读论文
1
5
30
@glow1n
Glowin
7 months
尝试将币安上的 200USDT 转到香港银行,最终收到163.25USD,用时36小时,损耗36.75美元,各个环节的损耗有: 1. USDT 从币安转到 kraken,分两次各 100USDT 转出,走的 solana 链,损耗共 2 美元手续费,用时3分钟; 2. USDT 转成 USD,在 kraken 兑换比例1:1,但是两次操作花费手续费 1.76
Tweet media one
12
7
28
@glow1n
Glowin
3 months
Deno 发布了年终总结2023年,Deno在提升与Node/npm兼容性和性能方面加速发展,同时继续朝着极大简化Web开发的目标迈进。以下是2023年发生的一些主要变化的总结: - Deno现在能理解`package.json`文件,并能够使用`node:`前缀(如`node:fs`和`node:crypto`)导入内建的Node模块。 -
4
5
28
@glow1n
Glowin
3 months
Quora 曾经是一个充满活力的社区,专注于提供准确、有深度的问答的社区。但是今天的 Quora 已经大不如前,充斥着无意义的重复内容、奇怪的提问、充满恶意和AI生成的回答,以及大量的垃圾信息。这篇文章作者访谈了 Quora 的早期 KOL,认为 AI 技术的引入和管理上的问题被认为是导致 Quora
7
6
27
@glow1n
Glowin
2 months
深圳的开发者请注意,3月30日下周六掘金在深圳湾有一场扣子动手实验室的活动,可以组队在2个小时内做一个扣子的bot,现场也有官方人员答疑,并且能优先开通API内测,报名链接: 关注我,并且转发这条推,我会从转发中抽出5名同学获得《明解Python算法与数据结构》,周一开奖
Tweet media one
12
24
24
@glow1n
Glowin
6 months
@DashHuang 我最喜欢飞书的一个小众产品是妙记,能将线上会议(也支持上传视频/音频)转化成带时间轴的速记,语音识别的效果比 whisper 不相伯仲。因为编辑字幕可以对照着视频,我现在从 whisper 迁移到妙记了。
3
2
23
@glow1n
Glowin
7 months
在香港浅浅呆了四天,聊一下在香港的感受: 1. 海外互联网服务太爽了,Netflix 和 Disney+ 拖动进度条没有缓冲直接播放,也不用老是切海外节点,很省心; 2. 迪士尼乐园人很少,排队也不用很久,不像上海动辄一个小时排队时间; 3.
Tweet media one
3
0
25
@glow1n
Glowin
9 years
经济学人的官推背景图真是碉堡了 #TheEconomist http://t.co/sWMBSLB6NR
Tweet media one
3
48
20
@glow1n
Glowin
6 months
@Barret_China huggingface 的 dailypaper 不错
0
6
23
@glow1n
Glowin
3 months
@buaaxhm 啊,我现在尽量避免说长句,每次打出来如果感觉很长的话,会刻意截断发出来,免得增加别人的理解成本。
1
2
23
@glow1n
Glowin
7 years
因为石墨白天挂掉了,晚上备份的时候翻出来这个长途清单,三次北京→旧金山往返长途飞行经验分享给大家🤣
Tweet media one
3
6
21
@glow1n
Glowin
7 years
蛮喜欢王兴的这句话:「在对手这件事上,就像开车一样,你得偶尔看一下后视镜,但你不能盯着后视镜开车。」
2
26
21
@glow1n
Glowin
4 years
发现问题,解决问题,优化流程。我认为这是解决问题的三个阶段,大家都能发现问题,但是很少有人去弄解决方案落地,更难得有人去完善流程,从根源上堵住问题。
8
3
20
@glow1n
Glowin
3 months
对比测试了一下刚刚发布的 Mistral Large 和 GPT-4,使用相同的 prompt 来总结文章,感觉 Large 能力逼近 GPT-4 了。左图是 Mistral Large,右图是 GPT-4 测试网站:
Tweet media one
2
5
22
@glow1n
Glowin
1 month
Command R+,这是一款由 Cohere 推出、旨在满足企业级工作负载需求的最新LLM。该模型特别优化了高级检索增强生成(RAG)技术,支持 10 种关键语言,专为全球业务运营设计。通过与 Microsoft Azure 的合作,Command R+ 在数据隐私和安全方面的承诺,以及其先进的工具使用功能,为企业带来了前所未有的
@aidangomez
Aidan Gomez
1 month
⌘R+ Welcoming Command R+, our latest model focused on scalability, RAG, and Tool Use. Like last time, we're releasing the weights for research use, we hope they're useful to everyone!
26
190
985
1
4
22
@glow1n
Glowin
5 months
这个卖LED灯牌的小哥的英语说的真地道,看样子不像是用 Heygen @HeyGen_Official 生成的🤔
6
7
21
@glow1n
Glowin
6 years
最近的一个感悟是,自己在往前奔跑的时候,也要带上团队成员一起向前,保持一致。然后就是踢掉掉队的人。
3
4
19
@glow1n
Glowin
5 months
@mranti 好家伙,我还以为是因为我用鸟盾批量拉黑了一波人,让我进入冷静期
0
0
19
@glow1n
Glowin
8 years
trello 中文版终于上线啦,看到自己贡献的翻译能让所有的中文 trello 用户使用也是一件蛮开心的事情❤
Tweet media one
Tweet media two
5
29
19
@glow1n
Glowin
1 month
用新旧两个版本的晓晓朗读《无穷的开始》这本书的引言部分,左边是 zh-CN-XiaoxiaoMultilingualNeural 最新的模型,右边是老的版本,前者很难区分是不是真人了
@glow1n
Glowin
1 month
找到Azure的原文了,目前是对所有的区域开放了,等等我来试试:
5
38
165
2
6
20
@glow1n
Glowin
4 years
最近要避免一个误区,不能用执行的事情来充斥整个工作时间,应该保留足够多的时间去思考运营规划。
0
2
19
@glow1n
Glowin
2 months
@daimajia 讲真,还没有之前的好看
1
0
16
@glow1n
Glowin
9 months
如果你有一定的编程背景,同时也想了解一下大语言模型的机制。非常建议看 @karpathy 一年前的介绍视频,通过33万条英文名字的训练集,来手搓简易版的语言模型。
0
3
15
@glow1n
Glowin
6 years
为什么 Pycon 中国每一年都被参会者骂一次?底层原因是因为背后的组织机构是会务公司,夹杂着强烈的商业气息,甚至是为了讨好赞助商而牺牲演讲质量,这一点是参会者以及 Python 社区不能忍受的。ZQ大妈虽然在积极推动良性发展,但还是抵挡不住压力。
9
8
12
@glow1n
Glowin
4 months
@guaguaguaxia @m1ssuo 对,我才反应过来应该是 MAU
0
0
14
@glow1n
Glowin
1 month
OpenAI 的早期风险投资人 Vinod Khosla,现在投资了 Symbolica AI,这是一家由前 Tesla Autopilot 工程师共同创立,致力于开发一种全新的 AI 辅助编程工具。Symbolica 采用与 OpenAI 不同的机器学习方法,旨在减少对大规模计算资源的依赖。 #AI #机器学习 #SymbolicaAI #创新技术
1
2
15
@glow1n
Glowin
8 years
对了,前几天在 Google I/O 会场接受路透社采访的视频出来啦,大家可以戳视频感受一下 #io16 戳→
Tweet media one
Tweet media two
2
1
11
@glow1n
Glowin
6 months
OpenAI is nothing without its people (假装我也在OpenAI)
3
2
14
@glow1n
Glowin
1 month
全文翻译: RAG(检索增强生成)的演变:初级 RAG、高级 RAG 和模块化 RAG 架构 大型语言模型(LLMs)通过在自然语言任务及其它领域的成功应用,如 ChatGPT、Bard、Claude 等所示,已经彻底改变了 AI 领域。这些 LLMs 能够生成从创意写作到复杂代码的文本。然而,LLMs
0
2
14
@glow1n
Glowin
6 months
统计了一下 Sam Altman 的回归推有八十多个 Open AI 员工回复爱心,这应该是 OpenAI 员工最全的列表了吧
2
2
13
@glow1n
Glowin
5 years
到达圣何塞,有参加 Google I/O 的推友么?
Tweet media one
2
1
12
@glow1n
Glowin
6 months
@mtrainier2020 只能说硅谷大佬圈子太小了
0
0
12
@glow1n
Glowin
8 years
人生有限公司,没有一天能请假。
1
15
13
@glow1n
Glowin
6 years
常把“我没时间”挂在嘴边的管理者,只有两种原因:一是能力只能完成手头的任务,二是不懂如何分配任务下去,把自己的时间花在下属解决不了的事情上。不管哪种原因,都是个人能力和管理能力低下的体现。
1
1
12
@glow1n
Glowin
1 year
@Barret_China 你看,你说的这些昨天晚上发布的 GitHub copilot X 就能解决。
1
0
12
@glow1n
Glowin
7 years
Tweet media one
0
4
12
@glow1n
Glowin
7 years
美团点评新做了餐饮开放平台,海量的商家需要做个性开发,做外包的朋友又可以赚一大笔钱了。
Tweet media one
0
1
12
@glow1n
Glowin
1 month
刚刚结束的 YC 2024年冬季 Demo Day 展示了一系列印象深刻的AI和科技创新产品,从 AI 辅助的资助申请、非营利组织银行平台,到音乐生成和电动汽车充电解决方案。这些初创公司正利用AI解决教育、法律和健康保险等领域的挑战,揭示了行业的未来方向。 #YCDemoDay #TechInnovation #AI
3
2
12
@glow1n
Glowin
8 years
摩拜单车的量产速度
Tweet media one
1
15
8
@glow1n
Glowin
9 months
VALL-E X 是一个多语言文本转语音(TTS)模型,最初由微软发布,它可以识别一小段上传音频的特征,然后生成新的语音,可以达到以假乱真的程度。可惜微软没有把 VALL-E X 开源,但是今天这个 repo 复现并开源了 VALL-E X,同时也支持了中文,大家可以戳 demo 感受一下: demo:
3
3
10
@glow1n
Glowin
1 month
•初级 RAG:代表了最早的方法论,遵循传统的索引、检索和生成过程,但面临检索精度和回应生成的挑战。 •高级 RAG:通过前检索和后检索策略改善初级 RAG 的限制,优化索引技术和查询优化。 •模块化 RAG:超越前两种 RAG
2
1
10
@glow1n
Glowin
5 months
原理:北方空气干燥,鼻炎患者的鼻腔的血管本来就很脆弱,早上就很容易轻微流血。凡士林提取自石油,化学惰性很强,不跟任何物质反应,天然适合作为润滑剂,涂抹在鼻腔相当于保湿的功能,保护鼻腔脆弱的血管。
1
1
10
@glow1n
Glowin
1 month
OpenAI 和 Microsoft 正计划建造一个耗资 1000 亿美元的数据中心和超级计算机,名为 "Stargate",可能用于训练世界上最强大的 AI 系统。这个超级计算机最早可能于 2028 年启动,并在两年内扩建完成,最终版本可能需要高达 5 吉瓦的电力。 #AI #超级计算机 #OpenAI #Microsoft
2
1
11
@glow1n
Glowin
7 years
以前关注互联网黑产就看 TomsInsight,但是最近一年他们停更了,现在看一本黑,不错,很有料
1
4
9
@glow1n
Glowin
3 months
Hacker News 上的热门讨论:你用大语言模型做过什么项目? 数百个开发者提交自己的项目并参与讨论,来看看大家在做啥应用:
2
3
10
@glow1n
Glowin
6 months
OpenAI 员工大型行为艺术,太壮观了!
@glow1n
Glowin
6 months
半个月后,回头看看这个列表里面有几个跑路的😉
0
0
1
5
2
10
@glow1n
Glowin
6 years
掘金能够活下来的一个很容易被人忽视的原因是,珍惜并重视每一个用户的反馈。
1
3
9
@glow1n
Glowin
3 months
试用了一下总结一篇英文文章,这个 Groq 的推理速度真的很快很快。 Groq 背后用到的 LPU™ 推理引擎是一种全新的端到端处理单元系统,专为计算密集型且具有顺序组件的应用(例如 AI 语言应用 (LLM))提供最快的推理速度。 LPU™ 推理引擎比 GPU 快的原因: LPU 针对 LLM
@levelsio
@levelsio
3 months
Try now Hyperfast LLM running on custom built GPUs Answers in miliseconds, not seconds How? 🤯
173
216
2K
2
3
9
@glow1n
Glowin
2 months
@0xAA_Science @WTFAcademy_ 收到,我来处理一下
1
0
7
@glow1n
Glowin
1 month
stackoverflow 正在接入 Gemini 来回复用户的技术问题,然后社区用户会再做一次 review #GoogleCloudNext
Tweet media one
1
0
9
@glow1n
Glowin
1 month
斯坦福大学和 Databricks 的研究人员开源了 BioMedLM,这是一个基于 PubMed 文本训练的、拥有27亿参数的 GPT 风格 AI 模型,旨在推动生物医学研究和医疗保健应用的发展。 #stanford #databricks #BioMedLM 论文: 模型:
2
1
9
@glow1n
Glowin
2 months
ChatGPT 在 UI 上最亮眼的功能是编辑对话,我能很方便的调试每次输入的 prompt,而不是新开一个聊天对话,相信在写 prompt 时经常忘记补充内容的同学深有感触。很可惜主流的大雨语言模型的网页版都不支持,包括且不限于 Claude、Gemini、kimi 等等。
5
2
9
@glow1n
Glowin
5 months
@meterscao 如果有价值的聊天记录就���个人的话,可以把这些记录导出到PC上,然后翻微信的缓存文件夹,把视频和图片找出来。
0
0
9
@glow1n
Glowin
21 days
NVIDIA DGX H200 的主要特性: * 32 个 NVIDIA Grace Hopper Superchips,通过 NVIDIA NVLink 互连 * 巨大的共享 GPU 内存空间,达到 19.5 TB * GPU 到 GPU 的带宽高达 900 GB/s * 128 petaFLOPS 的 FP8 AI 性能
@gdb
Greg Brockman
21 days
First @NVIDIA DGX H200 in the world, hand-delivered to OpenAI and dedicated by Jensen "to advance AI, computing, and humanity":
Tweet media one
910
2K
23K
0
1
8
@glow1n
Glowin
1 month
Command R+ 基本上对标 Claude Sonnet(价格相同且基准测试结果相当),但具有更好的 RAG/Summary 和工具能力。
@glow1n
Glowin
1 month
Command R+,这是一款由 Cohere 推出、旨在满足企业级工作负载需求的最新LLM。该模型特别优化了高级检索增强生成(RAG)技术,支持 10 种关键语言,专为全球业务运营设计。通过与 Microsoft Azure 的合作,Command R+ 在数据隐私和安全方面的承诺,以及其先进的工具使用功能,为企业带来了前所未有的
1
4
22
0
4
8
@glow1n
Glowin
6 months
如何识别 PDF 中的表格一直是 RAG 技术的挑战,微软最近发布的模型“Table Transformer”能够有效地识别图像中的表格。 如何结合使用Table Transformer模型和GPT4-V来改进处理包含表格的图像的结果? 实验分为以下几个部分,对从PDF中提取表格信息的四种不同方法进行了比较: 1.
@llama_index
LlamaIndex 🦙
6 months
Parsing tables in PDFs is a super important RAG use case. We found that using the recent Table Transformer model ( @deepsmock ) combined with GPT-4V gives you superpowers 💪 The Table Transformer model extracts tables from PDFs using object detection 📊 We have a full notebook
Tweet media one
15
183
1K
0
0
8
@glow1n
Glowin
1 month
橘子回归了,他最近从 minimax 跑路后,又开始高质量的更新了🎉
@oran_ge
orange.ai
1 month
令人兴奋 Databricks 在上周推出了 DBRX 开源大模型,成为开源 LLM SOTA - 通用指标,超越 Gemini 1.0 Pro 和 GPT-3.5 Turbo - 编程能力,超越专门用于代码生成的模型 CodeLLaMA-70B - 细粒度的MoE架构,132B个参数,16专家选4,32K 上下文 闭源模型亚历山大
Tweet media one
Tweet media two
3
27
119
1
1
8
@glow1n
Glowin
6 years
回公司的路上跟司机聊天,他是13年滴滴快的大战时候买的车,本田雅阁,跑了7个月就回本了,那时候一天最多就能赚好几千。现在一天七百,除掉油钱剩五百多。神奇的地方在于,他这是第二辆雅阁,上一辆出租一个月五千。他准备把上一辆卖掉,然后把现在的雅阁出租,再买一台混动的本田。
Tweet media one
0
1
8
@glow1n
Glowin
1 month
Mistral AI 最近发布了 Mistral 7B v0.2 版本。这个模型在多个基准测试中表现出色,超过了 Llama 2 13B 模型。 huggingface: 以下是主要特点和优势⬇️
1
1
8
@glow1n
Glowin
1 month
Google AI 最近推出了
2
0
8
@glow1n
Glowin
9 years
我们邀请霍炬老师 @virushuo 来给稀土用户推荐一本书,他推荐的是《神经漫游者》,这部小说相当经典,开创了赛博朋克流派。大家有兴趣可以到微博上转发抽奖 http://t.co/mknlhncILs http://t.co/5oiZBhvsUy
Tweet media one
0
3
7
@glow1n
Glowin
4 months
心塞,刚把软肋哄睡着,蹑手蹑脚到厨房找吃的,发现软肋他妈在看繁花。 居然没等我一起看。
0
0
7
@glow1n
Glowin
1 month
AMD 是下一个 Nvidia?随着人工智能技术的飞速发展, #AMD 正在迅速成为 #Nvidia 在 AI 芯片市场的有力竞争者。凭借其 MI300 系列数据中心芯片和在 AI 个人电脑领域的领先地位,AMD 有望在未来十年加入价值超过 1 万亿美元的俱乐部,与 #Apple #Microsoft #Amazon #Alphabet #Meta 等巨头并肩。
1
1
8
@glow1n
Glowin
7 months
如果你用的是 M1 或者 M2 芯片的 Macbook,现在可以4秒钟左右出一张图。这是清华大学 Simian Luo 基于 Stable Diffusion 优化的潜在一致性模型(LCM),LCM 可以更快地生成图像,只需4到8个步骤就能得到一张好的图像(相比于25到50个步骤)。 在线:
Tweet media one
0
0
7
@glow1n
Glowin
1 month
4月4日~4月8日在湾区,欢迎旧金山和硅谷的朋友约我喝咖啡,聊聊 Generative AI 🙋
@glow1n
Glowin
3 months
4月9号~11号在拉斯维加斯参加 Google Cloud Next 大会,欢迎同行小伙伴约见面!
Tweet media one
0
0
2
1
0
7
@glow1n
Glowin
5 years
这篇写张一鸣的文章很好,把今日头条的公司运作方式、产品研发的方式都讲得很明白。
0
1
6
@glow1n
Glowin
3 months
黄仁勋在内部分享中表示,像 Groq 这样的专用人工智能芯片可能是昙花一现——历史表明它们很快就会过时(参见特斯拉的 CNN 芯片)。
@itsalfredw
Alfred Wahlforss
3 months
Just got a masterclass in leadership from Nvidia CEO Jensen Huang. Mind blown. Takeaways: He has 55 direct reports, no 1:1s, just group talks = max transparency. Org chart is modeled like a neural network, breaking the old pyramid model. Nvidia bets on new grads to lead huge
Tweet media one
214
610
7K
0
2
7
@glow1n
Glowin
6 months
@DrJimFan @karpathy PyTorch团队开发了一种基于纯PyTorch的高效生成AI模型加速方法,通过多种优化技术最少提升了十倍 LLM 的运行速度。 如何做到的? 🔍定位问题:使用简单的PyTorch实现,发现推理性能受CPU过多占用而限制(25.5 tok/s) ⚙ torch.compile引入:通过torch.compile减少CPU开销,增加效率(107.0 tok/s)
0
2
7
@glow1n
Glowin
5 years
下午的腾讯云开发者大会上,极客邦的一个商务小姐姐知道我是掘金的以后,一直在让我把简历给她,他们在持续招人🤣
6
0
5
@glow1n
Glowin
2 months
被发现是用 claude-3-sonnet 封装的,相同的 prompt 居然有相同的回复内容。
@seshubon
seshu bonam
2 months
WHAT? @inflectionAI is just a claude-3-sonnet wrapper? care to explain? 🐒 Produces the exact same answer word to word for a custom query i asked 🤯
Tweet media one
Tweet media two
Tweet media three
Tweet media four
69
66
922
0
2
6