imxiaohu Profile Banner
小互 Profile
小互

@imxiaohu

Followers
71K
Following
2K
Media
4K
Statuses
7K

休假ing...

Mars
Joined March 2024
Don't wanna be here? Send us removal request.
@imxiaohu
小互
10 hours
《甄嬛传》经典场景 详细介绍: https://t.co/cI0GkRyz1s
0
1
1
@imxiaohu
小互
10 hours
《甄嬛传》经典场景
1
0
3
@imxiaohu
小互
10 hours
案例展示 《让子弹飞》经典片段中英切换
1
0
1
@imxiaohu
小互
10 hours
Bilibili 训练的这个 IndexTTS2 语音模型 效果很不错,支持情感可控 + 时长可控 - 自由切换情绪(开心、生气、悲伤等),甚至能用文字告诉模型“我想让声音听起来愤怒”。 - 保持说话人音色不变,同时注入其他音频或文字里的情感。 - 生成更自然、更清晰的语音,即使在强烈情绪下也不会崩坏。 -
2
20
66
@imxiaohu
小互
16 hours
总体来说在图像编辑和推理方面 Seedream 4.0 和 Gemini Nano Banana 已经非常的接近,在各个方面不相上下。 整体感受是推理能力 Nano Banana 还是略微强大一些,但是在图像编辑和其他控制方面已经不分伯仲。 更多测试案例和对比查看完整测试文章: https://t.co/msM5h3HehB
Tweet media one
0
0
3
@imxiaohu
小互
16 hours
看到没,我终于吃上了肯德基😂 这些都是基于模型的强大推理能力,全程我只是进行文字提示聊天,上传参考图,它自己会根据你的要求进行自动合成。 这个时候我发现,我的脸有点黑,发型也不时尚 另外我的鞋子左右也不一致 让它给我美颜和修改下
Tweet media one
1
1
1
@imxiaohu
小互
16 hours
我们看到番茄酱也有了,而且放在了合适的位置上 好了现在我可以坐下来好好享受我的肯德基了 那么我发现我没有桌位,这个难不住我😅 我有豆包 来了...
Tweet media one
1
0
0
@imxiaohu
小互
17 hours
我们看到吸管很完美的插入到了可乐中... 这时候我又发现,没有番茄酱🍅,我这个人很喜欢吃番茄酱 我必须要弄个番茄酱才行
Tweet media one
1
0
1
@imxiaohu
小互
17 hours
我们看到它打开了盒子,并展示了里面的食物,第一个长盒子我觉得展示的是很正确的,第二个盒子我个人认为里面应该是个汉堡🍔 但是它给我展示的是炸鸡,不过这个可能是盒子上有英文误导了这一结果。 我们注意到这个可乐是没有吸管的,不方便我喝,我需要个吸管 让豆包给我的可乐插个吸管😁
Tweet media one
1
0
1
@imxiaohu
小互
17 hours
推理能力测试 豆包 Seedream 4.0另一个明显的提升是对 模糊需求的理解,也就是模型的推理能力,这个至关重要,因为只有模型推理能力上去后,它的衍生功能才能得到极大的发挥。 这是一个肯德基的餐品图,我们看到这有两个盒子 下面我们让豆包把这两个盒子打开看看里面有什么...
Tweet media one
1
0
1
@imxiaohu
小互
17 hours
还可以用生成的参考照片去生成其他图像 比如这样 面部形象特征都做到了很好的保持
Tweet media one
1
0
1
@imxiaohu
小互
17 hours
选取第一张图像,继续进行后续的要求 让给我一杯星巴克咖啡,然后再喝一口星咖啡,同时更换背景画面 都很好的完成了我的要求
Tweet media one
1
0
0
@imxiaohu
小互
17 hours
看看效果... 我有身体了... 而且保留了我头像的特征和面部的表情,包括我招牌的犀利眼神和红框眼镜
Tweet media one
1
0
1
@imxiaohu
小互
17 hours
下面是我的测试: 在豆包上传我的头像,要求其根据我头像生成我的身体,众所周知我一直没有身体只有头像。
Tweet media one
1
0
0
@imxiaohu
小互
17 hours
豆包 Seedream 4.0 图像模型确实很强 测试完毕后,个人认为和Nano Banana不相上下 可能在推理能力上稍微有一点弱,多轮一致性会丢失一点 其他应该是二者互有优劣 但是Seedream 4.0在中文能力上要比Nano Banana强很多,更适合中国宝宝体质...🥲 下面是我的测试结果🧵↓
3
11
85
@imxiaohu
���互
22 hours
如何启用:开发者模式可以在 Pro 和 Plus 账户中启用,进入设置中的 连接器 -> 高级 -> 开发者模式 进行开启。 详细介绍: https://t.co/oVtYYUbOhN
Tweet media one
0
0
1
@imxiaohu
小互
22 hours
ChatGPT推出开发者模式 支持自定义连接器与任意MCP集成,可实现搜索获取修改写入操作 在 开发者模式 下,开发者可以创建 连接器,并且不仅仅是进行搜索或抓取,还可以使用这些连接器进行写入操作。 这意味着,开发者可以通过 ChatGPT 来直接处理一些自动化任务,进行更灵活的集成,简化工作流程。
3
11
37
@imxiaohu
小互
1 day
同时还内置了各种视频模型 可以编辑图像之间生成视频,利用首尾帧制作特效视频 更多案例详细的测试: https://t.co/C9dtHCiVXU
0
1
6
@imxiaohu
小互
1 day
效果展示 可以批量生成各种场景,人物保持一致 Agent 的流程化分解 + 画布的模板化重复,轻松编辑和修改。 非常nice
Tweet media one
Tweet media two
1
0
6
@imxiaohu
小互
1 day
轻松创造一个属于自己的模特,无需付费,也不需要招聘摄影师即可对你的产品进行各种宣传图、广告图的拍摄和制作。 这些全部在一个画布里面完成,而且是只需要聊聊天即可... 直接批量生成 放在以前想都不敢想
Tweet media one
1
1
5