小互 @imxiaohu X Profile

小互

@imxiaohu

Followers

71K

Following

2K

Media

4K

Statuses

7K

休假ing...

https://t.co/4PVaHEr5r3

Mars

Joined March 2024

Don't wanna be here? Send us removal request.

小互

@imxiaohu

10 hours

《甄嬛传》经典场景详细介绍： https://t.co/cI0GkRyz1s

0

1

小互

@imxiaohu

10 hours

《甄嬛传》经典场景

1

0

3

小互

@imxiaohu

10 hours

案例展示《让子弹飞》经典片段中英切换

1

0

1

小互

@imxiaohu

10 hours

Bilibili 训练的这个 IndexTTS2 语音模型效果很不错，支持情感可控 + 时长可控 - 自由切换情绪（开心、生气、悲伤等），甚至能用文字告诉模型“我想让声音听起来愤怒”。 - 保持说话人音色不变，同时注入其他音频或文字里的情感。 - 生成更自然、更清晰的语音，即使在强烈情绪下也不会崩坏。 -

2

20

66

小互

@imxiaohu

16 hours

总体来说在图像编辑和推理方面 Seedream 4.0 和 Gemini Nano Banana 已经非常的接近，在各个方面不相上下。整体感受是推理能力 Nano Banana 还是略微强大一些，但是在图像编辑和其他控制方面已经不分伯仲。更多测试案例和对比查看完整测试文章： https://t.co/msM5h3HehB

0

3

小互

@imxiaohu

16 hours

看到没，我终于吃上了肯德基😂 这些都是基于模型的强大推理能力，全程我只是进行文字提示聊天，上传参考图，它自己会根据你的要求进行自动合成。这个时候我发现，我的脸有点黑，发型也不时尚另外我的鞋子左右也不一致让它给我美颜和修改下

1

小互

@imxiaohu

16 hours

我们看到番茄酱也有了，而且放在了合适的位置上好了现在我可以坐下来好好享受我的肯德基了那么我发现我没有桌位，这个难不住我😅 我有豆包来了...

1

0

小互

@imxiaohu

17 hours

我们看到吸管很完美的插入到了可乐中... 这时候我又发现，没有番茄酱🍅，我这个人很喜欢吃番茄酱我必须要弄个番茄酱才行

1

0

1

小互

@imxiaohu

17 hours

我们看到它打开了盒子，并展示了里面的食物，第一个长盒子我觉得展示的是很正确的，第二个盒子我个人认为里面应该是个汉堡🍔 但是它给我展示的是炸鸡，不过这个可能是盒子上有英文误导了这一结果。我们注意到这个可乐是没有吸管的，不方便我喝，我需要个吸管让豆包给我的可乐插个吸管😁

1

0

1

小互

@imxiaohu

17 hours

推理能力测试豆包 Seedream 4.0另一个明显的提升是对模糊需求的理解，也就是模型的推理能力，这个至关重要，因为只有模型推理能力上去后，它的衍生功能才能得到极大的发挥。这是一个肯德基的餐品图，我们看到这有两个盒子下面我们让豆包把这两个盒子打开看看里面有什么...

1

0

1

小互

@imxiaohu

17 hours

还可以用生成的参考照片去生成其他图像比如这样面部形象特征都做到了很好的保持

1

0

1

小互

@imxiaohu

17 hours

选取第一张图像，继续进行后续的要求让给我一杯星巴克咖啡，然后再喝一口星咖啡，同时更换背景画面都很好的完成了我的要求

1

0

小互

@imxiaohu

17 hours

看看效果... 我有身体了... 而且保留了我头像的特征和面部的表情，包括我招牌的犀利眼神和红框眼镜

1

0

1

小互

@imxiaohu

17 hours

下面是我的测试：在豆包上传我的头像，要求其根据我头像生成我的身体，众所周知我一直没有身体只有头像。

1

0

小互

@imxiaohu

17 hours

豆包 Seedream 4.0 图像模型确实很强测试完毕后，个人认为和Nano Banana不相上下可能在推理能力上稍微有一点弱，多轮一致性会丢失一点其他应该是二者互有优劣但是Seedream 4.0在中文能力上要比Nano Banana强很多，更适合中国宝宝体质...🥲 下面是我的测试结果🧵↓

3

11

85

��互

@imxiaohu

22 hours

如何启用：开发者模式可以在 Pro 和 Plus 账户中启用，进入设置中的连接器 -> 高级 -> 开发者模式进行开启。详细介绍： https://t.co/oVtYYUbOhN

0

1

小互

@imxiaohu

22 hours

ChatGPT推出开发者模式支持自定义连接器与任意MCP集成，可实现搜索获取修改写入操作在开发者模式下，开发者可以创建连接器，并且不仅仅是进行搜索或抓取，还可以使用这些连接器进行写入操作。这意味着，开发者可以通过 ChatGPT 来直接处理一些自动化任务，进行更灵活的集成，简化工作流程。

3

11

37

小互

@imxiaohu

1 day

同时还内置了各种视频模型可以编辑图像之间生成视频，利用首尾帧制作特效视频更多案例详细的测试： https://t.co/C9dtHCiVXU

0

1

6

小互

@imxiaohu

1 day

效果展示可以批量生成各种场景，人物保持一致 Agent 的流程化分解 + 画布的模板化重复，轻松编辑和修改。非常nice

1

0

6

小互

@imxiaohu

1 day

轻松创造一个属于自己的模特，无需付费，也不需要招聘摄影师即可对你的产品进行各种宣传图、广告图的拍摄和制作。这些全部在一个画布里面完成，而且是只需要聊聊天即可... 直接批量生成放在以前想都不敢想

1

5