
小互
@imxiaohu
Followers
71K
Following
2K
Media
4K
Statuses
7K
休假ing...
Mars
Joined March 2024
Bilibili 训练的这个 IndexTTS2 语音模型 效果很不错,支持情感可控 + 时长可控 - 自由切换情绪(开心、生气、悲伤等),甚至能用文字告诉模型“我想让声音听起来愤怒”。 - 保持说话人音色不变,同时注入其他音频或文字里的情感。 - 生成更自然、更清晰的语音,即使在强烈情绪下也不会崩坏。 -
2
20
66
总体来说在图像编辑和推理方面 Seedream 4.0 和 Gemini Nano Banana 已经非常的接近,在各个方面不相上下。 整体感受是推理能力 Nano Banana 还是略微强大一些,但是在图像编辑和其他控制方面已经不分伯仲。 更多测试案例和对比查看完整测试文章: https://t.co/msM5h3HehB
0
0
3
看到没,我终于吃上了肯德基😂 这些都是基于模型的强大推理能力,全程我只是进行文字提示聊天,上传参考图,它自己会根据你的要求进行自动合成。 这个时候我发现,我的脸有点黑,发型也不时尚 另外我的鞋子左右也不一致 让它给我美颜和修改下
1
1
1
我们看到番茄酱也有了,而且放在了合适的位置上 好了现在我可以坐下来好好享受我的肯德基了 那么我发现我没有桌位,这个难不住我😅 我有豆包 来了...
1
0
0
我们看到它打开了盒子,并展示了里面的食物,第一个长盒子我觉得展示的是很正确的,第二个盒子我个人认为里面应该是个汉堡🍔 但是它给我展示的是炸鸡,不过这个可能是盒子上有英文误导了这一结果。 我们注意到这个可乐是没有吸管的,不方便我喝,我需要个吸管 让豆包给我的可乐插个吸管😁
1
0
1
推理能力测试 豆包 Seedream 4.0另一个明显的提升是对 模糊需求的理解,也就是模型的推理能力,这个至关重要,因为只有模型推理能力上去后,它的衍生功能才能得到极大的发挥。 这是一个肯德基的餐品图,我们看到这有两个盒子 下面我们让豆包把这两个盒子打开看看里面有什么...
1
0
1
豆包 Seedream 4.0 图像模型确实很强 测试完毕后,个人认为和Nano Banana不相上下 可能在推理能力上稍微有一点弱,多轮一致性会丢失一点 其他应该是二者互有优劣 但是Seedream 4.0在中文能力上要比Nano Banana强很多,更适合中国宝宝体质...🥲 下面是我的测试结果🧵↓
3
11
85
ChatGPT推出开发者模式 支持自定义连接器与任意MCP集成,可实现搜索获取修改写入操作 在 开发者模式 下,开发者可以创建 连接器,并且不仅仅是进行搜索或抓取,还可以使用这些连接器进行写入操作。 这意味着,开发者可以通过 ChatGPT 来直接处理一些自动化任务,进行更灵活的集成,简化工作流程。
3
11
37
轻松创造一个属于自己的模特,无需付费,也不需要招聘摄影师即可对你的产品进行各种宣传图、广告图的拍摄和制作。 这些全部在一个画布里面完成,而且是只需要聊聊天即可... 直接批量生成 放在以前想都不敢想
1
1
5