-
Markdown-to-Image – 开源的在线 Markdown 转海报编辑器
Markdown-to-Image项目简介 Markdown-to-Image是开源的Markdown 转海报编辑器,作为React组件能将Markdown文本内容转换成图像,适用于创建社交媒体帖子、海报和其他视觉内容。工具支持多种输出格式,包括海报、图片、引用、卡片等,用户能自定义样式。Markdown-to-Image项目包括内置的 Web 编辑器,能作为在线Markdown转海报编辑器使用,…- 1
-
LongWriter – 清华联合智谱AI推出的长文本生成模型
LongWriter项目简介 LongWriter 是清华大学联合智谱AI推出的长文本生成模型,能生成超10,000字的连贯文本,项目已开源。通过分析现有大型语言模型的输出限制,创建了”LongWriter-6k”数据集,成功扩展了AI模型的输出能力。LongWriter 还采用了直接偏好优化(DPO)技术来提高模型的输出质量和遵循指令中长度限制的能力。 LongWriter优势介绍 超长文本生成…- 1
-
RegionDrag – 港大和牛津联合开发的基于区域的图像编辑技术
RegionDrag项目简介 RegionDrag是由香港大学和牛津大学联合开发的一种基于区域的图像编辑技术。基于扩散模型,让用户定义手柄区域和目标区域来表达编辑意图,实现快速且精确的图像编辑。比传统的点拖动编辑更快,减少计算时间,提高编辑的直观性和准确性。RegionDrag一次性迭代完成编辑,提升编辑效率,采用注意力交换技术增强稳定性,使图像编辑在保持高质量输出的同时,速度比现有技术快100倍…- 1
-
“霉霉”“赫敏”10级中文采访视频全网刷屏!全世界都在说中国话:盘点4款超牛的AI翻译+配音工具
最近,网上的营销号全是“霉霉说中文”的视频。 EVA感慨,实在太火了! 咱们先来重温一下—— 随便打开一个抖音、微博都能刷到类似的段子。 不仅有泰勒·斯威夫特说中文,还有“赫敏”艾玛·沃特森说中文。 感慨一下——到底是大明星啊,语言天分直线拉满! 事实上,这都是AIGC技术在背后“捣鬼”。 马上就到万圣节了?,家人们可别被开口说中文的鬼怪给吓到了。 除了上述两位大美女,网上还流传着美国前总统特朗普…- 1
-
DoraCycle – 新加坡国立大学推出多模态领域适应的统一生成模型
DoraCycle项目简介 DoraCycle 是新加坡国立大学 Show Lab 推出多模态领域适应的统一生成模型,通过两个多模态循环(text-to-image-to-text 和 image-to-text-to-image)实现不同模态间的信息转换与对齐,基于统一生成模型学习的双向映射,以非配对数据进行领域适配训练,无需大量标注数据。模型通过循环端点的交叉熵损失优化,促进自我进化,适应特定…- 1
-
Phantom – 字节跳动推出的主体一致视频生成框架
Phantom项目简介 Phantom是字节跳动智能创作团队推出的用在主体一致视频生成(Subject-to-Video, S2V)的框架。基于跨模态对齐技术,结合文本和图像提示,从参考图像中提取主体元素并生成与文本描述一致的视频内容。Phantom基于现有的文本到视频(T2V)和图像到视频(I2V)架构,重新设计了联合文本-图像注入模型,基于文本-图像-视频三元组数据学习跨模态对齐。Phanto…- 1
-
MangaNinja – 基于参考图像的线稿着色技术
MangaNinja项目简介 MangaNinja是基于参考图像的线稿上色方法,具备精准匹配和细致控制的能力。通过创新的补丁重排模块和点驱动控制方案,提升了上色的准确性与图像质量。能应对多样化的上色挑战,包括极端姿势和多参考图像的协调,实现高质量的互动上色体验。 MangaNinja优势介绍 基于参考的线条艺术上色:通过参考图像为线稿提供上色指导,实现精确的颜色匹配。 精确的角色细节转录:补丁重排…- 1
-
Co-Sight – 中兴通讯开源的超级智能体项目
Co-Sight项目简介 Co-Sight是中兴通讯开源的超级智能体项目,为协同视觉分析平台及智能自动化底座。采用多智能体架构,构建“数字团队”协同体系,通过DAG任务引擎驱动,实现任务的高效调度与执行。Co-Sight具备自我进化能力,能通过执行记录与模型推理自动生成智能总结报告,形成持续改进闭环。注重安全与可靠性,所有操作在沙箱环境中运行,支持日志追溯、权限管控与合规审计。 Co-Sight优…- 1