-
Kiln AI- 开源 AI 原型设计和数据集协作开发工具,微调专属模型
Kiln AI项目简介 Kiln AI是开源的 AI 开发工具,能简化大型语言模型(LLM)的微调、合成数据生成和数据集协作。Kiln AI提供直观的桌面应用程序,支持 Windows、MacOS 和 Linux,用户基于零代码方式对多种模型(如 Llama、GPT4o 和 Mixtral)进行微调,实现自动部署。Kiln AI提供交互式工具生成训练数据,支持基于 Git 的版本控制,方便团队协作…- 1
-
TinyVLA – 华东师范和上海大学推出面向机器人操控VLA模型
TinyVLA项目简介 TinyVLA是一种面向机器人操控的视觉-语言-动作(VLA)模型,由华东师范大学和上海大学团队推出。针对现有VLA模型的不足,如推理速度慢和需要大量数据预训练,提出解决方案。TinyVLA基于轻量级的多模态模型和扩散策略解码器,显著提高推理速度,减少对大规模数据集的依赖。模型在模拟和真实机器人平台上经过广泛测试,证明在速度、数据效率以及多任务学习和泛化能力方面优于现有的先…- 1
-
奥特曼悄悄释出神秘大模型「gpt2」:基于GPT-4开发,实测能力超越GPT-4的聊天机器人
一夜之间,大模型话题王,再次易主。 一个神秘模型突然杀入众人视野,能力超越一众开源模型,甚至包括GPT-4。几乎所有人都在谈论它,服务器都被挤爆了。 它就是“gpt2-chatbot”。(注意啊,是小写的「gpt2」,不是几年前的老模型GPT-2) 「gpt2-chatbot」有多强? IMO国际数学奥林匹克竞赛的题目,一次答对。 一次在PyOpenGL中生成旋转3D立方体…- 1
-
PromptWizard – 微软开源的 AI 提示词自动化优化框架
PromptWizard PromptWizard是微软推出的自动化提示优化框架,改进大型语言模型(LLMs)在特定任务中的表现。基于自我演变和自我适应机制,PromptWizard用反馈驱动的批评和合成过程,在探索和利用之间找到平衡,迭代地优化提示指令和上下文示例,提高模型的准确性和效率,减少API调用和令牌使用,降低成本。PromptWizard在多个任务和数据集上展现卓越的性能,即使在训练数…- 1
-
AuraFusion360 – 三维场景修复技术,实现高质量物体去除和孔洞填充
AuraFusion360项目简介 AuraFusion360是用于360°无边界场景修复的新型基于参考的方法,主要用于虚拟现实和建筑可视化等领域的三维场景修复。通过高斯散射表示的3D场景,实现了高质量的物体去除和孔洞填充。核心包括:深度感知的未见区域掩码生成,用于准确识别遮挡区域;自适应引导深度扩散(AGDD),无需额外训练的零样本方法,可实现初始点的准确放置;以及基于SDEdit的细节增强,确…- 1
-
Co-op Translator – 微软推出面向开发者的开源多语言翻译工具
Co-op Translator项目简介 Co-op Translator是微软推出的开源多语言翻译工具,基于Azure AI服务实现项目文档和图像中文本的自动化多语言翻译。仅需一条命令,Co-op Translator能分析项目内容,生成组织良好的多语言翻译文件夹结构,自动调整链接,保持Markdown文件的完整性。工具能简化技术文档的本地化流程,降低语言障碍,促进全球开发者间的协作,提升项目的…- 1
-
Hi3DGen – 港中文、字节、清华联合推出的3D几何生成框架
Hi3DGen项目简介 Hi3DGen 是香港中文大学(深圳)、字节跳动和清华大学的研究人员共同推出的高保真3D几何生成框架。能从2D图像生成高保真3D模型,通过基于法线图作为中间表示,Hi3DGen 可以生成丰富的几何细节,显著优于现有方法。框架包含三个关键组件:图像到法线估计器、法线到几何学习方法和3D数据合成管道。 Hi3DGen优势介绍 从2D图像生成高保真3D模型:能将2D图像转换为具有…- 1
-
一句话让小姐姐为我换了N套衣服,谷歌卷出视频生成新高度Lumiere AI使用体验分享
谷歌一出手,又把AI视频生成卷上了新高度。 一句话生成视频,现在在名为Lumiere的AI操刀下,可以是酱婶的: △“阳光明媚,帆船在湖中航行” 如此一致性和质量,再次点燃了网友们对AI视频生成的热情:谷歌加入战局,又有好戏可看了。 不止是文生视频,Lumiere把Pika的“一键换装”也复现了出来。 左谷歌右pika,同样是选中区域一句话完成视频编…- 1