-
xLAM – Salesforce开源的AI大模型,专注函数调用功能
xLAM项目简介 xLAM 是 Salesforce 开源的一款大型语言模型,专为功能调用任务设计。模型能理解和执行基于自然语言指令的 API 调用,在自动化任务和与各种数字服务交互方面非常有用。xLAM模型在 Berkeley Function-Calling Leaderboard (BFCL) 上的测试中表现出色。 xLAM优势介绍 多语言支持:xLAM 支持多种语言,能理解和处理不同语言的…- 1
-
AI优质短片创作案例用王家卫的方式,回顾“平凡”的2023年
作者平凡的生活回顾了2023年发生的种种事情,包括城市变化、个人经历、科技发展等。 00:092023年城市生活:描述了作者在2023年观察到的城市生活场景和自己的感受。 01:10普通人的触动: 讲述了一个普通人在2023年遇到的一些让人触动的事情。 02:27人们的选择:探讨了人们在2023年面临的选择和挑战,以及作者自己的看法。- 2
-
Pippo – Meta 推出的单图生成多视角高清人像视频模型
Pippo项目简介 Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。模型基于多视角扩散变换器,预训练了30亿张人像图像,在2500张工作室捕捉的图像上进行了后训练。Pippo的核心技术包括ControlMLP模块,用于注入像素对齐的条件,以及注意力偏差技术,能在推理时生成比训练时多5倍以上的视角。Pippo引入了重投影误差,用…- 1
-
MagicMan – 腾讯联合多所高校推出2D图像生成3D人类模型的AI项目
MagicMan项目简介 MagicMan 是清华大学深圳国际研究生院、腾讯AI实验室、香港科技大学、斯坦福大学和香港中文大学的研究团队共同推出的AI项目,专注于基于深度学习技术从单张2D图像生成高质量的3D人类模型。结合预训练的2D扩散模型和参数化的SMPL-X模型,通过混合多视角注意力机制和迭代细化策略,实现精确的3D感知和图像生成。在游戏、电影、虚拟现实等多个领域具有广泛的应用潜力。 Mag…- 0
-
AI提示词一键优化神器推荐!PromptPerfect上手体验:支持多款知名AI工具,让生成式AI的效能MAX放大
AI大模型已经越来越强大了,我们要怎么才能把它变成生产力工具? 根据最近的一个调研发现,即使是在程序员这个群体里,能真正用好AI去激发生产力的人也只占6%,也就是说其实有94%的人都还不能很好的把生成式AI转化为生产力AI,这里摘录一些比较有代表性的“痛点”,大家也来投票看看: 所以,在未来很长的一段时间里,“如何让大语言模型生成你想要的结果”这件事…- 4
-
效率神器!打工人必须掌握的三个WPS AI应用小妙招,轻松搞定日常工作汇报
作为职场人,我们经常要同步和汇报工作,如项目报告、年度总结等。这时你既要思考突出工作重点,整理繁杂的数据,还要制作美观的PPT。 如何兼顾汇报的高质量和高效?你可以尝试使用WPS AI试试。 汇报大纲和PPT,AI一手包办 整理思路,AI给你灵感 自己做了很多工作,不知如何有条理地呈现? 以年度总结汇报为例,打开WPS演示,在WPS AI对话框输入主题:“生成一份工作总结PPT,主题为销售团队年度…- 2
-
Open Deep Research – Deep Research开源复现版智能体,支持切换多种语言模型
Open Deep Research项目简介 Open Deep Research 是开源的 AI 智能体,是Deep Research开源复现项目,基于推理大量网络数据完成复杂的多步骤研究任务。Open Deep Research使用 Firecrawl 的搜索和提取功能,不依赖 OpenAI 的 o3 微调模型。Open Deep Research支持多种语言模型(如 OpenAI、Anthr…- 1
-
Midjourney局部微调新功能Inpainting体验:一键修正AI绘画手脚容易出现的“六指琴魔”BUG,还能轻松消除路人甲
AI绘画工具:Midjourney 工具介绍:Midjourney一个领先的AI绘画图像生成器工具。通过创造新的人机交互方式,让人们能够更自由、更深入、更有趣地表达自己的想法和创意。利用了最先进的深度学习技术,让用户可以通过简单的文字提示,生成各种类型和风格的图像,从而实现视觉想象的无限可能。 工具链接:https://www.aieva.cn/sites/404.html 家人们,自打Midjo…- 1