-
Midscene.js – AI驱动的 UI 自动化测试框架
Midscene.js项目简介 Midscene.js是基于AI技术的自动化SDK,通过用大型语言模型(LLM)简化UI自动化测试中的命令。用户用自然语言描述交互步骤或预期数据格式,Midscene.js将执行相应的操作。Midscene.js支持执行动作、查询数据和页面断言,减少脚本维护成本,提供可视化报告。Midscene.js是一个开源项目,能在用户自己的环境下运行,确保数据安全。 Mids…- 3
-
Devstral – Mistral AI联合All Hands AI开源的编程专用AI模型
Devstral项目简介 Devstral是Mistral AI和All Hands AI推出的专为软件工程任务设计的编程专用模型。Devstral在解决真实世界软件问题上表现出色,在SWE-Bench Verified基准测试中,得分46.8%大幅领先其他开源模型。Devstral支持处理复杂代码库中的上下文关系、识别组件间联系及发现细微的代码错误。Devstral轻量级,能在单个RTX 409…- 1
-
AI优质视频创作案例关于我用AI做了一部《三体》预告片
自从Runway画质和一致性更新以后,一直想再用AI做一部科幻的预告片。 所以,我就把手伸向了《三体》,话不多说,直接放视频吧。 《三体》的难度比之前的所有AI视频都要难,难点其实不是4s视频的处理。 而是电影质感的静态图。 三体的场景,大部分AI都画不出来。 Midjourney的电影质感很强,但是语义理解能力太差,很多镜头包括人体计算机、太阳系二向化等等根本画不出来。Stable Diffus…- 2
-
FramePainter – 哈工大联合华为诺亚推出的交互式图像编辑AI工具
FramePainter项目简介 FramePainter 是基于 AI 的交互式图像编辑工具,通过结合视频扩散模型和直观的草图控制,让用户能通过简单的绘制、点击或拖动操作来指示编辑意图,实现对图像的精确修改。FramePainter 的核心优势在于其高效的训练机制和强大的泛化能力,即使在少量样本的情况下,也能生成高质量的编辑结果。 FramePainter优势介绍 直观的草图控制:用户可以通过在…- 0
-
致敬梵高我用AI绘画+视频制作了梵高的一生
梵高,是我最喜欢的艺术家,没有之一。 因为他那传奇但惨烈的一生,因为他那播洒向命运的画作。 很久以前,在看到哈利波特电影里的动态画作时,我就有一个想法。 如果我让梵高的画作,动起来是什么样子。 如果用梵高的画作,去串起他的一生,是什么样子。 在做了《流浪地球3》的预告片后,我觉得,我终于可以去尝试这个想法了。 于是,我花了2个晚上,将我最喜欢最喜欢的梵高的画作,跟我了解的他一生的故事,做成了一个小…- 2
-
SynCamMaster – 快手联合浙大、清华等机构推出的多视角视频生成模型
SynCamMaster项目简介 SynCamMaster是浙江大学、快手科技、清华大学和香港中文大学的研究人员共同合作推出的全球首个多视角视频生成模型,能结合6自由度相机姿势,从任意视点生成开放世界视频。SynCamMaster增强了预训练的文本到视频模型,确保不同视点的内容一致性,支持多摄像机视频生成。基于插件式模块和多视图同步模块,实现视点间的动态同步,保持4D一致性。SynCamMaste…- 1
-
OctoTools – 斯坦福推出解决复杂推理任务的开源智能体框架
OctoTools项目简介 OctoTools 是斯坦福大学推出的开源智能体框架,基于可扩展的工具解决复杂的推理任务。OctoTools用标准化的工具卡片(tool cards)封装工具功能,无需额外训练即可集成新工具。框架包含规划器(planner)用在高阶和低阶规划,执行器(executor)用在执行工具调用。OctoTools 在 16 个多样化的基准测试中表现出色,平均准确率比 GPT-4…- 0
-
OSAID 1.0 – OSI发布的全球首个开源 AI 官方标准1.0版本
OSAID 1.0项目简介 OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source Initiative(OSI)发布的官方标准,用在明确AI系统成为开放源代码的条件。参与制定OSAID 1.0的组织包括微软、谷歌、亚马逊、Meta、英特尔、三星、Mozilla基金会、Linux基金会、Apache软件基金会等超过25个组织。OSAID…- 3