-
豆包1.5·UI-TARS – 字节豆包推出的 GUI Agent 模型
豆包1.5·UI-TARS项目简介 豆包1.5·UI-TARS是字节豆包推出的面向图形界面交互(GUI)的Agent模型。模型基于感知、推理和动作执行等类人能力,与图形界面进行连续、流畅的交互。模型将视觉理解、逻辑推理、界面元素定位和操作整合在单一模型中,无需预定义工作流程或人工规则,实现端到端的任务自动化。豆包1.5·UI-TARS 已在火山方舟平台上线。 豆包1.5·UI-TARS优势介绍 图…- 1
-
FoxBrain – 鸿海研究院推出的推理大语言模型
FoxBrain项目简介 FoxBrain 是鸿海研究院推出的繁体中文大型语言模型(LLM),具有强大的推理能力。基于 Meta Llama 3.1 架构,拥有 70B 参数,专注于数学和逻辑推理领域。FoxBrain 基于高效训练策略,用四周时间完成训练,使用 120 张 NVIDIA H100 GPU,展现了高效率和低成本的特点。FoxBrain基于自主技术生成高质量中文预训练数据,用 Ada…- 1
-
MATRIX-Gen – 上海交大联合牛津大学推出的多智能体模拟系统
MATRIX-Gen项目简介 MATRIX-Gen是上海交通大学和牛津大学研究团队推出的多智能体模拟系统,基于模拟1000多个具有独立身份和人格的AI智能体组成的社会,生成多样化且高质量的训练指令数据。训练指令数据用在大型语言模型(LLMs)的后训练,提升模型遵循人类指令的能力,在多个任务中展现出优异的性能。MATRIX-Gen根据不同需求合成指令,包括通用和特定领域的数据集,推动了大模型自我进化…- 1
-
Pollinations.AI – 开源AI内容生成平台,提供免费文本和图像生成API
Pollinations.AI项目简介 Pollinations.AI 是开源的AI内容生成平台,提供免费且易于使用的文本和图像生成 API。Pollinations.AI无需注册或 API 密钥即可使用,支持多种功能,包括图像生成、文本生成、文生音频、音频转文字及视觉内容解析。Pollinations.AI 提供丰富的 API 接口和 SDK,方便开发者快速集成。Pollinations.AI推…- 1
-
Midjourney巨献!最强动漫绘画生成器Niji-journey客户端生图体验:一键生成二次元小姐姐,画风不要太美啦
家人们,最近在画师圈子诞生了一场小小的轰动~ 被誉为「地表最强二次元绘画模型」的Niji-journey推出了官方APP。 没错!就是那种可以直接在手机上生图的那种! 只需几步简单设置操作,就可以快速生成各种二次元小姐姐。对于各位原画师盆友,别提有多快乐~? Niji-journey模型是什么? Niji-journey是由在线AI图像生成工具Midjourney与麻省理工团队Spellbrush…- 1
-
AI工具测评:6大板块中,有哪些真正实用且主流的AI工具?
众所周知,我是一个什锦区的AI博主,每天都在各种AI领域之间反复横跳,然后努力的分享一些很酷的AI干货。 但是每天也都被各种朋友问:“大佬,有没有能XXX的AI工具?大佬,这个东西是什么XXXAI做的?大佬,我能请教一下XXX不” 我真怕啥时候给我来一句:“大佬,你能用AI给我生个猴子?不” ... 所以,这篇文章,我想好好盘点一下从ChatGPT出…- 1
-
InternVideo2.5 – 上海 AI Lab 联合南大、中科院开源的视频多模态大模型
InternVideo2.5项目简介 InternVideo2.5是上海人工智能实验室联合南京大学、中科院深圳先进技术研究院共同开源的视频多模态大模型。在视频理解领域取得了显著进展,特别是在长视频处理和细粒度时空感知方面表现出色。模型能处理长达万帧的视频,视频处理长度较前代提升了6倍,可在长视频中精准定位目标帧,实现“大海捞针”式的检索。支持通用视频问答,完成目标跟踪、分割等专业视觉任务。 Int…- 1
-
YAYI-Ultra – 中科闻歌推出的混合专家模型
YAYI-Ultra项目简介 YAYI-Ultra (雅意)是中科闻歌研发的企业级大语言模型的旗舰版本,具备强大的多领域专业能力和多模态内容生成能力。支持数学、代码、金融、舆情、中医、安全等多个领域的专家组合,能缓解垂直领域迁移中的“跷跷板”现象。YAYI-Ultra 支持最长128k的输入和更长的上下文窗口,具备1000万+图文数据对齐的多模态能力。支持多轮对话角色扮演、内容安全风控以及10+智…- 1