-
Pangea – 卡内基梅隆大学开源的多语言多模态大语言模型
Pangea项目简介 Pangea是卡内基梅隆大学团队推出的多语言多模态大型语言模型(LLM),能提升全球语言和文化多样性的覆盖。模型包含600万条指令的多样化数据集,支持39种语言,包含高质量英文指令、机器翻译指令及文化相关任务。Pangea基于包含14个数据集、覆盖47种语言的PangeaABench评估套件进行性能评估。Pangea在多语言和文化背景下的性能超越现有开源模型(如Llava-1…- 1
-
TrendPublish – AI内容发布工具,支持智能总结和自动发布
TrendPublish项目简介 TrendPublish 是基于 AI 的趋势发现和内容发布系统。基于多源数据采集,从 Twitter/X、网站等渠道获取信息,用 DeepseekAI、千问等 AI 服务进行智能总结、关键信息提取和标题生成。系统支持自动发布内容到微信公众号,具备自定义模板和定时发布功能。TrendPublish集成通知系统,可实时反馈任务状态和错误告警。TrendPublish…- 0
-
Ruyi – 图森未来推出的图生视频大模型
Ruyi项目简介 Ruyi是图森未来推出的图生视频大模型,专为在消费级显卡上运行设计,支持多分辨率、多时长视频生成,具备首帧、首尾帧控制、运动幅度控制和镜头控制等特性。Ruyi基于DiT架构,由Casual VAE模块和Diffusion Transformer组成,用在视频数据压缩和生成。Ruyi能降低动漫和游戏内容的开发周期和成本,是ACG爱好者和创作者的理想工具。目前图森未来将Ruyi-Mi…- 3
-
Goku – 港大和字节联合推出的最新视频生成模型
Goku项目简介 Goku是香港大学和字节跳动联合发布的最新视频生成模型,专为图像和视频的联合生成设计。基于先进的rectified flow Transformer框架,支持文生视频、图生视频及文生图等多种模式。Goku的核心优势包括高质量的视频生成能力、极低的广告视频制作成本(比传统方法低100倍)。Goku基于大规模高质量的数据集和高效的训练设施。研究人员构建了包含约3600万视频和1.6亿…- 0
-
ChatGPT使用途径大揭秘!数据调研报告解答:用户主要使用ChatGPT来解决什么任务?
AI奇点网9月4日报道丨ChatGPT自去年底推出后就引起了科技界、主流媒体和各行各业专业人士的关注。人们纷纷讨论,ChatGPT会如何影响人类的工作岗位,会不会取代人类? 为了解答一系列的问题,数据调研公司 SparkToro 与 Datos 合作进行了一项为期两个月的调查,分析了 ChatGPT 当下的使用现状,包括以下几个方面: ChatGPT的使用是否在增加? 根据 OpenAI.com …- 3
-
Pocket Flow – 开源的轻量级AI应用开发框架,仅用100行代码实现
Pocket Flow项目简介 Pocket Flow 是极简的 LLM(大型语言模型)框架,仅用 100 行代码实现。具有轻量级、无依赖、无厂商锁定的特点。Pocket Flow支持多Agents、工作流、检索增强生成(RAG)等强大功能,帮助开发者快速构建基于 LLM 的应用程序。基于Agentic Coding范式,AI Agents协助开发,大幅提升开发效率。Pocket Flow 适合希…- 0
-
WorldSense – 小红书联合上海交大推出的多模态全面评测新基准
WorldSense项目简介 WorldSense是小红书和上海交通大学推出的,用在评估多模态大型语言模型(MLLMs)在现实世界场景中对视觉、听觉和文本输入的综合理解能力的基准测试。WorldSense包含1662个音频-视频同步的多样化视频,覆盖8个主要领域和67个细分子类别,及3172个多项选择问答对,涉及26个不同的认知任务。WorldSense强调音频和视频信息的紧密耦合,所有问题都需要…- 2
-
Dify-Plus – 基于 Dify 二次开发的企业级增强版项目
Dify-Plus项目简介 Dify-Plus 是基于 Dify 二次开发的企业级增强版项目,集成基于 gin-vue-admin 的管理中心。Dify-Plus在 Dify 基础上新增用户额度、密钥额度、Web 公开页登录鉴权、应用中心等功能,优化了权限管理,适合企业场景使用。Dify-Plus项目开源,解决行业痛点,适合需要在企业场景中对资源进行精细化管理的用户使用。 Dify-Plus优势介…- 12