-
FireCrawl – 开源 AI 网络爬虫工具,擅长处理动态网页内容、自动爬取网站及子页面
FireCrawl项目简介 FireCrawl是开源的AI爬虫工具,专门用在Web数据提取,转换为Markdown或其他结构化数据。FireCrawl具备强大的抓取能力,支持动态网页内容处理,提供智能爬取状态管理和多样的输出格式。FireCrawl集成了LLM Extract功能,用大型语言模型快速完成数据提取,适用于大模型训练、检索增强生成(RAG)、数据驱动开发项目等多种场景。 FireCra…- 0
-
Ev-DeblurVSR – 中科大等机构推出的视频画面增强模型
Ev-DeblurVSR项目简介 Ev-DeblurVSR是中国科学技术大学、合肥综合性国家科学中心人工智能研究所和新加坡国立大学联合推出的视频画面增强模型,能从低分辨率且模糊的视频输入中恢复出高分辨率、清晰的视频。Ev-DeblurVSR引入事件相机捕获的事件信号,用高时间分辨率和丰富的运动信息增强视频的去模糊和超分辨率性能。Ev-DeblurVSR的核心包括互惠特征去模糊模块(RFD)和混合可…- 0
-
Unique3D – 清华大学团队开源的图像到3D生成模型
Unique3D项目简介 Unique3D是清华大学团队开源的一个单张图像到3D模型转换的框架,通过结合多视图扩散模型和法线扩散模型,以及一种高效的多级上采样策略,能够从单张图片中快速生成具有高保真度和丰富纹理的3D网格。Unique3D结合ISOMER算法进一步确保了生成的3D模型在几何和色彩上的一致性和准确性,仅需30秒即可完成从单视图图像到3D模型的转换,生成效果优于InstantMesh、…- 0
-
Retinex-Diffusion – AI图像照明控制框架,让图像明暗更自然、细腻
Retinex-Diffusion项目简介 Retinex-Diffusion是基于Retinex理论的AI图像照明控制技术,让图像明暗更加自然、细腻、富有层次感。Retinex-Diffusion不需要重新训练模型,通过识别图像中的光照元素并指导图像生成模型,用户可以轻松调整亮度、阴影和光照方向。Retinex-Diffusion能生成具有逼真照明效果的图像,包括投射阴影、软阴影和相互反射,且无…- 0
-
LeviTor – 南大联合蚂蚁等机构开源的3D目标轨迹控制视频合成技术
LeviTor项目简介 LeviTor是南京大学、蚂蚁集团、浙江大学等机构推出的图像到视频合成技术,结合深度信息和K-means聚类点控制视频中3D物体的轨迹,无需显式的3D轨迹跟踪。LeviTor用高质量的视频对象分割数据集进行训练,有效捕捉复杂场景中的物体运动和交互,基于用户友好的推理流程简化3D轨迹输入,让视频生成技术更加先进和易用。LeviTor的引入为3D物体轨迹控制铺平道路,拓宽创意应…- 1
-
MoBA – Moonshot AI 提出的新型注意力机制
MoBA项目简介 MoBA(Mixture of Block Attention)是 Moonshot AI 提出的新型注意力机制,提高大型语言模型(LLMs)处理长上下文任务的效率。通过将上下文划分为多个块(block),引入无参数的 top-k 门控机制,让每个查询 token 动态选择最相关的键值(KV)块进行注意力计算。显著降低了计算复杂度,保持了与全注意力机制相当的性能。MoBA 的核心…- 1
-
ORMBG – 开源的AI图像分割工具
ORMBG项目简介 ORMBG是开源的AI图像分割工具,由开发者schirrmacher在GitHub上发起。ORMBG专注于从图片中准确去除背景,用先进的图像处理技术,实现对图像中前景和背景的精确区分,常用于照片编辑、图像合成和自动化图像处理等领域。ORMBG是一个社区驱动的项目,鼓励全球开发者参与,贡献代码,共同推动项目的发展和完善。 ORMBG优势介绍 照片编辑:快速去除人物或物体背景,便于…- 0
-
ChatGPT对话如果跨越了一生,AI该怎么跟我们对话?
我自己做了那么多的感性的AI内容。 自认为AI生成的东西,已经很难打动我了。 但是直到前两天,我在网上看到一组对话,直接给我差点看的泪崩。 大概是:让GPT扮演去世的妈妈,然后展开一段跨越一生的对话。 原文当时没有保存,已经难以寻觅,所以我自己模拟了一段。 整体有过之而无不及。 一定要,看到最后。 前 方 高 能 预 警 最后一句,瞬间破防。 说真的,差点没崩住。 我觉得,这才是AI或科技该有的样…- 0