-
cobalt – 开源的流媒体下载工具,支持全平台视频、音频和图片下载
cobalt项目简介 cobalt是开源的流媒体下载工具,提供纯净、简洁无广告的体验。cobalt支持全平台视频、音频和图片下载,包括主流视频网站、社交媒体和音乐平台。cobalt提供个性化设置,支持多主题切换。用户能下载高达8K的视频和多种格式的音频,cobalt能自动提取字幕,使用简单,无需注册,支持网页版和Docker自托管部署。 cobalt优势介绍 全平台支持:能下载来自YouTube、…- 1
-
MNN – 阿里开源的移动端深度学习推理框架
MNN项目简介 MNN(Mobile Neural Network)是阿里巴巴集团开源的轻量级深度学习推理框架,为移动端、服务器、个人电脑、嵌入式设备等多种设备提供高效的模型部署能力。MNN支持TensorFlow、Caffe、ONNX等主流模型格式,兼容CNN、RNN、GAN等多种网络结构。MNN具备轻量性、通用性、高性能和易用性特点,能在不依赖特定硬件NPU的情况下运行大型模型,支持模型量化和…- 1
-
InfiniteYou – 字节跳动开源的身份保持图像生成框架
InfiniteYou项目简介 InfiniteYou(InfU)是字节跳动智能创作团队推出的基于扩散变换器(Diffusion Transformers,如 FLUX)的身份保持图像生成框架。基于 InfuseNet 将身份特征注入扩散模型,增强身份相似度,保持图像生成能力。InfiniteYou结合多阶段训练策略,包括预训练和监督微调(SFT),用合成的单人多样本(SPMS)数据,提升文本与图…- 1
-
DeepSeek-R1 – DeepSeek推出的高性能AI推理模型,性能对标OpenAI o1正式版
DeepSeek-R1项目简介 DeepSeek-R1是杭州深度求索公司 DeepSeek 推出的高性能AI推理模型,对标OpenAI的o1正式版。DeepSeek-R1推理模型通过大规模强化学习技术进行后训练,仅需极少量标注数据,便能在数学、代码和自然语言推理等任务上取得卓越表现。DeepSeek-R1遵循MIT License开源,支持模型蒸馏,训练其他模型。 DeepSeek-R1优势介绍 …- 1
-
LongLLaVA – 香港中文大学推出的多模态上下文混合架构大语言模型
LongLLaVA项目简介 LongLLaVA是的多模态大型语言模型(MLLM),是香港中文大学(深圳)的研究人员推出。基于混合架构,结合Mamba和Transformer模块,提高处理大量图像数据的效率。LongLLaVA能在单个A100 80GB GPU上处理多达1000张图像,同时保持高性能和低内存消耗。模型基于2D池化技术压缩图像token,显著降低计算成本,保留关键的空间关系信息。Lon…- 1