众所周知,我是一个什锦区的AI博主,每天都在各种AI领域之间反复横跳,然后努力的分享一些很酷的AI干货。
但是每天也都被各种朋友问:“大佬,有没有能XXX的AI工具?大佬,这个东西是什么XXXAI做的?大佬,我能请教一下XXX不”
我真怕啥时候给我来一句:“大佬,你能用AI给我生个猴子?不”
…
所以,这篇文章,我想好好盘点一下从ChatGPT出现到现在,真正实用且主流的AI工具。
包含大语言模型、AIPPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分。
这近半年我作为AI什锦区博主的高强度的输出,做这种盘点,应该还算是有点说服力的对吧。
所以你们想要最全最实用的AI工具大全,真的看我这一篇,就够了。
我选出来17个,基本上涵盖了我自己也是99%以上的AI工具使用时间,全文也不含任何广告,放心食用吧。
大语言模型
Top1. ChatGPT
ChatGPT
目前最具影响力的多模态AI聊天机器人,基于GPT-4大规模预训练语言模型的对话系统,由人工智能研究公司OpenAI开发。
获取工具
整个AI行业无可争议的No.1.现在估值都翻到600亿美刀了。引领整个行业变革的大哥,无需多言,我自己绝大多数时间都是在用GPT去处理各种东西。目前支持多模态(识别图片),传文件,写代码,跑程序,画图片。马上又可以原生的支持ChatPDF了,更能将各类工具混合在一起形成AI Tools,这是真的通用AGI的雏形了。
教程我也写了太多太多,在我公众号里搜索ChatGPT就能看到。但是我还是想放两篇天天被问的最多的教程∶
如何体验GPT-4?ChatGPT-Plus会员傻瓜级开通指南
GPT-4的威力大家也都看到了,现在甚至已经成了我的主流工作方式最近也有很多朋友问我,如何体验GPT-4.问的还相当多,我就索性写一篇文章摁着你手,手把手教你体验GPT-4.当然,得花Money。开通ChatGPT PLUS会员,就可以体验GPT-4模型,虽然现在阉割的有点厉害,从最初的4小时100条限制变成了3小时25条,不过还是值得尝试。
阅读文章
ChatGPT账号傻瓜级注册指南 丨小白图文教学一看就会
自4.2大灾难之后,有无数账号被封禁,很多人手上的账号都是以前不知道从哪买的,全部无一例外的炸了。后账号时代,太多人想要有自己的账号了,账号、密码握在手上的安心感,那可不是一般能比的。这篇文章,就手把手的教大家,注册一个自己的ChatGPT账号。
阅读文章
(PS∶虽然都是几个月前写的,但是至今也没失效!刚刚亲测,能用)
Top2. Claude
Claude
Claude聊天机器人是Anthropic公司推出的一款基于人工智能和自然语言处理技术的智能聊天机器人,旨在帮助用户解答问题、提供服务和娱乐。
获取工具
AI大语言模型领域的万年老二,我已经用的很少了,但是他支持100K的超长文本输入还是目前独一档,很多超长的会议纪要、论文等等,我还是会用Claude来去做整理和总结的。
Top3. 智谱清言
智谱清言
一款由智谱AI开发的,基于GLM大模型的双语对话模型。基于领先的千亿级多语言、多模态预训练模型,打造高效率、通用化的“模型即服务”AI开发新范式。
获取工具
国产替代。很多人其实因为种种原因,比如单位、网络限制,魔法限制等等,只能用国产,那还是推荐智谱清言,我心中的国产大模型No.1.基本上就是ChatGPT的国产平替,多模态写代码画图什么都有,而且效果都不错,毕竟大名鼎鼎的ChatGLM在国际上还是有很强的影响力的。
AI PPT
Top1. MotionGo
MotionGo ChatPPT–AI对话式命令自动生成PPT演示
MotionGo ChatPPT是一款由必优科技开发的PPT动画插件,它可以让你轻松地为你的PPT添加各种精美的动画效果,让你的演示更加生动有趣。Motion Go是原口袋动画插件的升级版,它在保留了口袋动画的核心功能的基础上,增加了更多的创新和优化,让你的PPT动画制作更加高效和智能。Motion Go目前正在公测中,你可以在官网免费下载试用。
获取工具
大家经常问我的另一个问题就是,大佬,做PPT有什么AI工具?MotionGo还是可以的,毕竟大部分的PPT都是演示,再做PPT之前基本上都会有一个脑图或者文档(不要说你没有。。。),MotionGo支持传word、txt、Xmind之类的直接生成PPT,这点还是很香的。
AI 绘图
Top1. Midjourney
Midjourney
目前最具影响力的AI绘图工具
获取工具
目前AI绘图领域综合效果最好、审美最强、最适合小白的产品,大部分直出的图都可以直接拿来用,直接集成在了Discord里,操作傻瓜,目前也在急速迭代中,正在All in 3D。
Top2. Stable Diffusion
Stable Diffusion
目前最具影响力的开源的AI图像生成模型
获取工具
AI绘图的奠基者之一,生态的起点。虽然本身的模型质量和审美都挺拉的,但是架不住它是开源的。百万级别的开发者和艺术家,基于源SD1.5模型,微调并训练了无数的优质模型。不仅如此,还有无数的插件应运而生,比如鼎鼎大名的ControlNET、AnimateDiff、Defourm等等。超强的自定义特征也使他最容易嵌入工作流中,上限极高。
对着公众号私信”SD”,就有秋叶大佬的SD整合包链接了,可以直接下载,同时再附上我写过的几期模型推荐:
AI绘图StableDiffusion最强大模型盘点 – 诸神乱战
AI绘图StableDiffusion最棒LoRA模型盘点 – 小样也能出奇迹
AI绘图SDXL大模型推荐榜 – 重铸开源荣光
Top3.Dalle3
DALL·E 3
OpenAI 开发的新一代人工智能图像生成工具,能够根据用户的文字描述生成逼真的图像。
获取工具
OpenAI出的AI绘图,集成在了ChatGPT上,NewBing也可以白嫖。拥有目前最强的语义理解能力,很多很复杂的画面,MJ画不了,SD可以靠草图勉强实现,但是Dalle3可以靠提示词硬生生画出来,语义理解目前碾压式的领先。同时可以支持在画面上生成文字,除了审美差一点画风少一点,其他几乎无短板。
Top4. Clipdrop
Clipdrop–超牛的图像处理工具
Clipdrop是一个AI驱动的生态系统,提供给创作者使用的各种应用程序、插件和资源。
获取工具
Stable Diffusion母公司Stability出的应用,集成了很多有趣的AI功能,包括去人去物体、增强、扣背景、重新打灯等等,方便快捷。很久之前也写过一篇文章介绍过:
用AI一键抹除照片里的人物还原场景 – 极致体验
AI 音频
Top1. 11Labs
Elevenlabs.io–AI文字转语音配音合成平台
ElevenLabs.io是一个基于人工智能技术的文字转语音配音合成平台。
获取工具
目前我认为在TTS(文字转音频)这个领域,当之无愧的“最强”AI音频。仅需30秒到5分钟左右的极少的数据集,就可以直接克隆任何一个人的声音,完美复刻他的说话方式、他的音色,甚至连他的情绪都复刻过来。之前我也写过文章介绍过:
仅需30秒完美复刻任何人的声音 – 最强AI音频11Labs
Top2.So-Vits-SVC
So-VITS-SVC
一个开源的AI数字语音合成大模型,可以生成接近原声或者原唱的人声合成音频,音质清晰,音色相似,音准准确,韵律自然,表现力丰富。
获取工具
SVC,你就把它简单的理解成一个特定人物声音的变成器,你自己先录一段音频,然后把这个音频扔给AI,AI就自动产出另一个人声音的音频了。目前最主流效果最好的就是这个So-Vits-SVC了。对着公众号私信”S”,就有羽毛大佬做的这个项目的本地整合包。我也写过两篇教程(分别是4.0和4.1版本)介绍过:
SVC-我把我的声音训练成了AI模型,并让它唱了一首歌
用SVC做特定人物的AI配音
Top3. Stable Audio
Stable Audio
基于用户输入的文本内容提示词,自动生成对应风格的音乐、音频文件
获取工具
同样是Stable Diffusion母公司Stability出的AI音乐应用,目前在所有AI音乐生成里面质量最高,但是同时上手难度也挺大,毕竟那些乐理、乐器的专业名词真的很难写…
AI 数字人
Top1. Heygen
HeyGen
HeyGen是一个功能强大的AI视频生成平台,旨在为用户提供简单、高效、个性化的视频创作体验。HeyGen利用生成式AI技术,帮助用户轻松创建专业级的商业视频。
获取工具
作为最近最炙手可热的AI热门应用,Heygen用霉霉讲中文、郭德纲讲音域之类的视频出尽了风头。提供了照片驱动(直接让照片动起来说话)、数字人训练(上传5分钟的视频)、一键翻译视频等等。目前最全能的AI数字人六边形战士,除了贵(1个月最低29美刀15分钟),什么都好。
偷偷说一句,Heygen的声音技术是由11Labs提供的。
Top2.奇妙元
奇妙元
出门问问推出的一站式数字人视频制作&直播平台,AI数字人短视频和直播解决方案,提供真人形象克隆、声音克隆、3D数字人定制、IP活化的服务。
获取工具
AI照片驱动的国产替代,在照片驱动领域跟Heygen不相上下,我用的也非常多,之前我视频号的几个乔布斯、特朗普、巴菲特的视频就是用11Labs+奇妙元做的:
当乔布斯看完昨晚的苹果发布会,也终于喊出了那四个字…
Top3. 商汤如影
商汤如影
商汤科技推出的AI数字人视频生成平台,它基于商汤自主研发的“日日新SenseNova”大模型体系。让每个人都可以轻松创作令人惊艳的数字人短视频。
获取工具
国内定制数字人领域的王者,毕竟商汤就是做人像出身,在数字人定制这块是Top级的,很多需要直播的群友在体验了市面上一些数字人产品后,甚至给我反向安利商汤如影…目前支持PC和APP端。
AI 视频
Top1. Runway
Runway
被称为视频版MidJourney,下一代内容创作套件,拥有30多种AI魔法工具、实时视频编辑和协作功能等。
获取工具
AI视频领域的王者,前几天生成模型Gen2更新以后,画质和稳定性大幅提升,配合MJ效果直逼电影级画质。而且Runway是一个综合站,不仅可以生成视频,还可以视频抠像、删背景、运动追踪啥都行。。我之前也用Runway做了两个作品:
我用AI做了一部《流浪地球3》的预告片…
我用AI做了一部短片 – 《流浪地球3番外:致遥远的梦》
Top2. PIKA
Pika AI
一款强大的 AI 视频生成应用和 AI 视频编辑平台,由华人开发团队领导。
获取工具
同样是AI视频领域的佼佼者,Runway的竞品,但是只专注于AI视频生成,集成进了Discord里,对语义理解很好,你的文字prompt真的是会起作用的,不像RunwayGen2油盐不进,但是目前画质跟RunwayGen2相比还是差了一个世代,等他们更新2.0版本。不过优点嘛,就是免费。
如果你跟我一样成为PIKA的超级合作者的话,生成的视频也没水印,还有专线嘿嘿…
Top3. TopazViedo AI
Topaz Video AI,ai视频处理工具
无限制地访问世界领先的用于视频提升、去除交错、运动插值和抖动稳定的生产级神经网络,全部都是为你的本地工作站进行优化的。
获取工具
目前视频画质增强、修复的最强AI。在超分领域属实万金油。软件我也整合好了,对着我公众号私信”T”就有下载链接了。后面我也会写一篇Topaz Vide AI的教程和参数选用,敬请期待~
写在最后
以上就是我选出来的大语言模型、AI PPT、AI 绘图、AI音频、AI数字人、AI视频这6个部分的17个应用。
当然还有很多或新或旧的其他的应用,比如做动捕的WonderStudio、做3D的Luma AI、AI视频领域的两个新秀Genmo和Moonvalley、SD上现在很火的AI视频框架AnimateDiff、照片驱动D-ID、PPT的Gamma等等等等。太多太多了。
但是我觉得或多或少泛用性都有点问题,要么打不过上面的这17个,要么应用领域太窄,要么上手门槛太高,对普通AI玩家意义不是很大。
上面这17个,足够支撑你在现在的AI时代,混的风生水起了。