首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 本地部署Manus+DeepSeek保姆级教程!
· MCP服务介绍及应用场景报告-来自Manus
· GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装
· 包阅AI-免费AI阅读翻译神器!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Claude 官方提示词,中文版(含API Prompt)
· 用so-vits-svc-4.1进行音色转换的极简教程!
· 备案通过且面向公众开放的国产精品大模型汇总,附访问链接
· 盘点数据安全合规方向的热门证书【快来了解一下】
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
国产大模型与全球最强大模型大比拼:语义理解、数学推理
同
台竞技,究竟谁更厉害
ensp; · 各大国产模型在不
同
评测基准上的表现
大模型
教程
用so-vits-svc-4.1进行
音
色转换的极简教程
这里要求切割后的
音
频
长度在5-15秒左右,不能太长或太短。
声音
sovits
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
目前AIgc领域正在持续关注,等到年底的时候做一个最全面的
视
频
和文字讲解,现在还是在等等,目前AI领域热度确实是在持续降温,但是呢,深入了解AI的人都知道,AI的发展不是想人一样需要很长时间的积累,有时候可能就是一个算法的突破
Stable
Diffusion
文生图
controlnet
被高估的Pika,被低估的多模态AI
例如,在医疗领域可以通过结合图像、录
音
和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声
音
、
视
频
相结合,呈现更具互动性的教育内容
大模型
多模态
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
动态表现力:通过上下文风格化的
音
频
到运动模型(ICS-A2M),MimicTalk能够「捕捉和模仿目标人物的动态说话风格」,使生成的
视
频
更加生动和富有表现力。
MimicTalk
开源模型
教程
用so-vits-svc-4.1进行
音
色转换的极简教程!
这里要求切割后的
音
频
长度在5-15秒左右,不能太长或太短。
so-vits-svc
音色转换
教程
RAG
RAG 2.0来了,它能成为生产落地的福
音
吗?
RAG 2.0方法就是克服这样的局部优化办法,通过将预训练、微调和对齐所有组件形成一个统一系统,通过反向传播
同
时优化语言模型和检索器,以最大化系统性能。
RAG
大模型
「语
音
转换新速度」— 探秘Whisper JAX的70倍速提升
这意味着它能够
同
时处理多个
音
频
片段,大幅缩短了从语
音
到文本的转换时间。
Whisper
语音识别
开源
【语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
(LID)、语
音
情感识别(SER)和
音
频
事件检测(AED)。
asr
tts
声音
登顶的小熊猫模型出AI产品了!3
步
10秒出一张海报,可免费商用
操作上述简洁
步
骤,你将得到: 平均10秒不到生成一张海报,文字部分几乎无差错,对没有海报制作经验的小白来说非常友好。
图形设计生成器
文生图
大模型
苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源
同
时升级计算机
视
觉工具包 CVNets 为 CoreNet!
OpenELM
大模型
开源
开源免费离线语
音
识别神器whisper如何安装
whisper的日常用途 whisper的核心功能语
音
识别,对于学生党和工作党来说,可以帮助我们更快捷的将会议、讲座、课堂录
音
整理成文字稿;对于影
视
爱好者,可以将无字幕的资源自动生成字幕,不用再苦苦等待各大字幕组的字幕资源
wisper
翻译
免费
开源
微软最强全自动数据可
视
化工具!现已开源
8.14,微软开源了之前已经发布的全自动数据可
视
化工具 LIDA。
大模型
大模型
聊天大模型的输出速度应该是多少?单张显卡最多可以支持多少个人
同
时聊天?来自贾扬清最新的讨论~
的博客: https://www.datalearner.com/blog/1051696951947094 适合人类阅读的大模型输出速度 单张显卡可以支撑的
同
时聊天人数
大模型
国内厂商语
音
识别与Whisper评测:现状与概况对比
同
时,Whisper(飞思卡尔语
音
识别技术)作为一项国际上也备受关注的语
音
识别技术,在语
音
识别领域也有着广泛的应用。
语音识别
Faster-Whisper
<
...
7
8
9
10
11
12
13
14
15
16
...
>
1
2
4
5
6
7
8
9
100
Ai助理
Hello 👏🏻
我是 Ai助理,关于ai的问题你可以问我
北京天气怎么样啊
明天北京的天气预报还没更新,请您稍等一下,我帮您查一下。明天北京的天气预报还没更新,请您稍等一下,我帮您查一下。
表头
表头
表头
表头
表头
表头
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
试着问问
How can I get access to post?How can I get
How can I get access to post?How can I get