首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Stable Diffusion|提示词高阶用法(二)双人同图
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· Suno音乐新手指南(手把手完整版教程)
· 必看!阿里通义千问完整技术报告
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
· MCP服务介绍及应用场景报告-来自Manus
· 理解 o3 及其技术分析
· 腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
让ChatGPT帮我写SQL
推荐一个Github上Start超过3.4K,可将自然
语
言
转化为SQL
语
句的开源项目。
SQL
教程
郭德纲讲英
语
相声详细教程
选择你希望进行翻译的
语
言
Heygen目前支持18种输入
语
言
和15种输出
语
言
。
数字人
音视频
语
音克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音生成技术,不仅能可能声音,还能通过对声音的描述来生成独特的音色,同时还能通过描述来生成各种各样的音效,甚至能通过文字描述来编辑声音,整体来说,这项技术几乎囊括了现在人们对
语
音生成技术的所有的需求
Meta
语音生成
阿里
[论文] 阿里提出AgentScope:灵活强大的智能体框架
大型
语
言
模型(LLMs)的快速发展是的多智能体(Multi-Agent)应用取得了显著进展。
AgentScope
语言大模型
智能体
阿里
阿里RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
大型
语
言
模型(LLMs)在生成文本时可能会产生错误信息,即“幻觉”问题。
RAG
检索
大型语言模型
开源
语
音、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音识别模型,它是一种通用的
语
音识别模型,可以用于
语
音识别、
语
音翻译和
语
言
识别等任务。
人工智能
大模型
wisper
开源
【开源项目】Flow Matching
语
音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
Insanely Fast Whisper:超快的Whisper
语
音识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音转录模型的超快速能力。
音频
Whisper
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音识别技术
这款最新的自动
语
音识别模型不仅在多
语
言
识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
ChatGPT
Prompt全攻略(一):ChatGPT时代,什么是Prompt?
简单来说,它是一个可以与用户用自然
语
言
进行交流的AI系统。
prompt
开源
网易(TTS)EmotiVoice:开源
语
音合成,支持2000多音色
你是否曾经想过,如果你能用不同的情感和
语
气来表达你的想法,那该多有趣?
EmotiVoice
语音合成
关于AI声音生成的一切(
语
音+音乐+嘴型)
; 文字转声音+声音克隆 •clone-voice(解压就能用):这是一个基于Web界面的声音克隆工具,可以将文字或声音转换为特定音色的音频,支持多种
语
言
声音
RAG
高级 RAG 技术——图解概览
(大
语
言
模型)生成的回答提供依据。
RAG
检索
图解
心理
Asimov的预
言
与《Reflexion》的Prompt启示:机器人心理学家的新纪元
大型
语
言
模型(LLMs)越来越多地被用于与外部环境(如游戏、编译器、APIs)互动作为目标驱动的代理。
大模型
开源
有道开源的国产
语
音库EmotiVoice爆火了!具有情绪控制功能的
语
音合成引擎!
接下面让我们看看这款国产
语
音库为何如何迅速的火遍大江南北的🔥!
EmotiVoice
语音库
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100