首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
测评了8个国产AI大模型,差点崩溃……
从自然
语
言处理到
语
音
识
别
,从情感分析到知
识
问答,大模型的应用已经渗透到我们生活的方方面面。
大模型
测评
知
识
树:一个方法,教你构建「终身知
识
体系」
后来大一创业,因为创业需要大量的知
识
储备,我开始疯狂式的学习,看各种认知、商业类书籍,看各种类似混沌大学的课程,听各种类似得到、樊登读书会等
音
频。
大模型
SEO知
识
点入门
先把一些基础的理论东西弄清楚:什么是SEO、标题、关键词、描述、长尾关键词、内链、外链、反链、百度指数、权重、ALT标签、收录、站长工具、等等等一大堆,你会看到很多你看不懂的词和专业术
语
,看到不理解的词
大模型
达摩院SPACE对话大模型:知
识
注入与知
识
利用
对话是对
语
言的高级应用,主要有以下几个特点: ①口
语
化,表述随意,不一定符合
语
法、句子不完整、噪
音
较多、有很多 ASR 错误。
大模型
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端
语
音
交互大模型
在
语
音
情感理解中,注意力机制可以关注
语
音
信号中的情感特征,如
语
调、
语
速、重
音
等,从而准确地判断情感类
别
。
Westlake
-
Omni
语音
AIGC
《构建个人知
识
图谱》:让 AIGC 帮你自动构建知
识
图谱
当下大
语
言模型最重要能力就是是自然
语
言理解和生成。
提示词
文生图
AIGC
如何避免大
语
言模型绕过知
识
库乱答的情况?LlamaIndex 原理与应用简介
随着 LangChain + LLM 方案快速普及,知
识
问答类应用的开发变得容易,但是面对回答准确度要求较高的场景,则暴露出一些局限性,比如向量查询方式得到的内容不匹配,LLM 对意图
识
别
不准。
大语言模型
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
尽管这个项目专注于财经领域,但他们认
识
到
音
频AI在更广泛的
音
乐创作领域内的潜力。
suno
音乐
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本
识
别
、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是中英文的大段文字
OCR
手写
文字识别
大模型
OCR的终极解法——传统算法VS多模态大模型
命名实体
识
别
命名实体
识
别
(Named Entity Recognition, NER)是自然
语
言处理(Natural Language Processing, NLP)的一个分支,它的任务是
识
别
文本中具有特定意义的实体
OCR
大模型
文字识别
阿里
阿里出品自动化视频剪辑工具FunClip!
它依托于阿里巴巴通义实验室的FunASR Paraformer系列模型,实现了视频中
语
音
的自动
识
别
。
FunClip
视频
阿里
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
然后,它可以生成听起来自然的
语
音
,以多种
语
言模仿该
语
音
,同时为用户提供对情感、口
音
、节奏和
语
调等参数的精细控制。
OpenVoice
声音克隆
开源
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多方面的技术支持,包括计算机图形学、动作捕捉、
语
音
合成以及人工智能算法等。
数字人
语音
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化时代,文本转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI
语
音
克隆工具!
而 OpenVoice 作为一款强大的多
语
言即时
语
音
克隆AI工具,可以为用户提供高效、个性化的
语
音
克隆服务,是一款值得推荐的项目。
tts
文本转语音
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100