首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
· OCR的终极解法——传统算法VS多模态大模型
· AI拟声: 5秒内克隆您的声音
· 盘点字节跳动最新的AI应用
· 无显卡+纯本地跑Qwen1.5版模型!0基础闭眼部署指南!适用绝大部分开源模型!llama2+Mistral+Zephyr通杀!
· 国产视频制作之光-可灵:提示词大全整理
· 大模型量化:什么是模型量化,如何进行模型量化
· 【工具书】文生图常用的正向反向提示词以及常用词中英文对照表
· 玩一玩阿里通义千问开源版,Win11 RTX3060本地安装记录!
· AI高手都在用的10个提示词prompt网站,建议收藏!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
百川智能正
式
发布130亿参数通用大
语
言模型百川大模型(Baichuan-13B-Base)
就在刚刚,王小川的开源大模型又有了新动作—— 百川智能,正
式
发布130亿参数通用大
语
言模型(Baichuan-13B-Base)。
大模型
中文
微调
大
语
言模型综述<演进,技术路线,区别,微调,
实
践,潜在问题与讨论>
然而激活函数由于在训练和测试
时
使用方
式
完全相同,所以是需要有确定性的输出,不能直接对输
入
x乘随机变量m,这点与Dropout不同(Dropout在测试
时
并不随机置0)。
大模型
RAG
LLMOps框架Dify发布Workflow功能,RAG进
入
自由编排
时
代(附产品负责人分享PPT )
通过编排可以将开放域,复杂多步问题,分解为多个子问题分开解决,能用模型用模型,不能用模型的用流程,甚至采用“Human in Loop”的方
式
,将整个工作流程白盒化,把大模型能力限制在封闭的问题内,让大模型更可控
RAG
自由编排
Workflow
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
Translatotron 3结合了三种技术:掩码自编码器、无监督的
嵌
入
映射、和反向翻译,来
实
现这个目标。
Translatotron
语音识别
GGUF格
式
详解
在大模型领域,GGUF是一个非常常见的词
语
,也是非常常见的大模型预训练结果命名方
式
。
GGUF
大模型
Prompt
结构化Prompt必备基础:5分钟学会Markdown
语
法,
实
现提示词创作自由!
因为他像AI
时
代的编程
语
言一样,可以让提示词的开发象代码一样有规范,不但方便团队的沟通和协作,也方便对于后期的维护升级。
Prompt
提示词
Markdown
教程
AI声
音
克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为
语
音
的技术,通过TTS技术,计算机可以将文字信息转换成人类可听懂的
语
音
输出,
实
现
语
音
合成的功能 目前市场上的AI声
音
我们最多用的还是普通的
声音克隆
教程
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端
语
音
交互大模型
例如,在处理
语
音
输
入
时
,模型首先将
语
音
信号转换为离散的符号序列,然后与文本的离散表示进行融合和交互。
Westlake
-
Omni
语音
TypeChat
入
门指南
传统模
式
下,创建自然
语
言模型界面是一项复杂的任务,通常依赖复杂的决策树来确定意图并收集行动所需的输
入
。
TypeChat
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
通过约70万小
时
的多
语
种数据训练,
实
现了接近人类水平的
语
音
合成效果,目前已更新到1.4版本。
Fish
Speech
本地搭建
开源
F5-TTS:上海交大开源超逼真声
音
克隆TTS,告别ElevenLabs,以后就用它了!
实
测真的很牛
不需要复杂的设计如持续
时
间模型、文本编码器和
音
素对齐,能够快速训练并
实
现
实
时
因素(RTF)0.15的推理速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
ChatGPT
使用ChatGPT6小
时
写出高分论文
请推荐几种在[特定领域]深
入
研究的方法与建议。
ChatGPT
写作
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
我们还做了一个
语
音
项目,就是将上市公司的财报电话会议
实
时
转录成文字。
suno
音乐
教程
SD
入
门教程三:采样器及参数调整
采样方
式
就是指sd用什么算法进行图片生成,影响出图质量以及出图速度。
SD
入门教程
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100