首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用这个工具后,我将 RAG 的准确性和召回率都提高了两倍!
· 硬核解读Stable Diffusion(系列三)
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 一文汇总市面上所有prompts提示词框架!
· Ollama的本地化又一图形工具ChatOllama,让你轻松玩转ollama,ChatGPT
· 有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
· 盘点字节跳动最新的AI应用
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 一条价值2W的Prompt,帮你生成提示词的超级提示词
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
此外,我们还将
语
音
识
别
与基于字级
时
间戳预测(SRWT)的任务结合起来进行训练,这在以前的多任务学习研究中通常被忽视。
大模型
语音
工具
掌握这10个AI 工具用1小
时
完成
别
人1周的工作
掌握这10个AI 工具,你用一小
时
就能完成99%的人一周还多的工作量!
AI
工具
大模型
大模型应用
实
践:用LLaMA 2.0, FAISS and LangChain
实
现基于自由知
识
问答
在过去的几周里,我一直在试用几个大型
语
言模型(LLMs)并使用互联网上的各种方法探索它们的潜力,但现在是
时
候分享我到目前为止所学到的东西了!
开源模型
开源
从声纹模型到
语
音
合成:
音
频处理 AI 技术前沿 | 开源专题 No.45
· 可以
实
现高效率、低延迟的
实
时
语
音
变化; · 跨平台兼容性强,适用于 Windows、Mac(M1)、Linux 等系统; espnet/espnet[3] Stars: 
AudioCraft
音频
大模型
会“追问”的Agent,大模型知
识
库另类
实
践
在
实
际的生产环境中,此类知
识
库应用可能遇到两类问题:知
识
型和政策型(图1)。
大模型
开源
OCR是什么以及推荐几款开源中文OCR
识
别
软件
后期处理:根据特定的
语
言上下文的关系,对
识
别
结果进行校正。
OCR
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何
实
现
语
音
驱动唇部运动的!
wav2lip
语音
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
OCR
Windrecorder:连续记录屏幕内容,通过OCR技术
识
别
记录内容
它的所有能力(录制、
识
别
处理、存储回溯等)完全运行在本地,无需联网,不上传任何数据,只做应该做的事。
Windrecorder
录屏
开源
【开源项目】Flow Matching
语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
工具
4K star!录屏好帮手,超酷的
实
时
按键显示工具
今天我就帮你找到了一个好用的工具,它开源免费效果还超酷,帮你完成
实
时
可视化键盘按键的效果,它就是:Keyviz。
Keyviz
录频
Meta
各个
语
种互相翻译:Meta推出NLLB-200 AI模型,可
实
现200种
语
言互译
同
时
,这也是他们元宇宙计划的一部分。
翻译
大模型
开源
有道开源的国产
语
音
库EmotiVoice爆火了!具有情绪控制功能的
语
音
合成引擎!
但是近期,网易有道AI算法团队也开源了一款国产TTS
语
音
合成引擎EmotiVoice,刚上线仅一周
时
间就暴涨4200颗星,问鼎当周GitHub trending流行榜第一。
EmotiVoice
语音库
大模型
测评了8个国产AI大模型,差点崩溃……
从自然
语
言处理到
语
音
识
别
,从情感分析到知
识
问答,大模型的应用已经渗透到我们生活的方方面面。
大模型
测评
开源
Llama 3突然来袭!开源社区再次沸腾:GPT-4级
别
模型可以自由访问的
时
代到来
AI写作助手创企HyperWriteAI的CEO见此已忍不住感慨: 我们正在步入一个新世界,一个GPT-4级
别
的模型开源并且可以自由访问的世界。
meta
llama3
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100