首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 本地部署Manus+DeepSeek保姆级教程!
· 13个神级Chatgpt指令,助你小说丝滑过审
· Midjourney AI绘画美女提示词分享三
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· prompt必须知道的26条军规
· 「长文」可能是目前最全的LangChain AI资源库之一
· “大模型+机器人”的现状和未来,重磅综述报告来了!
· MidjourneyV6高级提示词技巧(人物篇)
· GenColor.ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
精通百种语言的翻译AI来了!Meta推出,免费、开源!
它是基于Meta公司之前开发的两个模型:M2M-100和Universal
Speech
Translator。
大语言模型
ChatGPT
20个ChatGPT超实用的提示词(Prompt)
附加说明:演讲应在 15 分钟以内” 英文版:"Topic: How to write persuasively Audience: Business executives Format:
Speech
prompt
提示词
开源
开源免费离线语音识别神器whisper如何安装
Whisper系统所提供的自动语音辨识(Automatic
Speech
Recognition,ASR)模型是被训练来运行语音辨识与翻译任务的,它们能将各种语言的语音变成文本,也能将这些文本翻译成英文
wisper
翻译
免费
教程
AI声音克隆 | 最全最简教程(权威版)
TTS 的英文全名是 Text To
Speech
,中文译名是“文本转语音”。
声音克隆
教程
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
word-segmentation 分词 分词,将连续的自然语言文本,切分成具有语义合理性和完整性的词汇序列 part-of-
speech
开源
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
· 支持多个 ASR (自动演讲识别) 配方 · 支持类似于 ASR 配方一样的 TTS (文本转声) · 支持 ST (
Speech
Translation
AudioCraft
音频
大模型
“实时”语音翻译!AI语音具有“情绪”!最强开源AI大模型来了
seamless_communication 论文地址: https://ai.meta.com/research/publications/seamless-multilingual-expressive-and-streaming-
speech
-translation
大模型
开源模型
语音
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
Whisper 是 OpenAI 研发并开源的一个自动语音识别(ASR,Automatic
Speech
Recognition)模型,他们通过从网络上收集了 68 万小时的多语言(
语音
HeyGen
大模型
Meta无限长文本大模型来了:参数仅7B,已开源
中小型基准的其他实验结果,包括 LRA、ImageNet、
Speech
Commands、WikiText-103 和 PG19 证明了 MEGALODON 在体量和多模态上的能力。
Meta
长文本
大模型
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
LobeChat精心挑选了一系列高质量的语音选项(如OpenAI Audio、Microsoft Edge
Speech
),满足来自不同地区和文化背景的用户需求。
AI开源
集合
大模型
OCR的终极解法——传统算法VS多模态大模型
词性标注(Part-of-
Speech
tagging):为每个单词指定词性,如名词、动词等。
OCR
大模型
文字识别
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
transcriber = pipeline( "automatic-
speech
-recognition
Whisper
语音优化
【提前体验GPT-5】吴恩达AI智能体工作流详细解读
descriptive text using an image-to-text model, and then transform the text into voice using a text-to-
speech
GPT-5
智能体
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
2304.03277 [12] Microsoft Azure 语音合成 API: https://azure.microsoft.com/en-us/products/ai-services/ai-
speech
开源模型
提示词
18种 DALL-E 3 炫酷的文字效果和提示词
The text '[text]' inside a (
speech
/thought) bubble is prominent and aligns with the image's style.
DALL-E
3
提示词
文生图
<
1
2
>
1
2
4
5
6
7
8
9
100
Ai助理
Hello 👏🏻
我是 Ai助理,关于ai的问题你可以问我
北京天气怎么样啊
明天北京的天气预报还没更新,请您稍等一下,我帮您查一下。明天北京的天气预报还没更新,请您稍等一下,我帮您查一下。
表头
表头
表头
表头
表头
表头
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
内容
试着问问
How can I get access to post?How can I get
How can I get access to post?How can I get