文章列表-AI魔法学院

创作魔法绘画魔法视频魔法训练魔法 Ai术语

AI魔法学院客服

最新排序收藏

全部

七天内一个月内

选择分类

全部写作魔法绘画魔法视频魔法训练魔法其他 AI工具 VIP视频

推荐阅读换一批

· MCP服务介绍及应用场景报告-来自Manus

· 本地部署Manus+DeepSeek保姆级教程！

· 13个神级Chatgpt指令，助你小说丝滑过审

· Midjourney AI绘画美女提示词分享三

· 结构化Prompt必备基础：5分钟学会Markdown语法，实现提示词创作自由！

· prompt必须知道的26条军规

· 「长文」可能是目前最全的LangChain AI资源库之一

· “大模型+机器人”的现状和未来，重磅综述报告来了！

· MidjourneyV6高级提示词技巧（人物篇）

热门标签

Stable Diffusion stable diffusion Midjourney midjourney ComfyUI comfyui ChatGPT chatgpt 大模型数字人开源人工智能 Sora 文心一言天工零一万物知海图星火文心一格混元通义千问盘古言犀 ChatGLM Github 微软

热门标签

免费教程插件免费教程插件免费教程插件

文章列表

精通百种语言的翻译AI来了！Meta推出，免费、开源！

它是基于Meta公司之前开发的两个模型：M2M-100和Universal Speech Translator。

大语言模型

20个ChatGPT超实用的提示词（Prompt）

附加说明：演讲应在 15 分钟以内” 英文版："Topic: How to write persuasively Audience: Business executives Format: Speech

prompt 提示词

开源免费离线语音识别神器whisper如何安装

Whisper系统所提供的自动语音辨识（Automatic Speech Recognition，ASR）模型是被训练来运行语音辨识与翻译任务的，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文

wisper 翻译免费

AI声音克隆 | 最全最简教程（权威版）

TTS 的英文全名是 Text To Speech,中文译名是“文本转语音”。

声音克隆教程

ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略

word-segmentation 分词分词，将连续的自然语言文本，切分成具有语义合理性和完整性的词汇序列 part-of-speech

从声纹模型到语音合成：音频处理 AI 技术前沿 | 开源专题 No.45

· 支持多个 ASR (自动演讲识别) 配方 · 支持类似于 ASR 配方一样的 TTS (文本转声) · 支持 ST (Speech Translation

AudioCraft 音频

“实时”语音翻译！AI语音具有“情绪”！最强开源AI大模型来了

seamless_communication 论文地址： https://ai.meta.com/research/publications/seamless-multilingual-expressive-and-streaming-speech-translation

大模型开源模型语音

两天star量破千：OpenAI的Whisper被蒸馏后，语音识别数倍加速

Whisper 是 OpenAI 研发并开源的一个自动语音识别（ASR，Automatic Speech Recognition）模型，他们通过从网络上收集了 68 万小时的多语言（

Meta无限长文本大模型来了：参数仅7B，已开源

中小型基准的其他实验结果，包括 LRA、ImageNet、Speech Commands、WikiText-103 和 PG19 证明了 MEGALODON 在体量和多模态上的能力。

Meta 长文本大模型

46.6k星星！最强开源AI集合系统，一键部署全网AI工具都能直接用，UI简直是视觉盛宴！

LobeChat精心挑选了一系列高质量的语音选项（如OpenAI Audio、Microsoft Edge Speech），满足来自不同地区和文化背景的用户需求。

OCR的终极解法——传统算法VS多模态大模型

词性标注（Part-of-Speech tagging）：为每个单词指定词性，如名词、动词等。

OCR 大模型文字识别

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

transcriber = pipeline( "automatic-speech-recognition

Whisper 语音优化

【提前体验GPT-5】吴恩达AI智能体工作流详细解读

descriptive text using an image-to-text model, and then transform the text into voice using a text-to-speech

GPT-5 智能体

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

2304.03277 [12] Microsoft Azure 语音合成 API： https://azure.microsoft.com/en-us/products/ai-services/ai-speech

18种 DALL-E 3 炫酷的文字效果和提示词

The text '[text]' inside a (speech/thought) bubble is prominent and aligns with the image's style.

DALL-E 3 提示词文生图

1 2 4 5 6 7 8 9 100

skillup 汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1

Ai助理

Hello 👏🏻

我是 Ai助理，关于ai的问题你可以问我

北京天气怎么样啊

明天北京的天气预报还没更新，请您稍等一下，我帮您查一下。明天北京的天气预报还没更新，请您稍等一下，我帮您查一下。

表头	表头	表头	表头	表头	表头
内容	内容	内容	内容	内容	内容
内容	内容	内容	内容	内容	内容
内容	内容	内容	内容	内容	内容

试着问问

How can I get access to post?How can I get

How can I get access to post?How can I get