文章列表-AI魔法学院

文章列表

数字人：从科幻走向现实的技术革命

创建数字人需要多方面的技术支持，包括计算机图形学、动作捕捉、语音合成以及人工智能算法等。

数字人语音

清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench：GPT-4是全能战士，超越所有模型

PART 01 未来大模型的发展方向：AI Agent 大语言模型（Large Language Models, LLM)最核心的能力是对语言的处理，具备良好的意图识别和文本生成能力让 LLM

GPT-4

神奇的 OuteTTS - 0.1 - 350M：用几秒钟音频克隆声音的黑科技！

在当今数字化时代，文本转语音（TTS）技术的应用愈发广泛，从智能语音助手到有声读物，从无障碍服务到教育娱乐领域，都离不开高质量的语音合成。

OuteTTS-0.1-350M 音频

SadTalker数字人常见问题3

SadTalker数字人制作工具，用自带的图片音频可以生成，而用自己的图片、音频生成视频就不行。

SadTalke

【AI绘图工具】太爆炸了，AI出图速度100fps（每秒100张图片），比LCM、SDXL Turbo更快，目前No.1

https://colab.research.google.com/github/hewis123/stream-d/blob/main/Untitled2.ipynb 今天我就来介绍一下这个产品工具吧

StreamDiffusion 文生图

OpenAI开源大模型调测工具Transformer Debugger：可以在训练大模型之前理解模型的运行情况并干预

但就在刚才，OpenAI开源了一个全新的大模型调测工具：Transformer Debugger。

大模型调试工具

京东开源普通话数字人JoyHallo，一口流利标准普通话还会讲英语

在音频驱动的视频生成领域，制作普通话视频面临着许多挑战。

JoyHallo 数字人开源模型

6个最佳开源TTS引擎

随着人工智能的普及以及数字设备应用的增加，相关系统对语音识别以及文语转换技术日益依赖，TTS正在变得越来越重要。

TTS引擎开源模型

【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声！！

ChatTTS是专门为对话场景设计的文本转语音模型，例如LLM助手对话任务。

chattts tts 文生语音

用了一个月，终于找到点写 AI Agent 的思路

不断尝试落地 AI 应用端不断尝试落地 AI 应用端基于对运维的认知，我开发了一个开源的运维工具 https://github.com/shaowenchen/ops 。

AI Agent Ops 运维工具

DeepMusic发布“和弦派”2.0：重塑AI音乐创作范式，赋予创作者全方位掌控

4月29日，国内领先的人工智能音乐服务商DeepMusic，发布了自主研发的AI音乐工作站——“和弦派”2.0正式版。

和弦派 DeepMusic 音乐创作

46.6k星星！最强开源AI集合系统，一键部署全网AI工具都能直接用，UI简直是视觉盛宴！

它开源的工具，UI一样很酷，当然，功能也真的很强，46.6k的星星绝不是虚名。

AI开源集合

AI声音克隆 | 最全最简教程（权威版）

TTS 的英文全名是 Text To Speech,中文译名是“文本转语音”。

声音克隆教程

万字长文，大语言模型如何宣告心理学的死亡？

但随着人工智能技术的飞速发展，特别是大语言模型（LLM）的兴起，我们似乎站在了一个新的十字路口。

大语音模型

鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞 | 可免费体验

前脚字节阿里的工具火了，现在腾讯这个新照片生成应用PhotoMaker直接刷屏，瞧这阵仗…… 只需上传一张或以上照片，无需额外LoRA训练，就能快速可定制。

PhotoMaker 图生图

<...4 5 6 789 10 11 12 13 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1