文章列表-AI魔法学院

文章列表

比真人还像真人！字节跳动PersonaTalk的黑科技有多强大？

1 个性保留，真实感加倍 PersonaTalk不仅仅关注嘴型的同步，还特别强调保留人物原本的面部特征和说话风格，这让视频的逼真度更上一层楼。

PersonaTalk 视频

Finchat：一个基于AI人工智能的金融数据分析工具，让你有一个私人投资助理！

Finchat是一个基于人工智能的金融数据分析工具，它可以让你通过简单的聊天方式，获取750多个上市公司和100多个超级投资者的关键财务信息。

用户 finchat

通俗易懂地解释OpenAI Sora视频生成的特点有哪些？它与此前的Runway Gen2、Pika有什么区别？以及缺点是什么？

Sora生成的视频与此前其它平台生成的视频到底有哪些区别？

sora 视频生成

十篇高质量的AI-Agents相关论文，让AI教你认识AI-Agents

我的下一篇将围绕《LLM Powered Autonomous Agents》进行深度解读，并建立相关联的知识体系与在知识库，也将成为一个开源可索引的关于超级个体与AI-Agent的高质量知识库。

开源模型

Stable Diffusion

Stable Diffusion 和 Midjourney的优劣势比较，如何选择？

②部署相对麻烦：按照官方的指导的话，环境布置略微麻烦，需要从GitHub下载很多文件，且要求一定的python知识，但如使用国内技术大牛打包的整合包就会简单很多。

文生图

推荐智能体：利用大模型进行交互式推荐

另一方面,大型语言模型(LLM)代表了人工通用智能的重大进步,展示了在指令理解、常识推理和人机交互方面的卓越能力。

大语言模型推荐

使用知识图谱提高RAG的能力，减少大模型幻觉

该算法将根据参考客户向量的相似度分数来识别最近邻。

RAG 大语言模型

白话Embedding：普通人都能懂的科普文

我们可以拍摄任何一对图像，计算它们之间的距离或测量它们的余弦，但是苹果之间不太可能特别近或者离橘子特别远。

Embedding 向量

【开源看AI】4.2K star！Reor：AI自动帮你发现知识之间的连接

前几天介绍了Quivr，一款用AI帮助个人管理知识、构建第二大脑的人工智能应用。

Reor 开源工具知识管理

国内首个！最火的MoE大模型APP来了，免费下载，人人可玩

超级无门槛、人人免费玩的MoE大模型来了！

MoE大模型 APPa

大语言模型综述<演进，技术路线，区别，微调，实践，潜在问题与讨论>

这里的出发点实际是把传统人工设计模版中的真实token替换成可微的virtual token。

大模型

8个常用中文OCR数据集，附下载链接

室内的图像主要包括标识、门牌和标牌等，室外的图像主要是路牌和广告牌等。

OCR

清华、面壁智能发布：主动式Agent 2.0

· Agent2.0 主动发起任务，无需明确的人类指令。

Agent 2.0 大模型

StableDiffusion

如何免费打造自己的数字人主播：StableDiffusion插件SadTalker打造本地数字人主播

Sadtalker是一个能够根据图片和音频生成视频的开源项目，它使用了一种叫做SadNet的神经网络，可以实现风格化的单图说话人脸动画。

数字人

语音、视频转文字神器：开源whisper介绍

OpenAI的Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译和语言识别等任务。

人工智能大模型 wisper

<...5 6 7 8910 11 12 13 14 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1