首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内外开源大语言模型一览表
· AI必备Prompt技巧《提问的艺术——让AI导出高质量答案》
· 硬核解读Stable Diffusion(系列一)
· 掌握这10个AI 工具用1小时完成别人1周的工作
· 7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
· 如何下载及使用通义千问7B开源大模型
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 使用python调用comfyui-api,实现出图自由
· Stable Diffusion生成美女正向词和反向词示例
· 比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
LLM
Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
除了这些基础知识,我认为最有价值的部分在于,它总结了基于大型语
言
模型(LLM)的Agent的架构,使我们能够按照一定的标准范式去设计自己的Agent。
大模型
LLM
Agent
开源
几款开源的OCR识别项目,收藏备用
tesseract Tesseract,一款由HP实验室开发由Google维护的开源OCR引擎,开源,免费,支持多语
言
,多平台; https://github.com/tesseract-ocr
OCR
OpenAI
AI Agents大爆发:软件2.0雏形初现,OpenAI的下一步
将 PDDL 计划翻译回自然语
言
。
agent
懒人福音!用AI生成会议纪要,让你的工作更高效!
**多语
言
支持**:一些AI系统能够支持多种语
言
,这对于跨国公司或有多语
言
需求的会议来说非常有用。
会议纪要
AI工具
智谱AI静悄悄的上线了一大波新模型,过年了,真的
我挨个列一下: 大语
言
模型GLM-4-Plus。
智谱AI
大模型
开源
17K star!30秒偷走你的声音,开源声音克隆工具
然后,它可以生成听起来自然的语音,以多种语
言
模仿该语音,同时为用户提供对情感、口音、节奏和语调等参数的精细控制。
OpenVoice
声音克隆
开源
ChatGPT
ChatGPT:12个写作提示词帮你覆盖所有主流写作场景
输出语
言
:{输出语
言
}。
写作
创作
提示词
大模型
GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
一些有用的Notebook 与大型语
言
模型相关的笔记本和文章列表 工具: 1.
LLM
大模型
GitHub
开源
微软最新模型Phi-3 Mini开源登场!小模型,大未来!
Phi-3 Mini AI模型,在包括语
言
理解、逻辑推理、编程和数学在内的一系列基准测试中表现卓越,超越了大量参数高达数百亿的竞争模型。
Phi-3
Mini
开源模型
微软
大模型
投资人逃离大模型
通义千问具备强大的语
言
理解、生成和推理能力,支持多语
言
对话和图片文本识别,广泛应用于智能搜索引擎、问答系统和智能对话系统等领域,参数规模从18亿到720亿不等。
大模型
SQL
RLHF 在 Text2SQL 领域中的探索
01 定义 Text-to-SQL(简写为Text2SQL),顾名思义就是把文本转化为 SQL 语
言
,更学术一点的定义是:把数据库领域下的自然语
言
(Natural Language
Text2SQL
RLHF
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
通过优化的声学模型和语
言
模型,确保语音的自然度和准确性,使其在多种场景下都能提供高质量的语音输出。
Fish
Speech
本地搭建
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
对研究界而
言
,我们建议寻找成本效益高的视频压缩和表现形式的替代方案。
Sora
微软
大模型
和大模型相关的一些术语(持续更新中)
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语
言
识别、图像识别、自然语
言
处理和专家系统等。
大模型
人工智能
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
它采用纯语
言
建模方式,打破了传统 TTS 模型依赖复杂架构和外部适配器的模式,为语音合成领域带来了新的思路。
OuteTTS-0.1-350M
音频
<
...
21
22
23
24
25
26
27
28
29
30
...
>
1
2
4
5
6
7
8
9
100