首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第一性原理以及第一性原理是怎么帮马斯克成为首富的
· 爆火的“哄哄模拟器”,它是如何炼成的?Prompt泄漏了
· AI声音克隆 | 最全最简教程(权威版)
· ComfyUI官方使用手册【官网直译+关键补充】
· Coze多智能体(Multi-Agents)模式体验!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Stable Diffusion 30分钟打造AI 写真照片生成器|海马体照相馆这次真的要木得了
· 从第一性原理看大模型Agent技术
· 精通百种语言的翻译AI来了!Meta推出,免费、开源!
· 6个最佳开源TTS引擎
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
开源大模型部署及推理所需显卡成本必读:也看大模型参数与显卡大小的大致映射策略
meta-llama/Llama-2-13b-hf meta-llama/Llama-2-70b-hf 输入:仅输入文本 输出:仅生成文本 模型架构:Llama 2 是一种使用优化的
Transformer
开源模型
开源
最新最全的开源中文大语言模型列表
它采用
Transformer
自回归架构(auto-regressive),在超万亿(trillion)高质量语料上进行预训练,拥有强大的基础能力。
大模型
SQL
RLHF 在 Text2SQL 领域中的探索
· 之前听一个大学教授的讲座,有个观点很有意思:Open AI 做大模型为什么比谷歌强,因为包括
transformer
在内的一些创新模型大多是谷歌研究的,那为什么 Open
Text2SQL
RLHF
大模型
基于大模型(LLM)的Agent 应用开发
Transformers Agent:Transformers Agent 是一个建立在
Transformer
存储库上的实验性自然语言API。
大模型
Agent
一个充满多智能体的数字社会正在浮现,商业的底层逻辑已进入重构倒计时
关键词:GPT-in-the-loop,LLM-in-the-loop,多智能体系统(MAS),自适应,Generative pre-trained
transformer
(GPT)。
大模型
一文带你认识ELMo
缺点 使用LSTM提取特征,而LSTM提取特征的能力弱于
Transformer
使用向量拼接方式融合上下文特征,这种方式获取的上下文信息效果不如想象中好 训练时间长,这也是RNN的本质导致的
embedding
大模型
大模型压缩首篇综述来啦~
ZeroQuant [Yao等,2022]将硬件友好的量化方案、逐层知识蒸馏和优化的量化支持整合在一起,将
Transformer
-based模型的权重和激活精度减少到最小的INT8,并且对准确性几乎没有影响
大模型
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
BERT的模型结构基于
Transformer
,它由多个编码器层组成。
Bert-vits
语音
Agent
AI领域的agent是什么意思?
它是短暂且有限的,因为它受到
Transformer
的上下文窗口长度的限制。
大模型
揭秘DeepSeek:一个更极致的中国技术理想主义故事
「暗涌」:
transformer
诞生在谷歌的AI Lab,ChatGPT诞生在OpenAI,你觉得大公司的AILab 和一个创业公司对于创新产生的价值有什么不同?
DeepSeek
大模型
OpenAI
马斯克怒告OpenAI案解密:Ilya看到了什么?125万亿参数Q*细节曝光,53页PDF全网疯转
当今AI领域大多数主要技术都源20世纪50年代的基础研究,并结合了一些工程解决方案,如「反向传播算法」 和「
Transformer
模型」。
OpenAI
大模型
ChatGPT
2万字大模型调研:横向对比文心一言、百川、Minimax、通义千问、讯飞星火、ChatGPT
随着数据的不断积累和计算能力的提升,深度学习模型逐渐从传统的神经网络演变为更复杂的结构,如卷积神经网络(CNN)、循环神经网络(RNN)和
Transformer
等。
大模型
调研
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的人物说话头像视频
然后,将音频特征A和嵌入个人风格的z风格添加并馈送到基于多分支
Transformer
的体系结构中,其中两个分支生成混合形状,在粗粒度上建模面部表情运动,第三个分支生成唇部相关的顶点偏移,在细粒度上补充唇部运动
VividTalk
视频
OpenAI
被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
还有一些关键问题,比如当大模型在某个任务上已经超越人类,是否有办法能让它继续提升,即 OpenAI 提的 Super Alignment;也包括长文本
Transformer
是否仍是下一代的架构等问题
Grok-1
开源模型
「长文」可能是目前最全的LangChain AI资源库之一
#8226;LlamaIndex[204]:提供将LLM(语言模型)与外部数据连接的中心接口•Botpress[205]:构建聊天机器人的基本模块•Haystack[206]: 使用
Transformer
工作
<
...
4
5
6
7
8
9
10
11
12
13
>
1
2
4
5
6
7
8
9
100