首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· AI绘画Stable-Diffusion风格化实战
· 国内法律类大模型介绍
· 17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
· RAG检索增强技术在知识库智能检索场景下的应用实践
· 测评了8个国产AI大模型,差点崩溃……
· 从零开始用LangChain、Pinecone和LLMs搭建你自己的文档问答系统
· AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动态提示词)
· 图解大模型训练之:张量模型并行(TP),Megatron-LM
· 深度对比丨探索LLM(大模型)部署服务的七大框架差异
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
大模型外挂知识库优化技巧-如何更有效的利用召回的文档
作者实验挑选的模型都是能支持比较长的文本的,大部分人使用的chatglm和
llama
估计能提取10个文档片段信息就不错了。。。
大模型
大模型
苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源
使用与
LLama
相同的分词器。
OpenELM
大模型
Transformer
Transformer速查宝典:模型、架构、训练方法的论文都在这里了
19.
LLaMa
· 属性:65B 参数 · 论文地址:https://arxiv.org/pdf/2302.13971.pdf · 发布详情:Meta
Transformer
清华
震撼科技界:清华大学与智谱AI联手,引领中文长文智能写作新纪元!
无论是开源模型如GLM-4-9B-Chat、
Llama
系列,还是商业模型如GPT-4、Claude 3.5 Sonnet,当文本生成需求超过2000字时,模型的表现都趋于平稳,难以突破这一界限。
写作
长文本
RAG
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
llama
-index提供了两种形式的抽象:作为独立的检索模块(ListIndexLLMRetriever)或重排模块(LLMRerank)。
大模型
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
Novita AI:以最低价格接入
Llama
、Mistral等领先的开源模型。
AI开源
集合
活久见,世界上第一个被人类骗走钱的AI,刚刚出现了!
首先,大多数Scaling Law(如Kaplan等人、Chinchilla和
Llama
的研究)预测的,是模型在数据集中预测下一个词的能力,而不是模型在现实世界任务中的表现。
Freysa
智能体
大模型
大模型高效微调:🤗 PEFT 使用案例
#9989; ✅ ✅
LLaMA
大模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
我们使用
Llama
风格的Transformer作为模型的主干,结合门控线性单元(GLU)和GELU激活函数、旋转位置编码等,但将因果注意力替换为双向注意力。
MaskGCT
声音克隆
LLM
个人从零预训练1B LLM心路历程
不过即使我在预训练里加了这部分数据,效果也是大概率比不过在qwen、
llama
这种大机构发布的模型基础上进行微调的。
LLM
训练
李彦宏偏爱小模型|AI光年
国外有
Llama
,Mistral等有影响力的开源模型,国内也有智源、百川、阿里的通义等开源大模型。
李彦宏
小模型
大模型
领域大模型-训练Trick&落地思考
而以目前各厂(ChatGLM、BaiChuan、Qwen、
Llama
)抢占开源社区占比的架势,感觉会有很多7B、13B级别模型开源。
垂直
训练
大模型
大模型
链接大模型与外部知识,智源开源最强语义向量模型BGE
等厂商均推出了针对大模型的语义向量模型及API服务,直接促进了全球大模型开发者社区诞生了众多有影响力的大模型应用框架及工具:诸如大模型应用框架 LangChain、向量存储数据库Pinecone、文档格式化索引工具
Llama
embedding
语义向量
大模型
投资人逃离大模型
Meta:美国知名互联网公司,创建者为扎克伯格,旗下AI产品为
LLaMA
系列,特别适用于学术研究和开发者社区。
大模型
人工智能
人工智能的应用范式呼之欲出
目前已经看到的行业实践包括:通过在Alpaca-LoRA中加入中文语料的训练获得中文能力、通过ChatGLM和中美金融数据LoRA构建的FinGPT、基于中文医疗数据LoRA和Ziya-
LLaMa
-13B
大模型
<
...
3
4
5
6
7
8
9
10
11
12
>
1
2
4
5
6
7
8
9
100