首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国内外开源大语言模型一览表
· 盘点数据安全合规方向的热门证书【快来了解一下】
· 一文汇总市面上所有prompts提示词框架
· 硬核解读Stable Diffusion(系列一)
· 火山写作:一款助力写作能力提升的AI助手
· 掌握这10个AI 工具用1小时完成别人1周的工作
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· MCP服务介绍及应用场景报告-来自Manus
· whisper-live:OpenAI Whisper模型的近实时实现
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
从声纹模型到
语
音合成:音频处理 AI 技术前沿 | 开源专题 No.45
;7.2k License: Apache-2.0 ESPnet 是一个端到端的
语
音处理工具包,涵盖了端到端
语
音
识
别
、文本转
语
音、
语
音翻译、
语
音增强、说话人分离等功能
AudioCraft
音频
大模型
百川智能正式发布130亿参数通用大
语
言模型百川大模型(Baichuan-13B-Base)
同时开源预训练和对齐模型:预训练模型是适用开发
者
的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。
大模型
中文
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多
语
言检索效果超过微软跟openai
具体情况如下图,这三种不同来源的数据相互补充,分
别
作用于模型不同阶段的训练,三个源头的数据量逐渐递减,但是数据数量逐渐提升。
BGE
M3-Embedding
多语音检索
Stable Diffusion
[Stable Diffusion]Segment Anything实现商业换装
Segment Anything是一种基于深度学习算法的图像分割工具,它可以将图像当中的每一个像素分配到对应的区域当中,能够实现精准的边缘
识
别
。
Segment Anything
文生图
OmniVision - 968M:小巧精悍的视觉
语
言模型,释放多模态边缘计算强大潜能
基础
语
言模型Qwen 2.5 - 0.5b - instruct负责处理文本输入,它具备丰富的
语
义理解能力,能够对输入的文本进行深入分析。
OmniVision
-
968M
多模态模型
Python
Python程序混淆和打包exe文件流程和方法
Python作为解释型
语
言,在部署发行之前,最好将代码进行加密,以免被
别
有用心的人轻易使用或篡改。
Python
程序
大模型
从零开始学习大模型-第二章-大模型学习路线
随着技术的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然
语
言到创造逼真的图像及视频。
大模型
学习
RAG
RAG——使用检索增强生成构建特定行业的大型
语
言模型
我辈人工智能从业
者
,在探索AI应用的同时,也在不断地下钻技术本质。
大模型
微调
LLM微调神器Lamini,疯狂获星1.9k,免费可用!!
LLM(大规模
语
言模型)的微调不再困难!!
大模型
大模型
一个万能提问公式,让大模型生成高质量回答
在讲万能提问公式前,我们需要先了解什么是 Prompt:首先,ChatGPT 从本质上讲是一个
语
言大模型。
提示词
工具
AIGC工具提示词技巧
比如写一篇命题作文,或
者
回答一个政治题,用什么样的框架、什么样的方向、什么样的开场,内容如何填充,用怎样的结构性
语
言?
AIGC
提示词
Stable Diffusion
Stable Diffusion基础:ControlNet之细节替换
作为 ControlNet,它会对参考图进行分块,并
识
别
出区块内的对象。
StableDiffusion
文生图
企业
【上篇】深度解析AI大
语
言模型(LLM)在企业应用的关键技术与典型架构
大
语
言模型在企业应用的一些典型落地场景如: o 构建以自然
语
言为交互界面的应用,结合成熟的
语
音/图像
识
别
、
语
音合成等技术,在市场营销、客户服务等领域提升客户体验。
大语言模型
大模型
中文版开源Llama 2同时有了
语
言、多模态大模型,完全可商用
Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体,相比上一代的训练数据增加了 40%,在包括推理、编码、精通性和知
识
测试等许多外部基准测试中展示出了优越的表现,且支持多个
语
种
开源模型
开源
GPT-4o实时
语
音方案提供商Livekit开源voice agent:轻松处理音视频流
项目简介 代理框架设计用于构建在服务器上运行的实时、可编程参与
者
。
voice
agent
开源
音视频
<
...
11
12
13
14
15
16
17
18
19
20
...
>
1
2
4
5
6
7
8
9
100