首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 本地部署Manus+DeepSeek保姆级教程!
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· GPU 性能(数据表)快速参考
· 盘点数据安全合规方向的热门证书【快来了解一下】
· YOO简历
· 五大AI工具自动生成PPT效果对比
· 实测:本地跑llama3:70B需要什么配置
· 划重点!全网最全AI数字人工具合集!
· 阿里Outfit Anyone实现真人百变换装
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
人工智能
目前有哪些比较成功的人工智能应用?
语
音
:
音
乐,录
音
等等
音
频格式的文件。
生成式AI
我去华强北走了一圈,发现这里正被另一种 AI 包围
这款产品和传统形态的翻译机不同,是一个磁吸金属小圆片,贴在手机后做
声
音
录入,颇有科技感,连接手机蓝牙后,能够翻译手机内的一切文字和语
音
,包括微信实时对话。
华强北
AI
这个方法可以让AI写出的文章完全去掉GPT味儿!
捕捉灵感:当灵感来袭时,立即用手机文字或者语
音
输入功能记录下来,不受限制地自由发挥。
ChatGPT
写作
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
语
音
到文本多模态开源对话模型 (LLaSM) LinkSoul.AI 开源了可商用的中英文双语语
音
- 语言助手 LLaSM 以及中英文语
音
SFT 数据集 LLaSM-Audio-Instructions
开源模型
LLM
最详细的文本分块(Chunking)方法——可以直接影响基于LLM应用效果
这个真正难题我在前面的文章中《一些LLM的
声
音
总结》中提到过,基于大模型的企业应用中很大一部分需求就是RAG——检索增强生成。
RAG
大模型
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
对于这些唱衰的
声
音
,一位 IDswyx 的用户为在 X 上发表言论称:“对于今年向向量数据库投资 2.35 亿美元的公司来说,他们要的不是基础模型实验室 Sherlocking 和增加上下文长度这些基础功能
检索增强生成
大语音模型
鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此
基于Gemini 1.5,其最新
音
频摘要功能,可以让用户根据特定主题生成类似播客的
音
频对话。
ima
copilot
搜索
数据库
颠覆数据存储方式:向量数据库的威力
向量数据库通过计算向量之间的相似度来搜索数据,因此它特别适用于人脸识别、语
音
识别、推荐系统等需要高维度数据处理的领域。
编程
数据库
写作
GPT让你拥有超强的写作能力!
密切注意保持作者原始的
声
音
和意图,同时进行必要的调整以增强清晰度和流畅性 4、为特定受众定制语言 prompt: 作为一名校对专家,你的任务是调整给定的[文本],使之与特定的[目标受众]产生共鸣。
GPT
写作
大模型
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
元象大模型去年起已和多个腾讯产品,包括QQ
音
乐、虎牙直播、全民K歌、腾讯云等,进行深度合作与应用探索,为文化、娱乐、旅游、金融领域打造创新领先的用户体验。
XVERSE-V
多模态大模型
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
这也意味着用户无法自行上传
音
频内容,只能通过官方创建好的模板来上传图片,生成固定
音
频内容的视频。
EMO
阿里
全民演唱
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
文章还深入讨论了为实现 Sora 的广泛应用需
克
服的主要挑战,例如保证视频生成的安全性和公正性。
Sora
微软
OpenAI
AI Agents大爆发:软件2.0雏形初现,OpenAI的下一步
In-context Reinforcement Learning with Algorithm Distillation 这篇论文认为,任何一种生成学习历史的算法都可以通过对动作执行行为的
克
隆
agent
开源
构建开源多模态RAG系统
亲爱的冒险家,请考虑一下:当你听到某人的
声
音
时,你能认出这个人,而当你看到他们时,你也知道他们是谁。
RAG
大模型
没有思考过 Embedding,不足以谈 AI
有一条是显然可以给出的: 性质一:每一个词具有唯一量化值,不同词需要具有不同的量化值 背后的逻辑不言自明:一词多数,或是多词一数,都会增加计算机理解语言的难度,这种难度就如同多
音
字或是多义词给人类造成的困难
开源模型
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100