首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 腾讯开源混元AI绘画大模型
· 语音、视频转文字神器:开源whisper介绍
· 10个值得收藏的ChatGPT辅助编程技巧
· 使用知识图谱提高RAG的能力,减少大模型幻觉
· 领域大模型LLM训练Trick
· Fooocus,webui,comfyui优缺点
· SD入门教程四:图生图基础用法
· Stable diffusion又一个电商换装/换模特辅助插件
· Prompt全攻略(一):ChatGPT时代,什么是Prompt?
· 绝了!新华社、知网官方出品的写作神器,不要太爽!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
训练魔法
开源
DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好
DeepSeek V3,一款由深度求索公司自研的MoE模型,以高效、低算力依赖及卓越效果著称,其训练成本仅557万美元,却性能对标GPT-4o及Claude-3.5-Sonnet等领先闭源模型。DeepSeek-V3在百科知识、长文本处理、代码理解、数学解题及中文能力等方面表现突出,通过创新方法优化模型训练和推理系统,提升生成速度至3倍,并在分布式推理、负载均衡、多Token预测及低精度训练等方面取得技术突破。该模型发布后受到广泛关注与赞誉,被视为中国模型开发者在AI大模型时代的创新代表,预示着算力不再是唯一决定因素,中国开发者在模型与基础设施创新方面拥有更多机会。
DeepSeek
V3
开源模型
2024-12-30
2024-12-30
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
阿里巴巴语音实验室推出ClearerVoice-Studio语音处理框架,集成语音增强、分离和音视频扬声器提取功能,解决复杂场景中的沟通困难。该框架包含多款创新模型,如FRCRN模型、MossFormer系列等,通过GitHub和Hugging Face平台开放给开发者。ClearerVoice-Studio在实测和实际应用中表现出色,适用于专业音频编辑、实时通信和AI驱动应用等场景,标志着语音处理技术的重要进步,为全球AI社区提供更多可能性。
ClearerVoice-Studio
语音
2024-12-26
2024-12-26
理解 o3 及其技术分析
文章总结了关于OpenAI的o3模型的技术分析、能力理解、推理方式探讨、跨领域泛化、评论与展望等内容。指出o3作为o1的继承者,在能力上有大幅提升但成本也显著增加,采用可能的多路推理方式,并在推理成本和技术发展路径上进行了讨论,认为LLM尚未撞墙,并对未来2年发展保持乐观。同时,提到OpenAI内部可能有多线探索,o系列模型可能逐步成为主流。此外,还讨论了推理成本的优化可能性和o系列模型与Agent的关系。
o3
技术分析
2024-12-25
2024-12-25
开源
OpenAI真的开源了!这波「实时语音」操作,让万物开口说话,我爱了
OpenAI开源了嵌入式实时语音SDK,能让小型设备实现实时语音交互,如毛绒玩具等,已在esp32s3和Linux上测试,并提供了全套工具链支持,简化了AI功能引入微型设备的过程。该SDK推动了AI玩具市场的发展,预计未来几年将迎来爆发式增长。
OpenAI
嵌入式实时语音
SDK
2024-12-25
2024-12-25
Sora
中学生能看懂:Sora 原理解读
Sora是OpenAI的视频生成AI模型,能将多样化视觉数据统一处理并生成与文本提示匹配的视频或图片,通过视频压缩网络、空间时间补丁及文本条件化的Diffusion模型等技术实现,支持多样化视频格式,改进视频构图,深度理解语言,处理多模态输入,能模拟3D一致性和长期一致性的世界互动,但仍面临物理世界模拟准确性、长视频生成一致性、复杂文本指令理解及训练生成效率等挑战。
Sora
原理
2024-12-23
2024-12-23
开源
清华&面壁开源新一代主动Agent交互范式!让AI从被命令到主动帮助
清华团队提出开创性主动Agent范式,使AI能主动观察环境、预判用户需求,实现从“被命令”到“会思考”的飞跃,并构建了数据集和奖励模型进行评测,有望开启人机交互新范式。
Agent
大模型
2024-12-20
2024-12-20
深度解析ElasticSearch同义词管理:打造更智能的搜索体验
本文介绍了ElasticSearch中的同义词搜索功能,旨在提升搜索智能性和用户体验。文章详细说明了两种同义词管理方案:静态同义词库和动态同义词API。静态同义词库通过配置外部同义词文件实现,易于维护但更新需重新加载索引或重启节点;动态同义词API则允许通过API实时更新同义词,适用于频繁更新的系统,但需Elasticsearch 8.10及以上版本。文章还提供了Python实现动态同义词管理的示例代码,并总结了两种方案的不同特性和适用场景。最后,作者提及了自己的NLP研究方向和相关项目。
ElasticSearch
智能搜索
2024-12-20
2024-12-20
提示词
分享一个结构化AI提示词模版
文章总结:文章介绍了如何使用SPARK结构化提示词模板提升与AI对话的效率,包括模板的五个要素(情境、目的、受众、要求、知识)及十个实用场景模板,并通过数据对比展示了使用效果,同时提供了进阶使用技巧和应用场景举例,最后强调了掌握高效对话技巧在AI时代的重要性。
提示词
模板
2024-12-19
2024-12-19
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
clone-voice是一款免费开源的声音克隆工具,利用先进的人工智能技术实现高质量的声音克隆,支持多语言,并提供了详细的技术原理、使用方法及广泛的应用场景,如娱乐、教育、媒体广告和语音交互等。同时,文章也探讨了声音克隆技术的发展意义与挑战。
clone-voice
声音克隆
2024-12-06
2024-12-06
清华
清华、面壁智能发布:主动式Agent 2.0
Agent2.0展现出解决复杂任务的卓越能力,从被动响应转变为主动预测并发起任务的代理,通过环境监控、事件处理、场景及事件生成、代理预测与任务执行等流程,实现更全面和无缝的服务,并通过奖励模型评估其性能。
Agent
2.0
大模型
2024-12-05
2024-12-05
如何改善你的回测方法,提高策略的未来收益
本论文探讨了如何通过改进回测技术避免系统性投资策略开发中的陷阱和偏差,介绍了三种回测方法及其优劣势,提供了提高模拟质量的指导,并深入讨论了多重检验下选择偏差的校正方法及夏普比率的局限性,旨在为实践者提供更准确可靠的投资策略开发工具。
回测方法
2024-12-05
2024-12-05
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
腾讯在混元发布会上宣布开源视频生成模型,该模型具有超强真实质感、强语义理解和可切换镜头等特点,在开源AI视频中属T0级别,模型已上线GitHub和腾讯元宝APP供用户体验。腾讯此举展现了其开放态度,进一步巩固了其市场地位。
sora
视频生成
2024-12-04
2024-12-04
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
LobeChat是一个集合多种AI功能的开源工具,拥有炫酷的前端页面和强大的功能,支持本地知识库、多模型服务商、本地大模型、视觉识别、TTS和STT、AI绘图、插件系统、代理市场、数据库、多用户管理、渐进式网络应用和移动端适配,以及自定义主题等,用户体验极佳,项目链接在文章最后。
AI开源
集合
2024-12-04
2024-12-04
腾讯
腾讯 IMA: AI 智能教学新助手
腾讯IMA智能管理助手融入教育领域,通过精准信息检索、知识管理升级、高效文档处理、智能写作辅助及多场景应用,为教学带来变革,助力教师提升教学效率与质量,创造更优质学习体验。
腾讯
IMA
智能教学
2024-12-03
2024-12-03
活久见,世界上第一个被人类骗走钱的AI,刚刚出现了!
世界上首个被人类骗走近5万美元的AI诞生,利用精妙prompt工程成功骗过AI智能体Freysa。此事引发关注,包括马斯克等人都对此表示兴趣。同时,AI大牛Karpathy揭示与AI对话背后的本质,指出向AI提问实际上是向背后的人类数据标注员提问。另外,有研究者用数学公式推演出仅靠Scaling Law永远无法到达AGI,对未来AI发展路径提出质疑。
Freysa
智能体
2024-12-02
2024-12-02
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100