首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
腾讯开源混元AI绘画大模型
Install pip dependencies
python
-m pip install -r requirements.txt # 4.
腾讯
混元
文生图
【2023.10】看目前巨头的AI原生产品布局
【BD.2C.4】第三方插件生
态
百度提到了两个与其他企业合作的插件性产品:AI阅读助手、乘
机
助手。
大模型
产品
ChatGPT
ChatGPT 的对话框过时了?这款 AI 产品提供了一种很新的聊天方式
它在形式上最大的亮点是,把纵向的聊天记录,转变成了动
态
的画布,为人
机
交互提供了一种很新的方式。
ChatGPT
聊天
爬虫
微信搜狗爬虫WechatSogou - 从微信公众号获取文章的利器
安装WechatSogou WechatSogou是一个
Python
库,你可以使用pip命令来安装它。
WechatSogou
微信
搜狗
大模型
最佳开源文生图大模型可图:安装与批量出图的完整教程
在
机
器测评上,Kolors 获得了最高的 MPS 分数,这与人工评估的结果一致。
可图
kolors
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
随着生成型人工智能(AI)的飞速发展,多模
态
理解和代码生成的能力达到了前所未有的水平。
设计转代码
大模型
万字长文-大语言模型指令调优综述
接下来,作者通过随
机
改写指令或输入来扩展数据集。
大语言模型
Sora
一文带你看懂OpenAI-Sora生成视频的原理
「从视觉数据到补丁」 就像拼积木游戏 假如你手里有一盒五彩缤纷的积木,每个积木都有它独特的形
状
和颜色。
视频生成
sora
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形
态
可能在中文领域斗不过
Whisper
语音优化
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 不仅有一个开源的 voice agent 方案[1],还能为你提供一个成熟且强大的实时多模
态
AI 解决方案。
GPT-4o
语音交互
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
Dense retrieval: 给定一个文本,获取语言模型最后一层上[CLS]位置的隐
状
态
,经过标准化作为文本的稠密向量表征。
BGE
M3-Embedding
多语音检索
RAG
LlamaIndex的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)
;) 下面是一些构建Agent会用到的专门组件: · AgentInputComponent 允许将Agent输入(任务、
状
态
字典
Agent
QueryPipeline
大模型
为什么说AI现在还不行!
也正因此最近写了几篇文章都在提应该以一种更加理性的
态
度来看待AI的进展,甚至设想了一种测试智能程度的方式:图灵测试2.0。
大模型
OpenAI
【语音识别】OpenAI语音力作Whisper
这让Wav2Vec 2.0相形见绌,因为Wav2Vec 2.0是在无监督 码预测任务上预训练的,所以其训得的模型仅从未标注的纯音频数据中习得了从语音到隐含
状
态
的中间映射。
语音转文字
whisper
微信向量检索分析一体化数仓探索:OLAP For Embedding
在调研对 ClickHouse 对向量检索/加工能力时,我们惊讶地发现, 现代 OLAP 数仓已具在其内部独立搭建 CLIP 等主流
机
器学习模型的数据处理全流程能力 (图 1),包含 embedding
OLAP
For
Embedding
一体化数仓
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100