首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 硬核解读Stable Diffusion(系列一)
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 新华妙笔
· MidjourneyV6高级提示词技巧(人物篇)
· 吴恩达Prompt教程之总结图解
· 开箱即用的图像增强、视频增强AI工具,Upscapl、Topaz Video AI
· 自动化神器Autolt:不再重复工作
· StableDiffusion常用热门模型下载站点推荐(国内版)
· 点评:六大向量数据库
· 第3期 SDXL和SD的10大区别!你知道几个?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
从零开始学习大模型-第二章-大模型学习路线
随着技术的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及
视
频
。
大模型
学习
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音
频
。
音频
Whisper
了解Kimi必看的26个问题 | Kimi系列文(二)
了解到,目前的GenAI有文本类、
视
频
类、绘图类、音
频
类、编程类、PPT、数字人、AI搜索等形式。
Kimi
大语言模型
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的
强
大的AI语音克隆工具!
而 OpenVoice 作为一款
强
大的多语言即时语音克隆AI工具,可以为用户提供高效、个性化的语音克隆服务,是一款值得推荐的项目。
tts
文本转语音
大模型
“实时”语音翻译!AI语音具有“情绪”!最
强
开源AI大模型来了
这次AI要革翻译的命了么?!(先别急着骂,我们先看看产品) 你是否遇到过这样的情况: 你想和一个说不同语言的人交流,但是你不会他的语言! 你想把一段语音转成文字,或者把一段文字转成语音,但是你不知道怎么操作! 你想把一种语言的语音或文字直接转换成另一种语言的语音或文字,但是你需要用多个工具,而且效果不理想! 如果你有这样的困扰,那么你一定会对meta的开源AI模型seamless-communication感兴趣。
大模型
开源模型
语音
大模型
最
强
开源大模型Llama 3,在扎克伯格设想中其实是这样的
与此同时,Meta也同步发出了一个长达80多分钟的播客访谈
视
频
。
Llama
3
大语言模型
开源
从声纹模型到语音合成:音
频
处理 AI 技术前沿 | 开源专题 No.45
它包含了两个最先进的 AI 生成模型 (AudioGen 和 MusicGen) 的推理和训练代码,可以产生高质量音
频
。
AudioCraft
音频
大模型
北大开源最
强
aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计
没完,这个模型不仅打败了一众开源大模型、成为百亿级代码大模型中最
强
,还有特别的优势: 一改传统的“刷题式”代码生成,它专门针对企业级软件项目,在真实开发场景下效果最好——代码生成补全能力、和跨文件能力经过测试
aiXcoder-7B
大模型
阿里
阿里Outfit Anyone实现真人百变换装
之前我分享了阿里通义千问APP推出的 "全民舞王" ,只要一张照片就能生成一段舞蹈
视
频
这几天相信有很多小伙伴都有在社交媒体和朋友圈刷到过这种 其背后就是用的 Animate Anyone 算法
Outfit
Anyone
阿里
阿里
阿里最近推出AI项目的动作太过
频
繁,脑子跟不上了,事出反常必有妖,盘点一下
· I2VGen-XL, 阿里推出的图像到
视
频
生成模型,也就是图生成
视
频
又新
增
了一个 AI 工具,之前常用的效果好的有
阿里
大模型
RAG
LangChain - RAG:线上系统多文档要
频
繁更新,每次都要重新花钱做一次 embedding,老板不批预算,批我...
LangChain 提出的方案如下图所示,暂且称它为「
增
量更新」模式,在 data-transform 这一步、embedding 之前针对没个 chunk 做一次 hash,记录下来 hash 值,每次源数据更新了只需要在这一步里面比对一下
大模型
AI资讯速递 - 快人一步!为你填平AI领域信息差及时揭示AI领域的最新动态
AI能够制作
视
频
吗?
AI资讯
AI新闻
RAG
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
如前文LLM应用架构之检索
增
强
(RAG)的缘起与架构介绍,RAG架构很好的解决了当前大模型Prompt learning过程中context window限制等问题,整体架构简明清晰,易于实现,得到了广泛的应用
大模型
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
「高质量
视
频
生成」
视
觉质量:MimicTalk生成的3D头像在
视
觉质量上超越了以往的技术,能够生成「高度逼真的面部细节和表情」。
MimicTalk
开源模型
「长文」可能是目前最全的LangChain AI资源库之一
前言 本文主要内容是一个LangChain资源库,里面罗列了大大小小很多个基于LangChain框架的优秀项目,包括低代码、服务、代理、模板等工具类,还有像知识管理、聊天机器人等开源项目,还包括像
视
频
工作
<
...
9
10
11
12
13
14
15
16
17
18
...
>
1
2
4
5
6
7
8
9
100