首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
· 划重点!全网最全AI数字人工具合集!
· 大模型推理能力增强方法总结
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· Kimichat炒股:7个提示词案例
· LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· 我们需要的不是智能体,而是工作流(5000字保姆式教学)
· 神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
· 开源!数字人资源大集合!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Transformer
TrOCR——基于transformer模型的OCR手写文字
识
别
有关CNN卷积神经网络的相关
知
识
与文章,可以参考往期的文章内容。
OCR
手写
文字识别
全球学术界
知
名学者教授信息大盘点(全)
如果你还在迷茫找不到方向,又或者要留学不
知
道找哪个导师,那么你可以看一下这些大佬们的研究方向和主页,希望对你能有所帮助。
AI大佬
知名学者
语音
Insanely Fast Whisper:超快的Whisper语音
识
别脚本
这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音频。作者提供了几种优化方式,包括批处理、半精度处理以及BetterTransformer,以提高转录速度。最终,作者以实际测试数据展示了不同优化方式的速度对比。同时,还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社区展示。这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高效。
音频
Whisper
开源
来个优秀的开源人脸
识
别项目!
虹膜
识
别技术通过全自动照相机寻找并聚焦虹膜,实现高精度
识
别。
人脸识别
开源项目
RAG
RAG——使用检索增强生成构建特定行业的大型语言模型
像之前介绍过的pandasAI、quivr、flowise、localGPT、privateGPT、pdfGPT和一些常见的基于大模型构建的本地
知
识
库
等AI应用无一不是建立在检索增强技术之上的,它是向量数据
库
能够在
大模型
OpenAI
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据
库
了?
其中,王炸功能 Assistants API 的内置工具支持了代码解释器、
知
识
库
检索以及函数调用,允许接入外部
知
识
(文档)、使用更长的提示和集成各种工具。
RAG
检索
向量库
开源
几款开源的OCR
识
别项目,收藏备用
github.com/naptha/tesseract.js.git PaddleOCR PaddleOCR是百度开源一套OCR,旨在打造一套丰富、领先、且实用的OCR工具
库
,
OCR
写作
AI 写作:如何把GPT变成你的爆文写作素材
库
?
二、建立属于你的素材
库
建立一个有效的素材
库
,可以让你的写作过程更加顺畅,更加高效。
AI写作
GPT
LLM
国内LLM陆续启动,你的Prompt
库
有这些模块吗
同时,要想让生成式AI发挥最大的作用,除了必要的专业
知
识
,你还需要积累下面的这些模块。
prompt
LLM
基于LLM+向量
库
的文档对话痛点及解决方案
笔者做了一些探索,希望与大家共同探讨 问题1:如何让LLM简要、准确回答细粒度
知
识
?
开源模型
开源
OpenAI 开源语音
识
别 Whisper 的使用体验怎么样?
作者:
知
乎用户 链接:https://www.zhihu.com/question/575983499/answer/3055288368 来源:
知
乎 著作权归作者所有。
生成式AI
提示词
好看的图片不
知
道怎么写提示词?用AI读出来
然而,有一个很大的问题困扰着很多爱好者:我不
知
道怎么写提示词怎么办?
文生图
开源
14.4K Star,一款漂亮、快速、现代化的开源免费UI组件
库
今天继续给大家推荐一个广受好评的UI组件
库
:NextUI NextUI 主要特性 NextUI的主要目标是简化开发流程,为增强的用户体验提供美观且适应性强的系统设计。
大模型
开源
向量数据
库
简介和5个常用的开源项目介绍
随着我们对人工智能应用,如图像
识
别、语音搜索或推荐引擎的深入研究,数据的性质变得更加复杂。
开源模型
大模型
【手把手带你微调 Llama3】 改变大模型的自我认
知
,单卡就能训
微调Llama3的自我认
知
后 当你问Llama3中文问题: “你叫什么名字?”
Llama3
对话问答模型
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100