首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Stable Diffusion|提示词高阶用法(二)双人同图
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· Suno音乐新手指南(手把手完整版教程)
· 必看!阿里通义千问完整技术报告
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
· MCP服务介绍及应用场景报告-来自Manus
· 理解 o3 及其技术分析
· 腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
大模型实践总结
P-Tuning
v2
:让Prompt Tuning能够在不同参数规模的预训练模型、针对不同下游任务的结果上都达到匹敌Fine-tuning的结果。
大模型
训练
所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用
§ 为了避免扩散方法在一些无结构区域产生幻觉,还引入了一种新的交叉蒸馏方法,通过AlphaFold-Multimer
v2
预测的结构数据来丰富训练数据。
AlphaFold
3
蛋白
预测
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
o o • 2024-05-08 集成大模型
DeepSeek
o o • 2024-04
OCR
RAG
开源
大模型
腾讯开源混元AI绘画大模型
(Optional) Install flash attention
v2
for acceleration (requires CUDA 11.6 or above) python -m
腾讯
混元
文生图
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
因此,作者选择了 DINO-
V2
作为 ID 提取器的底座,使用单个线性层将 ID 提取器的 token 对齐到预训练的文本到图像的 UNet 中。
Anydoor
文生图
语音
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言
install pydantic<2 coqui-ai TTS语音克隆模型配置 随后下载2.0版本的模型,下载地址: https://huggingface.co/coqui/XTTS-
v2
coqui-ai
TTS
语音
RAG
Langchain中改进RAG能力的3种常用的扩展查询方法
StrOutputParserimport numpy as np cross_encoder = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-6-
v2
检索增强生成
Langchain
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
很熟悉的感觉吧,很像tfidf,也跟RetroMAE-
V2
的第二部分特征很相似,这部分特征更在意文本中各个token的信息,重要的token就赋予更高的权重。
BGE
M3-Embedding
多语音检索
前半年,我看到的有趣的 AI 产品
11、阿里最新推出了Mobile-Agent-
V2
,这是一个具有视觉感知功能的自主多模态移动设备代理。
AI工具
手把手教你用 SD 生成文字形状的光线,用来做营销宣传图非常有效
https://huggingface.co/ioclab/control_v1p_sd15_brightness/tree/main 将模型文件放到 \novelai-webui-aki-
v2
图像文字
ControlNet
Stable
Diffusion
大模型
万字长文,AI大模型的应用实践总结
· BianQue:一个经过指令与多轮问询对话联合微调的医疗对话大模型,基于ClueAI/ChatYuan-large-
v2
作为底座,使用中文医疗问答指令与多轮问询对话混合数据集进行微调。
大模型
大模型
Meta无限长文本大模型来了:参数仅7B,已开源
对于 LLAMA2 模型,该研究使用 Flash-Attention
V2
加速全注意力的计算。
Meta
长文本
大模型
大模型
大模型应用实践:用LLaMA 2.0, FAISS and LangChain实现基于自由知识问答
您将使用all-mpnet-base-
v2
句子转换器将所有文本片段转换为向量,同时将它们存储在向量存储中。
开源模型
开源
开源免费离线语音识别神器whisper如何安装
[--model {tiny.en,tiny,base.en,base,small.en,small,medium.en,medium,large-v1,large-
v2
,large}] 结语
wisper
翻译
免费
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
[4] Primewords: https://openslr.org/47/ [5] Whisper: https://huggingface.co/openai/whisper-large-
v2
开源模型
<
1
2
3
4
5
6
>
1
2
4
5
6
7
8
9
100