文章列表-AI魔法学院

文章列表

大模型实践总结

P-Tuning v2：让Prompt Tuning能够在不同参数规模的预训练模型、针对不同下游任务的结果上都达到匹敌Fine-tuning的结果。

大模型训练

所有生命分子一夜皆可AI预测！AlphaFold 3改变人类对生命的理解，全球科学家都能免费使用

§ 为了避免扩散方法在一些无结构区域产生幻觉，还引入了一种新的交叉蒸馏方法，通过AlphaFold-Multimer v2预测的结构数据来丰富训练数据。

AlphaFold 3 蛋白预测

7.1k Star！RAGFlow：最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务！

o o • 2024-05-08 集成大模型 DeepSeek o o • 2024-04

OCR RAG 开源

腾讯开源混元AI绘画大模型

(Optional) Install flash attention v2 for acceleration (requires CUDA 11.6 or above) python -m

腾讯混元文生图

再也不怕合照缺人，Anydoor为图片编辑开了一道「任意门」

因此，作者选择了 DINO-V2 作为 ID 提取器的底座，使用单个线性层将 ID 提取器的 token 对齐到预训练的文本到图像的 UNet 中。

Anydoor 文生图

字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言

install pydantic<2 coqui-ai TTS语音克隆模型配置随后下载2.0版本的模型，下载地址： https://huggingface.co/coqui/XTTS-v2

coqui-ai TTS 语音

Langchain中改进RAG能力的3种常用的扩展查询方法

StrOutputParserimport numpy as np cross_encoder = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-6-v2

检索增强生成 Langchain

BGE M3-Embedding：智源最新发布的text embedding模型，多语言检索效果超过微软跟openai

很熟悉的感觉吧，很像tfidf，也跟RetroMAE-V2的第二部分特征很相似，这部分特征更在意文本中各个token的信息，重要的token就赋予更高的权重。

BGE M3-Embedding 多语音检索

前半年，我看到的有趣的 AI 产品

11、阿里最新推出了Mobile-Agent-V2，这是一个具有视觉感知功能的自主多模态移动设备代理。

AI工具

手把手教你用 SD 生成文字形状的光线，用来做营销宣传图非常有效

https://huggingface.co/ioclab/control_v1p_sd15_brightness/tree/main 将模型文件放到 \novelai-webui-aki-v2

图像文字 ControlNet Stable Diffusion

万字长文，AI大模型的应用实践总结

· BianQue：一个经过指令与多轮问询对话联合微调的医疗对话大模型，基于ClueAI/ChatYuan-large-v2作为底座，使用中文医疗问答指令与多轮问询对话混合数据集进行微调。

大模型

Meta无限长文本大模型来了：参数仅7B，已开源

对于 LLAMA2 模型，该研究使用 Flash-Attention V2 加速全注意力的计算。

Meta 长文本大模型

大模型应用实践：用LLaMA 2.0, FAISS and LangChain实现基于自由知识问答

您将使用all-mpnet-base-v2句子转换器将所有文本片段转换为向量，同时将它们存储在向量存储中。

开源模型

开源免费离线语音识别神器whisper如何安装

[--model {tiny.en,tiny,base.en,base,small.en,small,medium.en,medium,large-v1,large-v2,large}] 结语

wisper 翻译免费

中文版开源Llama 2同时有了语言、多模态大模型，完全可商用

[4] Primewords: https://openslr.org/47/ [5] Whisper: https://huggingface.co/openai/whisper-large-v2

开源模型

<1 2 345 6 >

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1