首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Stable Diffusion|提示词高阶用法(二)双人同图
· 复旦开源中文医疗大模型,基于百川微调,模型和数据集都公开
· Suno音乐新手指南(手把手完整版教程)
· 必看!阿里通义千问完整技术报告
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
· MCP服务介绍及应用场景报告-来自Manus
· 理解 o3 及其技术分析
· 腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ComfyUI
StableDiffusion升级版SDXL:一键运行包ComfyUI和18G模型分享!
· 基于1024×1024训练,更加高清,
v2
是768,V1.5是512。
comfyui
sdxl
文生图
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
该项目的目录如下,详情见:【又又一款王炸级别TTS模型】趣丸科技&港中大开源MaskGCT语音大模型,性能超过CosyVoice,XTTS-
v2
!
语音克隆
开源模型
语音
国内厂商语音识别与Whisper评测:现状与概况对比
不同厂商在不同场景下的ASR评测结果 · 总结:本次主角 OpenAI 开源的 Whisper 模型(large-
v2
语音识别
Faster-Whisper
微调
大语言模型综述<演进,技术路线,区别,微调,实践,潜在问题与讨论>
AutoModelForCausalLM.from_pretrained(model_name_or_path, return_dict=True) model = get_peft_model(model, peft_config) P-Tuning v1-
v2
大模型
盘点字节跳动最新的AI应用
去年11月,字节跳动发表视频生成研究成果 PixelDance,而今年1月,字节又发布了视频生成模型 MagicVideo-
V2
,最近,字节正式发布文生图模型 SDXL-Lightning...
字节
AI工具
大模型
中国电信开源星辰AI大模型:央企中首个完成LLM研发和开源的选手诞生
再通过将RoPE与FlashAttention-
V2
相结合,模型的训练速度进一步提高了20%以上。
开源大模型
电信
Stable Diffusion
Stable Diffusion的模型分类以及使用
不需要搭配其他的文件: 并且它们都有比较擅长生成的图像类型,例如这个Anything v3就是专门用来生成二次元的: 而这个Realistic Vision
v2
文生图
大模型
大模型微调经验汇总---LLM finetuning 踩坑经验之谈
Prefix-Tuning (P-Tuning
v2
) Prompt Tuning Lora / QLora 根据实际经验,这里推荐采用 Lora 或 QLora。
大模型
人工智能
QWen1.5: 卓越模型之路
评估结果如下: 尽管落后于 GPT-4-Turbo,但最大的 Qwen1.5 模型 Qwen1.5-72B-Chat 在 MT-Bench 和 Alpaca-Eval
v2
上都表现出不俗的效果,
Qwen1.5
开源模型
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
音频编码器的初始化基于Whisper-large-
v2
模型 ,这是一个包含两个卷积下采样层作为起始层的32层Transformer模型。
大模型
语音
AI音乐热潮下,“神曲工作室”率先失业
小旭音乐官网展示的部分商业客户 小旭说,Suno
v2
的水平还未达到商业应用的级别。
音乐
音频
理解 o3 及其技术分析
Ilya Sutskever在NeurIPS2024上报告全文中文版
V2
OpenAI前首席研究官Bob McGrew采访中文版 Ilya提到了下一步的两个价值很高的方向
o3
技术分析
大模型
深度对比丨探索LLM(大模型)部署服务的七大框架差异
· · 使用flash-attention(和
v2
)和Paged Attention优化 Transformer 代码进行推理。
大模型
开源
最新最全的开源中文大语言模型列表
:https://github.com/scutcyr/BianQue 简介:一个经过指令与多轮问询对话联合微调的医疗对话大模型,基于ClueAI/ChatYuan-large-
v2
大模型
比 Roop 和 Reactor 更像!IP Adapter 新模型为任何人做写真
标题:IP-Adapter 新模型超越 Roop 和 Reactor:更完美的角色一致性和相似性 继我们上一篇文章介绍了IP-Adapter的新模型Face ID Plus
V2
之后,今天我们将深入探讨如何将这一强大工具用于生成具有高度个性化特征的人物肖像
IP-Adapter
文生图
<
1
2
3
4
5
6
>
1
2
4
5
6
7
8
9
100