首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 推荐一个自动生成复杂提示词的模版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解
· 第3期 SDXL和SD的10大区别!你知道几个?
· 实测:本地跑llama3:70B需要什么配置
· 6个最佳开源TTS引擎
· 最强开源数字人对口型系统介绍
· 阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
· 免费的文本生成视频解决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
· 盘点字节跳动最新的AI应用
· 全面理解Stable Diffusion采样器
· 初创企业必知的 30种商业模式(附实例)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
先
回
顾一下进程,大家可以看到Midjourney在文生图
方
向的突破;OpenAI借助非常强的理解大模型、能够对图像实现精标的能力,在文生图上做出自己有特色的工作和突破;创业公司像Pika、Runway也在做自己的工作
通义
文生视频
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
但是随着transformer模型attention注意力机制进入计算机视觉任务,我们同样可以使用transformer来进行计算机视觉
方
面的任务,比如对象检
测
,对象分类,对象分割等,这里毕竟著名的模型
OCR
手写
文字识别
数字人
数字人:从科幻走向现实的技术革命
创建数字人需要多
方
面的技术支持,包括计算机图形学、动作捕捉、语音合成以及人工智能算
法
等。
数字人
语音
大模型
大模型下半场,关于Agent的几个疑问
这一过程就像马克思主义的「实践论」:“认识从实践开始,经过实践得到了理论的认识,再
回
到实践中去。”
大模型
大模型
AIGC大模型,潮水褪去之后
搞一个场景,比较几个大模型的
回
答,做个统计层面的分析,计算机前沿论文几乎连数学公式都没有。
大模型
Sora
通俗易懂地解释OpenAI Sora视频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
OpenAI Sora支持多个视频的连接 这是另一个Sora与众不同的地
方
。
sora
视频生成
开源
昆仑万维携Skywork-13B打造AI新纪元:600GB中文数据集全球开源
这两个模型在CEVAL、GSM8K等多个权威评
测
与基准
测
试上展现了同等规模模型中的最佳效果,特别是在中文科技、金融、政务等领域的表现更是超越了其他开源模型。
Skywork
开源
数据
写作
花钱买AI写作工具?究竟哪款工具值得你掏钱
直接
回
复,不用加引号。
写作
ChatGPT
写作
AI写作:爆款选题公式+Prompt指令,手把手教你写赚钱的公众号流量主文章
每当我想不出来写什么的时候,我一定会
回
味这些话。
prompt
写作
大模型
中国大模型融资暗战:罗曼蒂克的快速消亡
但这种说
法
被月之暗面的投资人否认。
大模型
暗战
论文润色 | GPT4.0论文润色指令总结(含GPT3.5和4.0润色效果对比)
你需要像前面的例子一样报告所有的语
法
和拼写错误。
论文
提示词
写作
ChatGPT
实战:如何用AI Agent实现ChatGPT流程化写作,产能翻倍
ChatGPT 虽然是个相当厉害的 AI 聊天机器人,能
回
答你各式各样的问题,并根据你的需求生成内容,但它其实更像一个等待指令的工具,而非一个能自主思考的助手。
Agent
写作
ComfyUI
ComfyUI,你开启XL钥匙打开了新世界
还新获得了很多有如魔
法
一般的工作流(指的是ComfyUI's workflow),这让我对扩散模型进行aigc有了新的认知。
ComfyUI
大模型
Sora
中学生能看懂:Sora 原理解读
通过这种
方
法
,Sora能够在保留原始视觉信息丰富性的同时,将不同来源和风格的视觉数据统一成一种可操作的内部表示形式。
Sora
原理
开源
十大开源语音识别项目
支持语言:中文、
法
语、德语、意大利语、日语、韩语、西班牙语等等。
语音识别
开源项目
<
...
68
69
70
71
72
73
74
75
76
77
...
>
1
2
4
5
6
7
8
9
100