火星链 火星链
Ctrl+D收藏火星链
首页 > ETH > 正文

PFL:Stable Diffusion 团队放大招!新绘画模型直出 AI 海报,像素级生成

作者:

时间:1900/1/1 0:00:00

来源:量子位

开源AI绘画扛把子,StableDiffusion背后公司StabilityAI再放大招!

全新开源模型DeepFloydIF,一下获星2千+并登上GitHub热门榜。

DeepFloydIF不光图像质量是照片级的,还解决了文生图的两大难题:

准确绘制文字。

Starknet主网已在v0.11.1上运行,下周计划启动v0.11.2测试网:5月25日消息,以太坊 Layer2 扩容解决方案 Starknet 宣布其主网已开始在 v0.11.1 上运行,下周计划启动 v0.11.2 测试网,之后拟安排主网上线时间,v0.11.2 将正式激活 Cairo 1,并且会为 Cairo 1 在主网上的功能做好准备。[2023/5/25 10:39:50]

以及准确理解空间关系。

网友表示,这可是个大事,之前想让Midjourneyv5在霓虹灯招牌上写个字AI都是瞎划拉两笔,对于镜子理解的也不对。

Bitstamp已裁员30%,解雇约200名员工:金色财经报道,加密货币交易所Bitstamp最近将员工人数减少了30%,从去年9月份的约650人减少到2月份的450人。但Bitstamp CEO Jean-Baptiste在接受采访时表示,这不是一轮裁员,许多从事牌照、战略、合规和安全工作的顾问完成了他们的项目,所有这些人都在去年年底完成了他们的任务。[2023/3/15 13:05:36]

使用DeepFloydIF,可以把指定文字巧妙放置在画面中任何地方。

霓虹灯招牌、街头涂鸦、服饰、手绘插画,文字都会以合适的字体、风格、排版出现在合理的地方。

Stargate社区关于聘请GSR作为做市商的提案获得通过:2月20日消息,Snapshot页面显示,跨链桥接协议Stargate社区发起的“聘请GSR作为STG在中心化交易所的做市商”的提案投票已结束,以98.2%的支持率获得通过。提案内容显示,Stargate将向GSR提供800万枚STG的欧式期权,条件为24个月后STG均价超过1.15美元。Stargate表示为了保护市场,不会透露具体要求的价格。

据悉,发起该提案是由于多家交易所就Stargate在中心化交易所的流动性问题联系了Stargate基金会,并通知如果Stargate DAO不聘请做市商,STG将在未来退市或取消优先级。[2023/2/20 12:17:21]

开源以太坊共识客户端Lodestar发布v0.38.0版本,修复eth1存款缓存问题:6月11日消息,开源以太坊共识(Eth2)客户端Lodestar发布v0.38.0版本,最新版本包括对Ropsten上遇到的eth1存款缓存问题的修复,以及对发布过程和验证节点客户端的小修复。[2022/6/11 4:18:21]

这意味着,AI直出商品渲染图、海报等实用工作流程又打通一环。

还在视频特效上开辟了新方向。

目前DeepFloydIF以非商用许可开源,不过团队解释这是暂时的,获得足够的用户反馈后将转向更宽松的协议。

Blockstack CEO:智能合约的潜在应用远远超出其名称所示的范围:区块链软件公司Blockstack的联合创始人兼首席执行官Muneeb Ali认为,智能合约的潜在好处和应用远远超出其名称所示的范围。

Muneeb Ali称,就像云计算对广泛的行业产生了影响,而不仅仅局限于金融业,智能合约也是如此。它们甚至不应该被称为“智能合约”,因为这是一个相当局限的名称。(Cointelegraph)[2020/6/12]

有需求的小伙伴可以抓紧反馈起来了。

像素级图像生成

DeepFloydIF仍然基于扩散模型,但与之前的StableDiffusion相比有两大不同。

负责理解文字的部分从OpenAI的CLIP换成了谷歌T5-XXL,结合超分辨率模块中额外的注意力层,获得更准确的文本理解。

负责生成图像的部分从潜扩散模型换成了像素级扩散模型。

也就是扩散过程不再作用于表示图像编码的潜空间,而是直接作用于像素。

官方还提供了一组DeepFloydIF与其他AI绘画模型的直观对比。

可以看出,使用T5做文本理解的谷歌Parti和英伟达eDiff-1也都可以准确绘制文字,AI不会写字这事就是CLIP的锅。

不过英伟达eDiff-1不开源,谷歌的几个模型更是连个Demo都不给,DeepFloydIF就成了更实际的选择。

具体生成图像上DeepFloydIF与之前模型一致,语言模型理解文本后先生成64×64分辨率的小图,再经过不同层次的扩散模型和超分辨率模型放大。

在这种架构上,通过把指定图像缩小回64×64再使用新的提示词重新执行扩散,也实现以图生图并调整风格、内容和细节。

并且不需要对模型做微调就可直接实现。

另外,DeepFloydIF的优势还在于,IF-4.3B基础模型是目前扩散模型中U-Net部分有效参数是最多的。

在实验中,IF-4.3B取得了最好的FID分数,并达到SOTA。

谁是DeepFloyd

DeepFloydAIResearch是StabilityAI旗下的独立研发团队,深受摇滚乐队平克弗洛伊德影响,自称为一只“研发乐队”。

主要成员只有4人,从姓氏来看均为东欧背景。

这次除了开源代码外,团队在HuggingFace上还提供了DeepFloydIF模型的在线试玩。

我们也试了试,很可惜的是目前对中文还不太支持。

原因可能是其训练数据集LAION-A里面中文内容不多,不过既然开源了,相信在中文数据集上训练好的变体也不会太晚出现。

OneMoreThing

DeepFloydIF并不是StabilityAI昨晚在开源上的唯一动作

语言模型方面,他们也推出了首个开源并引入RLHF技术的聊天机器人StableVicuna,基于小羊驼Vicuna-13B模型实现。

目前代码和模型权重已开放下载。

完整的桌面和移动界面也即将发布。

DeepfloydIF在线试玩:

https://huggingface.co/spaces/DeepFloyd/IF

代码:

https://github.com/deep-floyd/IF

StableVicuna在线试玩:

https://huggingface.co/spaces/CarperAI/StableVicuna

权重下载:

https://huggingface.co/CarperAI/stable-vicuna-13b-delta

参考链接:

https://deepfloyd.ai/deepfloyd-if

https://stability.ai/blog/deepfloyd-if-text-to-image-model

https://stability.ai/blog/stablevicuna-open-source-rlhf-chatbot

https://stable-diffusion-art.com/how-stable-diffusion-work/

标签:STAFLODEEPPFLstarl币最新消息GREENFLOKI币Deeper NetworkPFL价格

ETH热门资讯
区块链:金色观察 | Multicoin Capital:读懂web3原生SQL项目Tabeland

作者:KyleSamani,MulticoinCapital联合创始人;翻译:金色财经xiaozou继比特币之后的第一波加密创新浪潮中,很多开发人员分叉了比特币代码库.

1900/1/1 0:00:00
DEF:什么是Rug Pull?我们又该如何甄别避免?

随着加密货币投资的兴起,也随之兴起。加密世界中最常见的局之一是rugpull。本文将从什么是RugPull,它的不同类型,以及如何识别和避免这些欺诈行为等方面展开介绍.

1900/1/1 0:00:00
PAC:比特小鹿登陆纳斯达克 上市首日缘何走跌

4?月?14?日,在行情回暖、香港大会的热切氛围中。加密矿企比特小鹿上市的消息传遍加密世界。“我们与?BlueSafari?的业务合并的完成是比特小鹿新时代的开始.

1900/1/1 0:00:00
BAS:Bankless:一覽五大新興L2項目 如何進行早期交互?

原文作者:Bankless原文编译:MaryLiu,比推BitpushNews一年前,以太坊第二层(L2)扩展解决方案赛道的「四大」领头羊是:Arbitrum、Optimism、zkSync和S.

1900/1/1 0:00:00
POL:回顾NFT市场Q1表现:NFT生态向Polygon聚拢 蓝筹项目市值和均价双下跌

进入?2023?年第一季度以来,NFT?规模出现可喜回升,链上交易活动逐渐活跃,市场开始密集上新,新老玩家竞争加剧.

1900/1/1 0:00:00
ETH:以太坊EIP-4844的第五个开发测试网将于下周启动

4月22日消息,Galaxy研究副总裁ChristineKim发文总结第107次以太坊核心开发者共识会议,本次会议在对上海升级的成功进行简短确认后,便开始讨论Deneb的准备工作.

1900/1/1 0:00:00