🐭 Mickey-1928SD模型基于Stable-Diffusion-xl微调,使用1928年公共领域画面训练。
但仅仅七年后,很多事情都发生了变化。
🔍 研究人员提出了一种简单而新颖的方法,只使用合成数据就能获得高质量的文本嵌入
Midjourney更倾向于使用光影效果增加图片的真实感,这也是让人印象深刻的地方。在艺术性和还原性方面,Midjourney明显取得了胜利。AI生成的图像真实性甚至局限性都成为了吸引网友参与讨论、分享和二次创作的流量密码。
它不仅可以从图片中提取信息并回答问题,还可以将图片转化为JSON格式。LLaVA还可以识别验证码、识别图中的物体品种等,展现出了强大的多模态能力。在性能上接近GPT-4的情况下,LLaVA具有更高的成本效益,训练只需要8个A100即可在1天内完成。