Open AI推出研究成果:DALL·E&CLIP
Open AI2020年推出两大研究成果:DALL·E&CLIP。DALL·E: 从文本创建图像。DALL·E是GPT-3 的120亿参数版本,经过训练可以使用文本-图像对的数据集从文本描述生成图像。 CLIP:连接文本和图像。研究所提出的神经网络在各种各样的图像上进行训练,并具有多种自然语言监控功能。通过设计,可用自然语言指示网络执行各种分类基准,而无需直接优化基准性能,类似于GPT-2和GPT-3的“零 射”功能。这是一个关键的变化:通过不直接针对基准进行优化,系统将这种“鲁棒性差距”缩小了75%,同时使ImageNet零镜头上原始ResNet50的性能达到了零,而没有使用任何原始的1.28M标记的示例。(来源:Open AI官网)